圖片來源 @視覺中國
文 | 白馬商評
" 都快成紅海了。" 當我和一個創業者聊起大模型的時候,他直接甩了這句話給我。
去年 11 月,OpenAI 發布基于 GPT-3.5 的 ChatGPT,瞬間引爆大模型的熱潮。半年多的時間,中國出現了 " 百模大戰 " 的局面,BAT 等頭部互聯網公司和人工智能公司基本都對外宣布了自己的大模型。
5 月初,360 掌門人周鴻祎對外稱," 如果不經過兩年的模仿和抄襲,上來就說自己能超越,那才叫吹牛呢。" 僅僅一個月後,周鴻祎就表示," 我原來說國内大模型跟國外差距兩年,我收回這句話,今天已經接近國際水平。"
有人感慨,半年就追上 ChatGPT 了,大模型似乎也不難。那麽,大模型的核心壁壘是什麽?中國大模型到底什麽水平?大模型在應用層面最先突圍的方向是什麽?
沈爲(化名)是某知名 985 高校教授,多年從事機器學習研究,還曾擔任過某頭部券商首席分析師,我們和他聊了聊,試圖揭開大模型的迷霧。
GPT 路徑跑通了,所以有了 " 百模大戰 "
白馬商評:能不能用最通俗簡單的語言解釋一下大模型,大模型是什麽?和以往的 AI 模型有什麽區别?
沈爲:所謂大模型就是指模型的參數量大,但學術界并沒有一個清晰明确的定義界定到底多大參數叫 " 大 ",還在快速研究發展階段,一般來講大模型的參數量達到 1 億以上。
其實深度學習的發展大緻經曆了三個階段。第一個階段是 2012-2017 年,以圖像分割 yolo、圖像分類 ResNet 這種特定領域的小模型爲代表,參數量占内存最多也就幾百 MB。
2017 年,Transformer 的問世讓深度學習可以并行化計算,效率更高,意味着可以做大模型的運算,随後産生了 OpenAI GPT 和谷歌 Bert 這類自然語言大模型。這一階段誕生的是特定任務的大模型,模型參數突破了 1 億。
到了 2020 年前後,深度學習進入通用模型階段,它的輸入就是一句帶空格的話,模型的作用就是 " 填空 ",以前是模型适配下遊應用,現在是下遊應用适配模型。這一階段的模型代表包括自然語言領域的 GPT 3.5、GPT 4 以及圖像領域的 Clip、DALLE、Stable Diffusion、Midjourney 等等。這一階段模型參數可以達到百億、千億級别。
白馬商評:你了解到最早研究大模型是哪家企業或機構?有哪些成果?
沈爲:最早是高校和科研機構做相關的研究,我了解比較早的是北京智源人工智能研究院的悟道、鵬程實驗室的腦海,現在産業界的研究也很同步了。學術界的研究有一些成果,但性能沒有 ChatGPT 那麽驚豔。
白馬商評:短短幾個月的時間,國内出現了 " 百模大戰 " 的局面,推出大模型的公司已經數不過來了,你怎麽看待這種現象?
沈爲:大模型肯定是趨勢,也一直有人在研究。之前很多公司可能會小範圍投入,做一些淺嘗辄止的研究;現在突然出現了 ChatGPT 這樣一個好産品,大家看到了明确的商業方向,于是都開始加大投入。
另一方面,很多公司面臨商業競争的壓力,不做大模型可能就掉隊了,所以必須上馬大模型項目。
白馬商評:周鴻祎最近說他收回 " 國内大模型跟國外差距兩年 " 這句話,他認爲今天已經接近國際水平。這才過去幾個月的時間,大模型好像也不難嘛。你覺得差距有多少?
沈爲:差距看跟誰對标吧,我目前沒有體驗過 360 智腦的産品,不太好評價。但是國内有些生成式 AI 産品,我體驗以後感覺跟 ChatGPT 還是有差距的,國内的大模型還需要努力。
重資本投入下,隻有頭部公司有機會?
白馬商評:研發大模型的核心壁壘是什麽?
沈爲:大模型的核心壁壘包括數據、算力、算法。
從算力上看,訓練 ChatGPT 這樣的生成式 AI 需要至少 1 萬張英偉達 A100 顯卡,單張顯卡的價格目前是六七萬,性能更優的 V100 單價 8 萬元人民币,也就是說光算力投入至少就要達到六七個億以上,隻有少數頭部公司和機構能承擔得起。對于商業機構而言,花幾個億買一堆顯卡,還不一定能産出成果,這是必須要思考的問題。
接下來是數據和算法,算法比較好理解,比如框架開發、算法優化。數據方面,中國不缺數據,甚至互聯網數據比美國還要多,但是選擇哪些數據去訓練、采用什麽樣的方式處理,這些都是核心的壁壘。
白馬商評:你平時會跟企業交流嗎?非營利性的研究機構和企業在研究上有什麽區别?
沈爲:我們會跟企業的研究部門有一些交流。跟企業交流我們會更加了解實際的業務需求,有時候我們做的學術研究會更關注技術前瞻性,對落地性要求不那麽高;但企業一般更強調落地性。
白馬商評:你有沒有研究過國内的大模型?最看好哪家?
沈爲:可能還是頭部公司能跑出來吧。一是重資本的投入,隻有頭部公司有實力;二是幾家頭部公司手裏的數據更豐富;三是在人工智能領域已經有了一段時間的技術積累。
白馬商評:你最看好的大模型應用是什麽?
沈爲:從技術角度看,最先應用的應該是自然語言處理和圖像領域,語音識别可能要晚一些。
大家看到比較多的用 ChatGPT 來寫文案,這類内容創作的應用越來越多,其他我覺得像智能客服這種應用應該也會比較快。現在的一些智能客服很多時候理解不了用戶的需求,解決不了實際問題,如果讓用戶區分不出到底是人還是機器人,體驗就會改善很多;包括遊戲中的 NPC,以前的對話是 " 寫死 " 的,現在漸漸可以互動了,玩家體驗也會更好。
白馬商評:你原來做過頭部券商的首席分析師,從投資角度看,你覺得大模型有哪些機會?
沈爲:資金炒作的邏輯是從應用到算法、模型,再到算力;産業的邏輯反而是相反的,算力是有明确的增長預期的,所以英偉達最近上漲很快、很多。投資者現在也明白了,誰家的大模型能跑出來、能變現還需要驗證,但是增加的資本投入大部分都投到了算力。經過反複炒作,普漲行情應該已經告一段落,後面需要邏輯驗證和業績兌現。
我原來主要看傳媒互聯網行業,比如前段時間比較強勢的遊戲闆塊,資本的邏輯一是應用大模型提升研發效率、降低成本;二是大模型帶來更好的體驗,NPC 角色更智能,最後用戶的粘性提升、UP 值提升。當然,最終可能還需要業績驗證。
人類無法左右 AI,甚至無法左右自己的命運?
白馬商評:我們看到包括奧特曼、馬斯克都對人工智能的安全性問題提出過擔憂,現在我們隻知道通過大模型訓練出現了智能化的結果,但訓練過程像一個黑箱,其實挺可怕的。你怎麽看待安全問題?
沈爲:在安全方面,首先我觀察到幾個反常的現象。第一個是今年 3 月包括馬斯克、蘋果公司聯合創始人史蒂夫 · 沃茲尼亞克在内的 1000 多人簽署了一份公開信,呼籲暫停訓練比 GPT-4 更強大的 AI 系統。
第二個是,今年 5 月谷歌首席科學家、已經 75 歲的 "AI 教父 " 傑弗裏 · 辛頓辭職,他離開谷歌的直接原因是擔憂人工智能的危險,甚至對自己一生從事的工作感到後悔。
第三個是近兩年學術領域訓練大模型新增了倫理讨論。
目前來看,我覺得大模型還是可控的,沒有大的問題;但是技術發展太快了,出圈以來短短幾個月的時間,GPT 就又經曆了幾次叠代,發展速度太快,越來越智能,會不會産生自主意識,不再聽人類的 " 使喚 ",走向失控?這個問題是大家擔心的。
白馬商評:你覺得 AI 會不會造成大量失業?在 AI 面前,普通人怎麽保住工作?
沈爲:從宏觀上看我不覺得 AI 會造成大量的失業,人類總會有工作的,隻是說人的工作内容會發生轉變。當然,從個體角度看肯定會出現結構性的失業,我們隻能不斷學習。
白馬商評:之前很多人說機器沒有感情、缺乏想象力,取代不了人類;現在既然人類大腦可以通過 AI 模拟出來,那人類的情欲、性欲是不是未來也可以模拟,荷爾蒙、多巴胺這些不過是一種生物學的獎勵機制嘛。
沈爲:機器沒有感情是當前的假設,人工智能越來越接近人的思考模式,那是不是就會産生類似于人類的 " 感情 "?隻是他們和人類生活在不同的空間維度,就像《流浪地球》裏圖恒宇的女兒。人工智能可能會産生自己世界類似于人類的生物學意義上獎勵機制。
白馬商評:如果一切都可以計算、規劃、設置,是不是有點無趣?
沈爲:AI 的行爲并不是人類預測和規劃的,而是他自我強化、自我訓練的結果,《流浪地球》裏 MOSS 的決策是自己做的,而不是服從人類給的指令。
白馬商評:矽基文明取代碳基文明是不是确定性的方向?
沈爲:這個問題超綱了。按照目前的發展趨勢可能是這樣的,就像《流浪地球》裏真正主宰人類命運的是 MOSS,而不是人類;但現實中也有可能技術會停滞在某個階段,跨不過去,畢竟技術發展不是線性的。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App