圖片來源 @視覺中國
文 | 零态 LT
Chat GPT 引發的大模型混戰,像極了 20 年前的互聯網。
近兩個月中,已經有包括百度、阿裏巴巴、字節跳動等超過五個,宣布要進軍大模型的國内知名互聯網公司。除此之外,遊戲公司、雲計算公司、軟件公司…隻要發布一個跟 AI、中國版 Chat GPT 相關的動作,就能引發熱議,帶動一輪資本市場的膨脹,引發追随者的狂歡。
ChatGPT 到底會像元宇宙概念一樣,成爲稍縱即逝的流星,還是會打破互聯網舊秩序,構建新秩序,引發一場新的生産關系和生産力的改變?
現階段無人能下定義,零态 LT 試圖通過梳理出基礎脈絡和走向。
諸神混戰三大格局林立
先來看看大模型混戰現狀,目前進軍玩家可以分爲三類:一類是互聯網大廠,一類是科技小巨人,一類是個人創業組隊。
互聯網巨頭有:百度文心一言,阿裏巴巴通義千問,商湯日日新 SenseNova 體系,華爲雲盤古,知乎 " 知海圖 AI",360GPT,昆侖萬維 " 天工 " 大模型,京東言犀等。小米 CEO 雷軍 4 月 14 日發微博表示,小米全力以赴、堅決擁抱大模型和生成式人工智能(AIGC),并将推出相關技術和産品。
在巨頭們的帶領下,一些科技領域的小巨頭企業,也紛紛下場。
由于沒有巨頭們的數據體量和資金規模,它們普遍的方向是選擇接入某一大模型,并在此基礎上開發出更具适配性的應用。比如,京東雲旗下言犀人工智能應用平台将推出 ChatJD;釘釘宣布正式接入阿裏巴巴 " 通義千問 " 大模型;字節跳動旗下火山引擎發布自研 DPU(數據處理單元)芯片,以及發布大模型訓練雲平台等;金山辦公宣布将推出 WPS AI,類似于基于 ChatGPT 技術的微軟 Copilot 産品,金山辦公 CEO 章慶元透露這一技術由國内企業 MiniMax 提供;APUS 推出 1000 億參數、自研多模态的天燕大模型 AiLMe,以及基于其技術的 7 款 産品;斑馬智行宣布接入 " 通義千問 " 大模型,智己汽車成爲首個上車品牌 ...
還有一些如王慧文、李開複、王小川等互聯網創業賽道的 " 老手 ",利用個人影響力和 IP,宣布創業組隊搞生成式大模型。
3 月 19 日,創新工場董事長兼 CEO 李開複宣布,成立 Project AI 2.0 公司,定位是 AI 2.0 全新平台和 AI-first 生産力應用的世界級公司。
王慧文則在社交平台上發布的一則 " 組隊擁抱新時代,打造中國 Open AI" 的求賢令也曾經刷屏。他稱自己出資 5 千萬美元做公司(光年之外)。其老搭檔美團 CEO 王興随後在朋友圈宣布,個人将參與王慧文創業公司 " 光年之外 " 的 A 輪投資,并出任董事。
前 Google 科學家李志飛在 2 月底的一次媒體訪談中表示,短期目标是在明年 6 月做出一個 60 分的通用大模型。
前搜狗 CEO 王小川也表示,将進入中國版 OpenAI 的戰場,并向媒體承認項目在 " 籌備中 "。
前京東 AI 掌門人周伯文也宣布,表示不設上限誠招合夥人,一起打造中國版的 ChatGPT。垂直整合從自有基礎大模型到應用、用戶全場景閉環,實現生成式人工智能技術與商業價值 " 雙落地 "。
但在這種争分奪秒的官宣中,很多人打趣說國内 GPT 創業公司 PPT 的更新速度都趕不上 ChatGPT 的版本叠代速度。
此外,一些長期深耕科技領域的專家,也趁 AI 的東風收割,生怕被時代落下。比如計算機科學家、自然語言模型專家吳軍在 4 月 3 号公開喊話 "Chat GPT 不算新技術革命,帶不來什麽新機會 ",但是卻已經在《得到》上推出了主講 Chat GPT 的課程,預售時間定在了 4 月 26 日,價格爲 69.9 元。
除了激烈的競争,不同格局之下的 " 隔空互怼 " 也沒有缺席。王小川放話說,李彥宏是活在平行宇宙的人。李彥宏雖然沒回應,但百度可不能被欺負,其高管回應:王小川脫離一線業務太久,順便也諷刺了一把搜狗沒幹過百度的陳年舊事。
這種狀态,不僅讓人有些激動,國内互聯網大廠已經很久沒有過這樣的盛況了。
伴随着 Chat GPT 的爆火,芯片、人工智能、甚至隻要發布一個和 Chat GPT 相似概念的公司股價都得到了正反饋。
除了百度、阿裏,得益于 Chat GPT 概念爆火,一衆入局的上市公司,都在股市上嘗到了甜頭,360 宣布 GPT 大模型—— "360 智腦 " 落地搜索場景,發布大模型次日股價高開 5.53%,随後 4 月 3 日再次漲停。
招銀國際發表研報指,因近 3 個月 ChatGPT 對相關概念股股價的拉動,芯片、光模塊、PCB、服務器年初至今已各漲 65%、146%、45%、62%。
巨頭混戰大模型,能不能開啓下一輪技術革命的熱潮?誰究竟能脫穎而出?
别低估了大模型的門檻
今年 2 月份 Chat GPT-4 問世後,市場再次感知到了大模型的威力,相比于去年末發布的 Chat GPT-3.5,新一代 GPT 算力和邏輯能力更強,商業價值也随之凸顯。業内專家普遍認爲,這将是開啓下一個時代的技術競争高地,如同千禧年的互聯網一般。
但要真正做好大模型并不簡單。
首先,Chat GPT 門檻很高。國盛證券計算機分析師劉高暢和楊然在《Chat GPT 需要多少算力》報告中估算,GPT-3 訓練一次的成本約爲 140 萬美元,對于一些更大的 LLM 模型,訓練成本介于 200 萬美元至 1200 萬美元之間。
除了對大量數據需求外,訓練大模型還需要芯片、服務器、算力甚至電費等方方面面的支持。
有機構估算,假如平均每天約有 1300 萬用戶訪問 Chat GPT,那就需要 3 萬多片英偉達 A100GPU 芯片,初期投入成本約爲 8 億美元,每日還需約 5 萬美元的電費。
從這個角度來說,如此大的投入,最有勝算的一定是互聯網大廠。它們資金雄厚,能夠經受得住持久戰的消耗。相比大廠,諸如 WPS、圖靈這類的公司則選擇了更爲靈活的模式,接入現有大模型,在此基礎上研發更落地的應用。
比如金山辦公發布的生成式人工智能應用 "WPS AI", 由國内合作夥伴 MiniMax 提供的;阿裏集團旗下的斑馬智行也是接入 " 通義千問 " 大模型;百度内部溝通産品 " 如流 " 自然也是接入 " 文心一言 " 大模型。
至于個人創業團隊,除非有源源不斷的資金湧入,否則很難成型。雖然美團聯合創始人王慧文宣稱,"5000 萬美元,帶資入組 ",很多人驚呼覺得好大一筆錢,但專家卻表示,5000 萬美元可能也燒不了多久!
其次,就算有錢,真正實施起來,要訓練出經受的住市場考驗的大模型也并非一蹴而就。
在衆多行業人士和觀察人士看來,當前國内算力稀缺、數據模型訓練不足,甚至版權糾紛等問題難以忽視。比如文心一言發布之後,由于 AI 畫畫頻繁出錯," 胸有成竹 "" 夫妻肺片 "" 魚香肉絲 " 等貌合神離的圖片的出現,讓用戶既覺得有趣,又覺得槽點滿滿,成爲 " 被玩壞 " 的一個梗,連李彥宏都出面自嘲說 " 文心一言是典型的需要靠反饋才能不斷提升的産品 "。
同樣在現場演示中翻車的還有阿裏,釘釘的 AI 功能由 " 通義千問 " 大模型支撐,但是在文生圖演示中,出現了和文心一言類似問題,比如輸入 " 赴湯蹈火 " 表情,卻出現了一鍋湯上面有着火的類似湯圓造型的動漫人物。
也有業内人士表示," 現在的大語言模型還是存在胡說八道輸出錯誤信息的問題,ChatGPT 珠玉在前,留給大廠們的時間似乎并不算多。"
從整體情況來說,這些大模型确實推出比較匆忙,但這不是本質問題,因爲大模型需要長時間訓練和積累,以及中文語料數據集的收集和理解。所以從這個方面來說,大廠還是具備很多優勢,足夠大的數據和訓練試錯容錯機會是很多創業公司不具備的。
再次,随着大模型的應用和 AI 的普及,本質上解構的是生産關系。過去是人生産内容,現在變成了人訓練機器,機器生産内容。随着 AIGC (AI Generated Content)的興起,利用 AI 生成内容,被認爲是繼 PGC、UGC 之後的新型内容創作方式。無論是什麽規模的公司,如果不進行變革性的重組,都将很難适應這個新時代。
從這個角度來說,要進行内部人和生産關系的調整,可能對大廠的挑戰更大,船大難掉頭,但對于中小規模的科技公司和創業公司來說,則可以在初期就解決掉這些問題。可以用更輕盈的姿态迎接新技術革命。
大模型混戰能否開啓下個 " 互聯網 20 年 "
綜合目前的情況來看,AI 技術被普遍認爲是帶來新一輪工業革命的基礎。就像 20 年前,互聯網大爆發的時代一樣,參與者們希望抓住這次的技術革新,占據時代的紅利。
爲什麽說,Chat GPT 引發的大模型混戰,和 20 年前互聯網時代相似?本質上來說,Open AI 的出現,就和 1998 年的互聯網開端一樣,被很多人認爲是一個革命性的開端。
從客觀上看,因爲他們都具備相似的時代背景,20 年前的互聯網,得益于通信、數據傳輸網絡的迅猛發展,10 年前,随着智能手機的普及,上網費用的進一步降低,進入移動互聯網黃金十年。而當前階段,得益于雲計算的普及,通信網絡、基站等基礎設施的完善,國内的 AI 技術也已經孕育了多年,所以趁着 Chat GPT 的熱度,大模型的爆火也順應了時代的節奏。
從主觀上看,近兩年,随着互聯網發展進入瓶頸期,産業陷入低迷狀态,所以無論是市場的呼喚還是用戶的情緒,都期待一種具備革新能力的事物出現。
但如今情況和 20 年前互聯網時代又有所不同。
20 年前的互聯網時代經曆了門戶時代,電子商務時代,移動互聯網時代,網絡遊戲等不同的細分時代,每個階段都有領軍企業推動産業進步。此外,在互聯網時代快速發展的過程中,無論是做門戶,電子商務,服務還是遊戲,邏輯都是立足于基礎設施的建設、技術保障、和應用場景進行 APP 開發。
而大模型的狀态是,依然處于探索期,無論是安全性還是應用場景上,都在迷茫階段。連 OpenAI 公司 CEO 山姆 · 阿爾特曼(Sam Altman)都說:" 我們完成對 GPT-4 的訓練後,花了 6 個多月的時間,研究大模型的安全性… " 他還表示," 現在并未訓練 GPT-5,在短期内也不會訓練。"
所有人都必須要承認的是,由于 Open AI 這個技術太新,應用場景還不明确,目前僅僅停留在 AI 生成内容,聊天,此外美國也沒有成功的經驗可以供我們完全複制,所以在這個賽道上,似乎所有人都站到了差不多的起點上,都在摸着石頭過河。
正如 APUS 創始人李濤所言,當下的大模型玩家,很多技術路線都不明确,行業依然處于早期狀态,甚至可以稱爲 "AI 的公元前 ",這種情況之下,對于很多創新公司而言,反而是最大的機會。" 新的場景和新的物種,每一次新技術浪潮到來時,一定會出現新的企業,新物種淘汰掉舊物種,這幾乎不可能是一種傳承和繼承的過程。"
但誰能真正拿到通往下個二十年的船票?目前沒有人能給出定論。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App