圖源:《我,機器人》電影截圖ChatGPT 隻是另一場 AI 噱頭嗎?
明面上,ChatGPT 的熱度在最近降了下來,這實在是符合許多唱衰 AI 産業的人一貫的論調——就像擊敗國際象棋冠軍的深藍、國際圍棋冠軍的 AlphaGo 一樣,爆紅的 AI 工具總是最終歸于平靜。
因為這些炫酷的工具往往有一個無法回避的問題:商業化的前景在哪裡?
從使用場景上說,除了專業棋手,沒有人會需要每天和機器人對弈,而 ChatGPT 作為一個吸收了無數語言材料,光是模型參數就有一千七百多億的大模型,目前最适用場景似乎隻有完成學術論文中内容梗概撰寫和統一注釋格式,以及幫助論文作者規避查重風險。說實話,ChatGPT 在這方面完成的不錯,幾乎成了留學生中的不傳之秘,以至于有華裔學生專門寫了一個名為 GPTZero 的 app 負責辨認作業中 ChatGPT 生成的内容。
但也僅此而已。從成本角度說,動辄數千萬美元的開發和部署成本讓外界有了堅定看衰它的理由,這個所謂智能聊天工具實在太過昂貴,更何況它最讓人驚豔的那部分:對人類語言和對話邏輯的理解,對回答内容的 " 生成式 " 創作,都随着越來越多的 " 翻車 " 實例而迅速 " 祛魅 "。那些認為它将取代搜索引擎、颠覆智能語音助手的樂觀論調正在消失。
ChatGPT 在大衆視角中似乎即将走上過往那些 AI 工具的老路,流星一樣炫目,然後歸于沉寂。
圖源:《黑客帝國》電影截圖
但,真的僅此而已嗎?
第一個造出飛機的人
Sheng 談到 ChatGPT 時充滿了一種興奮和緊張混合的口吻,他是在清華從事預訓練大模型研究的博士生。
" 就在兩年前,要不要走預訓練大模型的方向,整個學界還在讨論中。"Sheng 說到,而原因正是上面提到的,大模型一次的訓練成本實在太過高昂,能得到什麼結果也是未定之數,很少有人願意冒險。國内相關方向的玩家一度傾向使用大小模型協同配合的方法提高 AI 工具效果,因為傳統觀點認為,在規模相對較小的模型上進行訓練,效果并不一定比大模型差。而不止一位 AI 方向的從業者也表示,過去業内對人工标記數據的重視也遠遠不夠,大家沒料到 ChatGPT 采用的基于人類反饋的強化學習效果會如此之好。
直到 OpenAI 推出了 ChatGPT。
"有多少人工,就有多少智能。" 這是人工智能領域經常被拿來調侃的一句話,用來形容 ChatGPT 再合适不過。作為預訓練大模型,它很好的體現了 " 大 " 這個字。一方面,相比 GPT1,GPT3 的參數規模提升了将近 1500 倍。另一方面,由于運用了所謂的 " 自監督學習(self-supervised learning)" 機制,模型可以使用互聯網上海量的文本數據進行訓練。
這種級别的大模型是前所未見的。
" 最近的研究告訴我們,當模型達到一定規模後,會有 emergent ability(突現能力)的東西出現。"Sheng 說到。
某種程度上講,ChatGPT 的開發者 OpenAI 也是在賭博,沒有人知道這條路究竟能不能走通,而正是它們持之以恒不惜血本的投入,最終證明了預訓練大模型擁有一般模型所不具備的認知理解能力和泛化能力。換而言之,預訓練大模型和人們理想中的 AI" 通用模型 " 非常相似。
不像是 AlphaGo 專門針對圍棋度身定做,ChatGPT 不是針對一個特定的狹窄領域問題開發出來的 AI 工具,相反,它可能更像某種尚顯稚嫩的通用 AI 計算模型,有回答開放問題的能力,顯示出可被靈活部署應用在各種領域的潛力。
這正是 ChatGPT 重要的原因,它向人們展示了預訓練大模型的強大威力。這意味着第三次AI浪潮在經過十多年的發展後,走到一個關鍵節點。
"ChatGPT / GPT-3.5 是一種劃時代的産物,它與之前常見的語言模型幾乎是導彈與弓箭的區别,一定要引起最高程度的重視。" 一篇試圖幫助開源社區複現 GPT3.5 技術路線圖的文章在開篇就嚴肅指出了這一點。(https://zhuanlan.zhihu.com/p/593519656)
Sheng 則把 ChatGPT 的誕生比作萊特兄弟發明飛機:"大家都知道飛機理論上是可以做出來的,但從來沒人真的見過飛機。ChatGPT 就像是有人突然把飛機擺到你面前,雖然它可能隻能飛 100 公尺,很容易有故障,但它出現了。"
圖源:《黑客帝國》電影截圖Bigger than bigger,大模型的潛力還有多少?
同 ChatGPT 揭示的 AI 發展浪潮中的關鍵節點的意義相比,ChatGPT 本身的缺陷和孱弱的商業化前景都顯得渺小了不少。更何況,對許多從業者來說,ChatGPT 暴露出來的缺點并非不可解決。
其中一個為許多人指摘的是所謂數據庫時限問題。ChatGPT 訓練是基于一個固定的數據庫,截止日期是 2021 年 9 月,也就是說 ChatGPT 無法掌握從那以後世界上發生的任何事的信息,從 iPhone 14 的發布到美國期中選舉,甚至今天的天氣狀況都不行,在這個方面,ChatGPT 的表現甚至趕不上時下任何一款智能語音助手。
但從技術層面這個問題并不難解決。實際上,根據外媒爆料,和 Open AI 達成戰略合作關系的微軟即将在 3 月推出具有 AI 對話能力的新版必應 Bing,它的原理正是将搜索引擎同 ChatGPT 的能力相結合,甚至,微軟還打算在 Office 套件中引入相應的能力。
最為引人關注的成本問題,在算法層面同樣有許多優化叠代的思路。比如,既然 ChatGPT 在回答問題過程中通過專門的針對訓練很好展示了機器模拟人行為的能力,那麼在算法層面,讓 ChatGPT 通過模仿人查閱資訊的方式,在涉及純粹知識和信息的問題時不再調用本身數據庫而是直接從網絡抓取内容将是非常值得探索的方向。如此一來,大模型可以在不降低自身表現的情況下縮小規模,訓練成本也将随之降低。
至于商業化落地場景,除了已經比較确定的文本生成、智能助手領域外,實事求是的說,還有大片的荒蕪地帶亟待開發,但不少從業者都表示了樂觀。
"難的是從 0 到 1 的原始創新,至于後面的都不是問題。" 一位供職于大廠的 AI 研究從業者說道," 尤其在中國,市場這麼大,大家又這麼卷,既然大模型的路子被證明是可行的,那麼很快所有的聰明人都會加入進來。"Sheng 同樣預計,短則一兩年,就會出現基于預訓練大模型的商業化産品。
圖源:《X 戰警 - 天啟》電影截圖必須攀登的山峰
事實上,今年在投資領域,AI 是少有的異軍突起的熱門賽道。然而成本像一道緊箍咒,束縛着每個自身不具有預訓練大模型開發能力的玩家。
ChatGPT 這樣級别的預訓練大模型跑一次的成本是千萬美元級别,而将其商業化部署,落地到類似聊天機器人這樣多用戶高并發任務中,成本隻會更高。小冰 CEO 李笛給出的一個估計數字是 3 億每天。這也就意味着,國内夠資格玩這場燒錢遊戲的隻能是極個别組織,大部分的初創企業,乃至許多高校,都會被這樣的高昂成本 " 勸退 "。
Sun 是來自一家國内一線投資機構的投資經理,在看過無數 AI 相關項目的 PPT 後,他今年一次都沒有出手:" 商業化項目是很現實的,你是不是掌握了核心技術?你的競争壁壘又有多高?"
很少有中國企業能夠回應這樣的诘問。
在這種情況下,想要讓産品具有 AI 能力,隻能調用公開的大模型接口(比如 GPT3.0),等于讓自己的核心能力掌握在别人手中。
一個非常殘酷的例子是 Jasper.AI。文本生成領域估值一度高達 15 億的 Jasper.AI 同樣在底層調用 GPT3.0 模型,在 ChatGPT 幾乎是沒有預警的橫空出世後,Jasper 的業務立刻受到沖擊(這個故事被 the information 寫成了一篇報道 ),因為 Jasper 的收費計劃最便宜的也高達 29 美元,且隻能生成 20000 個單詞,相比之下,ChatGPT 的使用成本簡直可以忽略不計,而交互和效果甚至更好。
更何況,OpenAI 本身也面臨着經營壓力。從 OpenAI 内部傳出的消息說,預訓練大模型的成本之高,OpenAI 同樣也叫苦連天,從 GPT3.0 後 OpenAI 的模型不再開源,而是力推其訂閱付費服務(Jasper 即是向 OpenAI 繳納一定的費用從而獲得 GPT 調用接口)。
開發屬于自己的大模型,顯然是每個在 AI 領域有野心的企業所應該做的事。
國外們的巨頭行動很快,除了 OpenAI,提出 transformer 模型的 Google 同樣擁有專門針對對話應用的大語言模型 LaMDA 和多模态任務模型 MUM,這兩個模型被認為與 ChatGPT 擁有相同的能力。而在矽谷,像 Perplexity、YouChat 這樣的創業公司也正在大預言模型的基礎上開發新的聊天機器人。OpenAI 也預示了 GPT4.0 的存在,從版本号上就能看出,屆時這個業界領先的大語言模型将有進一步的能力提升。
圖源:《X 戰警 - 天啟》電影截圖
因此對中國來說,時不我待,預訓練大模型是一塊必須啃下來的硬骨頭,中國絕不能錯過這場 AI" 軍備競賽 "。不僅因為一味模仿或者尋求開源模型接口支持,等于讓别人始終掌握掐脖子的科技主動權,同時也将在未來的 AI 産業競争中處于不利地位。
Sun 舉了個或許不太貼切的例子:質能方程在 1905 年就由愛因斯坦提出,原子彈在 40 年後的 1945 年由美國人試爆成功,而新中國為了掌握這項技術,又花了近 20 年時間。
一日千裡的 AI 技術發展不會給中國這麼長的追趕時間。
好消息是,AI 技術并不像芯片制造一樣有着高不可攀的技術壁壘,盡管沒有公布 ChatGPT 的論文,但不止一位 AI 工程師表示,僅靠現在公開的知識,頂級 AI 工程團隊很大概率就能複現和 ChatGPT 差不多的模型,因為 " 技術本身都是現成的。"
壞消息則是,留給我們的時間已經不多。
如果說 ChatGPT 誕生來自巨量資金的投入、充分的技術和人才儲備,這些條件國内巨頭們尚能夠勉強滿足的話,那麼随着時間推移,如果不在目前這個非常重要的機會窗口期迎頭趕上,算法叠代所累積的經驗将給以 OpenAI 為代表的 AI 公司帶來結構性的技術壁壘與代差,這種代際差一旦形成,再想追趕将分外吃力。
雖然機器本質上仍然無法思考或創新,但預訓練大模型 " 湧現 " 出的 " 智能 " 以及它出色的泛化能力,将使得 AI 産業本身不再成為一個賽道,而是演變為類似石油、電網一樣的基礎生産力資源,徹底改變整個信息産業的格局。
經過十多年的發展,基于深度學習框架的 AI 浪潮已經找到了一個明确的發力方向,随之而來的将會是如同西部掘金大潮一般的熱烈景象,無數機會和突破将湧現出來,想要在這場烈火烹油的 AI 革命中跟上,我們必須擁有屬于自己的 ChatGPT。否則讓它跑太遠,再追就來不及了。
參考資料:
ChatGPT 進化的秘密 https://zhuanlan.zhihu.com/p/593519656
The Best Little Unicorn in Texas: Jasper Was Winning the AI Race — Then ChatGPT Blew Up the Whole Game https://www.theinformation.com/articles/the-best-little-unicorn-in-texas-jasper-was-winning-the-AI-race-then-ChatGPT-blew-up-the-whole-game