圖片來源 @視覺中國
作者|吳明燦,編輯|桑明強
最近的科技圈狂歡,屬于 ChatGPT。
自從 OpenAI 公司公開了 ChatGPT 的公測平台後,ChatGPT 就迅速霸占了國内各平台的科技榜單,短短一周,用戶量已經突破了 1 百萬人。但事實上,它不是一個新概念,确切的說,他算是介于 GPT-3 和 GPT-4 中間的一個彩蛋,而且,GPT-3 已經是現象級的 AI 産品了。
在 ChatGPT 之前,OpenAI 推出了 GPT-3,同樣是對人類語言的理解,GPT-3 對比 ChatGPT 來說就顯得冰冷。後來,在 GPT-3 的基礎上,ChatGPT 引入了人類偏好學習機制,讓他的回答更貼近人類,不僅如此,ChatGPT 學會了糾正提問中的錯誤,并對一些敏感的問題做出回避。
在一些業内人士看來,ChatGPT 的出現對傳統的搜索引擎是一個沖擊。無論是谷歌還是百度,用的都是一套 " 推薦制 " 的搜索方式,而 ChatGPT 跳過了網頁浏覽和整合這個步驟,直接給你一個答案,而這樣的搜索結果顯然更加效率,能大量節省用戶浏覽和比對的時間。
更有人預言,ChatGPT 會颠覆現在已有的産業業态,就像當年互聯網對線下商業的沖擊一樣。那麼,事實真的如此嗎?這篇文章我們來好好聊一聊。
01 ChatGPT 帶來了什麼改變?
大約在 6 年前,一篇大名鼎鼎的論文《Attention Is All You Needed》正式發表,它第一次提出了注意力機制(Attention),并且在 Attention 的基礎上創造了一個全新的 NLP(自然語言處理)模型 Transformer。
Transformer 是 GPT 和 BERT 的前身。谷歌和 OpenAI 在自然語言處理技術上的優化,都是基于這個模型。
後來,從 2018 年開始,GPT 技術基本上是一年叠代一次,所使用的參數量從初代 GPT 的 1.17 億,增加到 GPT-3 的 1750 億。優化的背後,是 OpenAI 巨額的研發經費投入。據相關數據顯示,GPT-3 訓練一次的費用是 460 萬美元,總訓練成本達到了 1200 萬美元,不僅測試成本非常高,GPT 技術對算力的要求也是目前 AIGC 技術領域最高的。
各項技術算力需求圖源國盛證卷
與此同時,在大算力的驅動下,AIGC 生成的結果會更優質,更效率。從第一代的 GPT 技術到現在的 ChatGPT,如今的技術已經可以讓 AI 跟人進行自然的交流。因此,它也就具有了更多的應用場景,比如搜索引擎、電商客服等。
有趣的是,最近大家都在擔憂谷歌會不會被 ChatGPT 替代掉的問題。關于這個問題,我們先來看一個應用場景:我從旅遊景點推薦的方向,分别問了 ChatGPT 這樣幾個問題,它給出的答案如下:
ChatGPT 問答測試圖源新眸自制
以往我們需要查找一項攻略的時候,需要經曆四個步驟才能得到答案:輸入、檢索、整理、結果,而 ChatGPT 跳過了中間的兩個步驟,實現了從輸入到結果的新搜索方式。
總結起來,就是 ChatGPT 技術已經可以替代部分的搜索引擎功能,大幅提高了用戶的檢索效率。再回到 ChatGPT 的核心技術上,GPT 的全稱是生成式預訓練模型(Generative Pre-Training Transformer),ChatGPT 也就是在無監督無标記,這種更符合日常溝通的條件下,識别人的語言并進行對話。
某種程度上,NLP 技術的優劣,決定了 AI 對人類意圖的理解能力,如果 AI 能理解人類的意圖,就能生産更符合人類需求、更優質的産品。
作為 AIGC 賽道上重要的一個階段,NLP 技術的升級是整個 AIGC 技術更新的第一步。
ChatGPT 在原來 GPT 的模型基礎上加入了人類反饋學習的機制,也就意味着,新的 GPT 技術将更好的理解人類的自然語言。
用建築設計領域舉個例子,AIGC 技術如果能完美的理解設計師的意圖,就能免去很多繁瑣和重複的工作,在提高效率的同時,也能釋放勞動力的潛力,創作者可以逃離重複的工作,利用多餘的時間進行自我提升。
從 GPT-1 到如今的 ChatGPT,在 NLP 技術上的優化和叠代,讓 AIGC 技術有能力開拓更多的應用場景。如果将優化後的 AIGC 技術落實在企業應用端,也會進一步提高企業效率,釋放更多的人力成本。
AIGC 應用場景圖源紅杉資本
02 焦慮是留給其餘 AI 企業的
在技術圈和投資者們都為 AIGC 技術狂歡的同時,感到焦慮的是大部分 AI 企業。對于 AI 賽道上的其他企業來說,OpenAI 和它們之間已經形成了很大的差距。
在 ChatGPT 發布之前,不是沒有人挑戰 OpenAI 的技術。
自從 OpenAI 發布了 GPT-3 并創開創了 AIGC 大算力的發展前景的時候,不少工程師開始研究對 NLP 過程進行瘦身,在保證運行效果不變的情況下,通過降低算力和參數量的需求,開發 Transformer 模型在應用端的潛力,目的在于希望小企業也能有能力運用 NLP 的新技術,但其實這是比較難實現的,尤其是參數量的需求對于 AIGC 技術來說是剛需,越多的參數量,所産出的 AIGC 作品也就更優質。
就像一位分析師在李 rumor 公衆号中所提出的問題:" 如果商用智能作為公司助手,你是會選擇高價但是能精準提高效率的,還是低價但是準确率隻有 70%-80% 的産品呢?" 從長期投資的角度來看,企業是會傾向更精準的機器的。
最典型的例子是,在 GPT-3 發布之後不久,Meta AI 推出了 OPT 技術。
OPT 和 GPT-3 的運行效果幾乎沒有什麼區别,參數量也是很巧合的 1750 億。不僅如此,Meta AI 還将 OPT 技術做了開源,提供給所有需要的企業和個人作為研發的基礎技術。
那麼問題來了,推特上的一位數字科技的風險投資人 Andrew Steinwold 這樣評論 GPT-4 技術,他說:"GPT-3 需要 1750 億參數,GPT-4 明顯會擁有 100 萬億的參數量,你們想用 GPT-4 做出什麼樣的東西來呀?"
也許 GPT-3 對參數和算力的要求還能被一些比較大的企業滿足,如果換做是參數量翻了幾百倍的 GPT-4,能跑得動巨額參數的企業也隻能是鳳毛麟角了。
AIGC 未來對算力和規模的要求,對于進入賽道尚且年輕的企業來說更是不可能超越的。某種意義上,OpenAI 憑借着大規模和大算力,在同行和自己之間構建了足夠厚的技術壁壘,而這份研發投入,是非常難超越的。在全球市場排在頭部的企業也就幾家,能做到微軟這個量級的企業就更少了。
這也是 OpenAI 開發 GPT 技術讓人感到害怕的地方。
對于 AIGC 這個賽道來說,算力、算法、數據都是促使它優化的主要因素,而 GPT 技術的叠代升級,将大數據的重要性放到了一個空前的位置。在大算力、大投資、大規模的要求下,後來的 AIGC 企業想要做出更好的技術,隻會變得更難。
也有人會問,為什麼國内做不出 ChatGPT 這樣的産品?是創新力不夠嗎?其實,創新力是一個因素,但不是全部。
03 我們距離 ChatGPT 還有多遠?
我們從融資、科研投入、技術三個方面分别聊聊國内的情況。
國内企業有很多從事 AIGC 研究的企業,例如盜夢師、TIAMAT 等,但是國内的投資人對 AIGC 的狂熱度遠不及海外。在海外獨角獸公司 Jasper 和 Stability AI 在今年 10 月相繼獲得了 1.25 億美元和 1.01 億美元的融資後,國内的 AIGC 企業目前隻有 TIAMAT 完成了百萬美元的天使輪的融資。
先不看投資人的金錢實力,單憑投資邏輯,對于國内投資市場來說,投資人更關心 AIGC 的商業化落地問題。百度集團副總裁吳甜就曾針對 AI 的深度學習說過這樣的話:" 深度學習技術已經開始向多個行業進行大規模地滲透推廣,但目前 AI 大生産仍處于起步階段。"這也意味着,其實企業内部也對 AIGC 的商業化程度不夠自信。
再比如 PICO 這樣的元宇宙系列産品,最近也面臨着銷售瓶頸,這樣的情況時國内很多高科技企業都會面臨的問題,技術是好的,但落實在産品銷售上就賣的不好,從某種程度上也會抵消企業内部對一個新産品的信心。
由于國内的 AI 企業在核心技術門檻上并不具備先天的優勢,如果想實現淨利潤的提升,最終總會走向技術商業化。筆者此前針對科大訊飛的商業模式做過一些了解,對于科大訊飛來說,語音技術門檻被突破,單純做技術不能賺錢的話,它會先選擇賣産品掙錢,先将技術在産品端落地了,有一份收入來源,剩下的就邊走邊看。
在這樣的邏輯下,國内 AI 企業就會更關注一項技術能不能實現快速實現商業化,是否可以在産品端落實之後帶來收益。
但是 OpenAI 的思路明顯和國内的大部分企業都不一樣,OpenAI 之前獲得了微軟的 20 億投資,進行 GPT 的開發。GPT-4 技術需要的大算力和大規模,顯然在近幾年是不能回本的。光是 GPT-3 在測試階段就花出去了千萬美金,作為算力要求翻了幾百倍的 GPT-4 技術,在開銷方面也隻會成百倍的增加。
總結起來,這也是國内外科研邏輯的不同。相比國外,國内更追求商業産品的落地,投資人在對一些概念性的産品進行投資時也更加謹慎。然而,在大算力的新競争生态下,融資投入的增加對于 AIGC 企業來說非常重要。
其次,是研發人員待遇的問題,根據市場調研數據,國内的企業研發人員相比于美國的企業,收入更依賴工齡和學曆。
中美兩國研發人員收入對比圖源 OECD
最後從國内 AIGC 相關的技術發展方面,根據 Gartner 數據統計,國内的數字化技術還集中在發展階段。而美國的大部分技術都已經可以平穩發展。還有一個現象就是,在國内很多技術就算發展了 5-10 年也還是分布在創新孵化階段,然而美國的很多技術在發展了 1-2 年後就能進入成熟階段。從這個個統計結果來看,美國的企業相比于國内,研發效率明顯更高。
綜上來看,國内企業想要發展 AIGC 技術,首先要解決的就是資金問題。按照國内高科技投資的邏輯,AIGC 技術在獲得大量融資前,應該先讓投資者看到它的應用前景。但是現在的 AIGC 賽道,雖然應用場景很多,但是商業前景還不夠明朗。
04 談談 AIGC 這門生意
實際上,盡管 AIGC 的技術一直在叠代升級,AIGC 的商業化推進其實是困難的。首先,AIGC 對于算力的要求越來越大,不是一般企業可以負擔的起的,也隻有一些大的 B 端企業可以負擔 AIGC 的大規模和大運算需求,這樣一來将來能使用 AIGC 技術做應用的公司并不多。
其次,AIGC 的應用路線還很模糊,就拿搜索引擎這一應用場景來說,ChatGPT 還不足以取代傳統的搜索引擎。
網絡上關于 ChatGPT 擊敗傳統搜索引擎的論調很多,我們回到前文提到的旅遊推薦的應用場景去說,當我提問 ChatGPT 能不能給我一些旅遊建議的時候,它直接給出了答案,搜索效率是提上去了,但是這個答案一定就是我需要的嗎?未必。
比如,我問它聖誕節倫敦有哪些值得去的地方。它給我列出了 5 個城市,現實的情況是,英國的聖誕活動各地都有,它直接給我列出的 5 個城市,一定程度上也減少了我的選擇。
ChatGPT 現在的問題在于,他給出的答案往往是大衆性質的、普适化的,而非個性化的。
在用戶剛開始做檢索的時候,大部分情況下對自己的需求是沒有很明确的認知的。而在使用傳統浏覽器的時候,往往是在檢索過程中才能進一步縮小自己的需求範圍,而 ChatGPT 是直接将用戶能看到的答案範圍進行了縮減,它給出的答案是正确的,但不一定就是最合适用戶的。
就現在的情況看,AIGC 的應用前景并不明朗,盡管 AIGC 可以運用在多種場景中,但好的技術,不一定能在商業上迅速落地。
盡管 OpenAI 用錢燒出了 GPT 技術的叠代,但是這一做法也有它的市場局限性,在大算力的要求下,沒有多少企業可以承擔得起 GPT-3 的運作,就算是面向大衆測試的 ChatGPT,它的參數量要求也很大,将來如果運用在 B 端市場,對于多數的企業來說是個不小的負擔。ChatGPT 的出現也隻是 AIGC 的一次技術叠代升級罷了,它的應用前景還不明朗,現在就談到勞動力替代和技術壟斷,還太早了。