圖片來源 @視覺中國
文|光錐智能,作者|周文斌
"ChatGPT 的意義不亞于 PC 或互聯網的誕生 ",比爾蓋茨對這個新風口不吝贊譽。
裁員潮下一片慘淡的矽谷,因為 ChatGPT 再次燃起了希望之光。
微軟斥資 100 億美元投資 OpenAI,并計劃将 ChatGPT 融入旗下全線産品。2 月 4 日,微軟融合 ChatGPT-4 的 Bing 已經短暫上線,速度之快讓人咂舌。
圖:融入 ChatGPT 的 Bing
而為了應對微軟激進的布局,谷歌緊急地召回了佩奇和布林兩位創始人,并在上周也開始内測類似的産品 Apprentice Bard。同時,谷歌還向 OpenAI 的競争對手 Anthropic 投資近 4 億美元,以完成微軟和 OpenAI 類似的綁定。
中國科技公司也在紛紛跟進,一波類似于 2016 年 AlphaGo 的熱潮又一次掀起。
2 月 7 日,百度公布了自家類 ChatGPT 産品的名字 " 文心一言 ",并預計在 3 月推出相應的産品。
2 月 8 日,阿裡巴巴也透露,聊天機器人 ChatGPT 目前處于内測階段。
同日,網易有道 CEO 周楓也獨家向光錐智能确認,網易有道未來或将推出 ChatGPT 同源技術産品,應用場景圍繞在線教育。
2 月 9 日,騰訊也表态正有序推進 ChatGPT 和 AIGC 相關方向的專項研究。
一時間,不僅科技圈無人不談 ChatGPT,甚至有不少人也開始用其面向普通用戶賺錢。瑞銀預測,ChatGPT 的月活躍用戶在今年 1 月份達到了 1 億,它完成這個目标隻用了 2 個月,而在它之前,最快的 TikTok 大概花了 9 個月,這讓 ChatGPT 成為迄今為止增長最快的消費者應用。
在此之前,AI 産品更多是針對 B 端的産品,ChatGPT 也打破了 to B 到 to C 的圈層壁壘。
當然,ChatGPT 的偉大,更重要的還是它讓通用型人工智能進一步成為可能,并降低了這項技術的進入門檻,讓更多開發者能夠以低成本的方式在 ChatGPT 的基礎上開發專屬應用,讓 AI 改造世界的可能性進一步提升。
可以說,就像 25 年前剛剛萌芽的互聯網正準備對全球帶來翻天覆地的變革一樣,如今 ChatGPT 的出現,讓 AI 成為新一輪技術爆發的奇點成為可能。
但是,光錐智能在和中國人工智能行業從業者交流後,發現不少技術從業者反而不如圈外如此狂熱。這是因為,漸進式技術進步到今天,并非一蹴而就,技術從業者一直都在保持着密切的觀察和技術跟進。
ChatGPT 很牛,但不要神化它。
01 矽谷隻剩 AI 了
談起 ChatGPT,我們仍然要從矽谷開始。和互聯網、Web3、元宇宙等之前大多數具有革命或非革命意義的技術突破一樣,ChatGPT 仍然來自于矽谷。
但和之前矽谷各項技術方向百家争鳴不同,這個時間點的 ChatGPT 更像是矽谷沒有選擇的選擇。
2022 年,矽谷就經曆了一波大裁員,并波及了幾乎所有的科技公司。到了 2023 年 2 月,雖然冬天的氣溫已經有所回升,但矽谷的寒意卻還沒有褪去。
據 trueup.io 統計數據,在 2023 年剛剛過去的這一個月,全球 326 家科技公司累計裁掉了 106950 萬人,其中大頭都在矽谷,而且打擊面還非常廣泛,元宇宙、芯片、自動駕駛和 SaaS 都是重災區。
一直以來,裁員都是一個行業不景氣的直接表現。
以 Wbe3 為例,Coinbase 在 2023 年 1 月計劃裁掉公司 20% 的員工,這是美國第一家上市的合規加密交易平台,且這家公司已經在去年 6 月裁掉了 18% 的員工。
研究公司 PitchBook 的數據顯示,在 2022 年第四季度,Wbe3 行業的風險投資就已跌到了這兩年以來的最低水平,比 2021 年同期下降了 75%。
在芯片領域,美光、格羅方德、英特爾等巨頭無一幸免,其中泛林集團裁員 1300 人,因特爾下調包括 CEO 在内的管理人員薪酬,并裁員數百人。SaaS 領域,Salesforce 在 1 月 4 日宣布裁員 8000 人,約占全體員工的 10%。自動駕駛方面,包括 Waymo、Crusie、圖森未來、無人車配送公司 Nuro 都有裁員的消息傳出。
除此之外,曾經被傾注下一代互聯網希望的元宇宙也終于走到了拐點。
去年 11 月,Meta 确認了成立 18 年來首次大規模裁員,紮克伯格向被裁員工道歉," 我錯了,我要為此次裁員,以及我們是如何走到今天這個地步負責。"
投資人也不再看好 Meta 的元宇宙未來,美國投資公司 Altimeter Capital 向 Meta 發表公開信,呼籲公司削減 20% 的員工成本,并将「元宇宙」項目的支出限制在每年 50 億美元。
而相比于一頭紮入元宇宙之後又船大難掉頭的 Meta,涉足稍淺的微軟則果斷選擇了棄舊從新。
首先,微軟對元宇宙相關業務進行了大刀闊斧的裁剪,其宣布将在 3 月 10 日關閉 2017 年收購的社交平台 AltspaceVR,并有可能擺脫混合現實工具包(MRTK)團隊。
同時,微軟又在 AI 方面大力投入。1 月初,微軟就計劃向 OpenAI 投資 100 億美元,然後宣布要将包括 Bing 搜索、Office、Azure 在内的旗下全線産品整合 ChatGPT。到 2 月 7 日,微軟已經在 Redmond 召開了整合 ChatGPT 的 Bing 發布會。
其實從 ChatGPT 面世第一天開始,ChatGPT 颠覆傳統搜索的觀點就已經不胫而走。所以面對微軟激進的布局,谷歌 2 月 6 日宣布推出一款聊天機器人 Bard 來與 ChatGPT 競争,谷歌雲計算部門也在開展一個名為 "Atlas" 的項目。
2 月 7 日,谷歌向 ChatGPT 的競争對手 Anthropic 投資了約 3 億美元,獲得了 10% 的股份,這讓谷歌和 Anthropic 形成了類似微軟與 OpenAI 的綁定關系。
除了谷歌和微軟之外,在 ChatGPT 上線前三個月,Meta 其實也曾發布過一款類似的聊天機器人,隻是并沒有獲得太多影響力。用 Meta 首席人工智能科學家雅恩・勒昆(Yann LeCun)的話說,"Meta 的 Blenderbot 讓人覺得很無聊 "。
相應的,亞馬遜也已經将 ChatGPT 應用到了包括回答面試問題、編寫軟件代碼和創建培訓文檔等工作職能中。一名亞馬遜員工在 Slack 上表示,亞馬遜雲部門已經成立了一個小型工作組,以更好地了解人工智能對其業務的影響。甚至,連蘋果都宣布要在下周召開内部 AI 峰會。
如今的矽谷,AI 已經成為了絕對 C 位。
這種轉向其實也表現在投資機構的動态上,2021 年 12 月,紅杉資本将自己在 Twitter 上的簡介從 " 幫助有冒險精神的人創建偉大的公司 " 改成了 " 從想法到落地,我們幫助富有冒險精神的人打造偉大的 DAO。"2022 年,Web3 賽道火熱,紅杉在 2022 年 1 月 1 日 -4 月 26 日,以大概每周一家的速度投資了 17 家 Web3 公司。
但變化發生在去年 9 月,紅杉資本發布了一篇文章《生成式 AI:一個創造性的新世界》。其中寫道,生成式 AI 有可能創造數百萬億美元的經濟價值。
PitchBook 的一項統計數據顯示,2022 年投資圈向生成式 AI 公司共投入 13.7 億美元(折合人民币約 93.69 億元),幾乎達到了過去 5 年的總和。這些投資中不僅包括 OpenAI、Stability AI 這樣的頭部企業,也包如 Jasper、Regie.ai、Replika 等初創企業。
整體上,從投資人到大企業,再到創業者,一場關于 AI 2.0 的大幕已經拉開。
02 中美差距沒那麼大
從矽谷到中國,ChatGPT 的熱度有增無減。
畢竟一直以來,關鍵的技術革新都發生在矽谷,這兩年中國尖端技術又一直面臨卡脖子的問題。所以在 ChatGPT 出現之後,大家最關心的還是當國外技術已經開始商業化落地的時候,國内的進度到底如何,差距又有多少?
2 月 7 日,百度對外公布了自家類 ChatGPT 産品的名稱 " 文心一言 ",英文名叫 ERNIE BOT,目前,文心一言正在做上線前的沖刺。
" 文心一言 " 一經透露,便迅速登上各大平台熱搜,百度股價一度漲超 17%,市值增長約 700 億港元。很明顯,市場對于一個中國版的 ChatGPT 已經期待太久。
之前,有觀點認為國内外差距大概在兩年左右。但雲知聲研發副總裁劉升平認為,實際上的差距可能沒有這麼遠。兩年的說法是因為 GPT-3 是在兩年前公布的,但其實自 GPT-3 發布之後,國内許多企業就已經跟進在做類似的大模型了。" 實際差距并沒有那麼大,大概在一年左右。"
小冰公司 CEO 李笛也向光錐智能提到:" 國内人工智能技術不像芯片、操作系統一樣落後于國外,相反它應該是最接近國際的。"
" 國内外的差距主要是一種思維上的差距。"李笛認為,國内對技術創新這件事鼓勵得不夠充分,如果一個公司耐得住寂寞,那它無論在哪個方向都是 OK 的。
事實上,國内大廠基本都具備訓練大模型的能力。比如百度這次發布的文心一言,就和百度文心大模型一脈相承。
百度在發布文心一言名字的時候還特意提到,在人工智能四層構架中有全棧布局,包括底層芯片、深度學習框架,大模型以及最上層的搜索等應用。擁有産業級知識增強文心大模型 ERNIE,具備跨模态、跨語言的深度語言語義理解與生成能力。
同樣的,騰訊也有類似混元 AI 大模型,在此基礎上,騰訊推出了 HunYuan-NLP 1T 大模型并一度登頂國内最權威的自然語言理解任務榜單 CLUE。此外,像阿裡有 " 通義 " 大模型,華為有盤古大模型,國家隊中科院自動化研究所有 " 紫東 · 太初 " 等等。
簡單來說,國内大廠基本都有做 NLP 預訓練模型的能力,甚至許多專業能力還處在世界領先的水平。
比如騰訊的混元大模型在 2022 年 11 月公布了一項最新進展,它們實現萬億級 NLP 模型,可以用 256 張卡,最快 1 天内完成訓練,成本相比原來降低 1/8。
作為對比,ChatGPT 訓練一次的成本高達 1 千萬美元,這是一般企業無法承受的。小冰公司 CEO 李笛算過一筆賬:" 如果按照 ChatGPT 成本來考量的話,每天我要燒 3 億人民币,一年要燒一千多億。"
而騰訊通過課程學習、MOE 路由算法、模型結構等方式優化之後,讓更多企業能夠承擔得起訓練自己的 NLP 模型的成本。
除此之外,像在專利儲備上,根據 statista2021 年的數據,百度和騰訊都名列世界前列。
另一方面,就 ChatGPT 而言,它的技術原理并不新鮮。
Yann LeCun 提到:" 就底層技術而言,ChatGPT 并不是特别創新的,它不是革命性的,盡管這是公衆對它的看法。" 他指出,除了谷歌和 Meta,還有 6 家初創公司基本上擁有與它非常相似的技術。ChatGPT 是一項集體努力,因為它彙集了多方多年來開發的多項技術。
李笛也提到,大模型對應的技術理念已經誕生好幾年,無論是國内還是國外,使用這種技術理念訓練出來的大模型已經很多,隻是在具體 fine tune(微調)的過程中專注的領域有所不同。
做個不恰當的比喻,ChatGPT 就像原子彈一樣,它的原理已經被寫在了教科書裡,而大多數國家仍然無法實現,更多是因為工程性的問題。比如千億規模的數據從哪裡來?如何進行數據标注,具體标注哪些數據,标注多少,這些數據又如何進行組織訓練等等。
而這些問題也都沒有在 OpenAI 的論文中得到公布,需要企業在自己的模型訓練中去嘗試和摸索,然後形成經驗,積累成自己的 know-how。
03 不要神化 ChatGPT
雖然在底層技術上,國内外其實并沒有想象中那麼大的差距。但當大家看到國外如火如荼的技術落地時,也會擔心國内在這方面掉隊。
對于 ChatGPT 這樣技術邏輯清晰的産品而言,慢一點并不影響結果。但如果産品差,則表現在具體工程問題的解決能力上,這些部分要摸索,要踩坑,要形成經驗都需要漫長的時間,這背後反映的是技術水平的問題。
相比于歐美以英文為主的語言環境,中文是表意文字,在抽象概括和邏輯能力上天生不及英文。除此之外,國内互聯網的語料也相對缺乏,沒有英文互聯網那麼大的數據積累。
所以有業内人士表示,對目前國内的類 ChatGPT 産品發展而言,重要的不是模型,而是數據。
" 自然語言處理需要經過一個非常嚴密的推理過程。" 李笛提到:" 大模型某種意義上代表一種暴力,即把大量的數據壓縮到一個黑盒裡面,然後提取出來,這意味着大家在算力有一定保障的前提下,可以有機會用之前沒有用過的方法去完成。"
另一方面,ChatGPT 确實是革命性的存在,但卻并不代表它就是今後 NLP 領域的唯一方向。
首先是 ChatGPT 的技術發展,今天最主要的技術在于,一個模型建壓好之後,如何從裡面很好地提取數據,目前還有很多新方法沒有嘗試,所以不排除未來用更小的模型達到很好效果的可能。
李笛提到,現在整個行業都在追求這種可能,因為模型參數太大,一定意味着成本非常高,以及各種各樣的其他問題。" 今天技術差異還遠遠沒有達到成為不同技術流派的程度,也還遠遠沒有到說就按應用場景去劃分這樣一個程度。"
其次是從整個 NLP 的技術路線來看,目前主要有兩種主流技術路線,分别是以谷歌 BERT 為代表的雙向預訓練語言模型 +fine-tuning(微調),和以 OpenAI 的 GPT 為代表的自回歸預訓練語言模型 +Prompting(指示 / 提示)。
在 ChatGPT 發布之前,BERT 一直是業内主流的技術方案,它之所以被 ChatGPT 搶了風頭,是因為它無法像 GPT 一樣用一個模型解決所有問題,沒有表現出通用型人工智能的潛力。
但實際上,BERT 在許多具體的場景下擁有優勢,比如在特定場景下,BERT 可以用更小的數據量(ChatGPT 是在 3000 億單詞的語料基礎上預訓練出的擁有 1750 億參數的模型),更低的訓練成本實現同樣的性能。
比如在醫院内部這樣一個特定場景,一方面它用不起千億規模的模型,ChatGPT 在醫院場景就屬于殺雞用牛刀,醫院也無法負擔部署 ChatGPT 的成本。另一方面,ChatGPT 的模型是基于公開數據訓練的,但醫院的數據并不存在公共網絡上,所以面對醫院的問題,ChatGPT 可能無能為力。
但 BERT 卻能夠适應這樣的場景,它可以以更小的數據量,更低的成本,針對醫院的數據和場景針對性地訓練出的模型,在解決具體問題上比 ChatGPT 更加得心應手。
這其實就是一個所有領域都涉獵的全能型選手和深耕特定領域的專家之間的區别。即在數據确定的特定場景,BERT 更有優勢。而在沒有明确數據和目标,面向開放式的應用場景,ChatGPT 則更合适。
當然,具體到國内企業的商業化來說,大模型需要大量的數據,高昂的訓練成本,這些都不是一般企業能夠承擔的,因此它注定了是巨頭的遊戲。
在騰訊研究院近期發布的《AIGC 發展趨勢 2023》報告中就梳理了目前 AIGC 産業生态體系的三層構架,包括以預訓練模型為主的基礎層;以垂直化、場景化、個性化模型為主的中間層;和以圖像、語音、文字生成等具體 AIGC 應用為主的應用層。
圖:騰訊研究院《AIGC 發展趨勢 2023》
其中,如百度、騰訊、OpenAI 這樣的大公司将專注于做預訓練模型,對這些企業來說,他們一方面能夠将大模型的能力整合到自己的産品線中,直接面向廣大的用戶;另一方面又能夠通過 API 為中小企業提供能力調用,在具體場景中落地。
面對這樣的生态架構,一位知名機構投資人在考察過矽谷的 ChatGPT 項目後向光錐智能表示:" 創業公司的機會在于,在開源技術的基礎上,做具體的應用場景。尤其是可以把幾種具體技術結合在一起,比如數字人和 ChatGPT 結合,自動生成視頻,用于金融、客服等特定場景下的應用。"
但這也會面臨一些問題,即如果大家都調用同一個模型的能力,又落地在同一個細分場景,那必然會面臨同質化的問題。
所以劉升平認為:"ChatGPT 适合創業公司進入市場初期的冷啟動,即通過 ChatGPT 提供服務,然後逐步積累數據,待有了一定數據積累之後再利用 BERT 訓練專用模型,以此來建立自己的技術壁壘和護城河,同時也提供差異化的服務,和同行拉開差距。"
所以,無論是從技術,還是從商業化的角度而言,ChatGPT 和 BERT 從來不是一個非此即彼的問題,而是一個術業有專攻的問題。
此外,劉升平也提到,對于中小公司而言,如果沒有能力去研發類似 ChatGPT 的通用大模型,那也可以考慮研發類似 ChatGPT 的行業版模型,用更少的參數量,更多的行業數據,在行業問題上達到或超過 ChatGPT 的效果。
" 我認為到目前為止,人工智能在 To C 和 To B 上尚未出現一個放之四海而皆準的商業模式。"
李笛提到,AI 現在還出其實還處在一個相對比較早期,甚至可以稱之為蠻荒時代,很多理念都還處在特别特别原始的狀态,所以可能每年我們回顧過去,都會覺得在颠覆自己。
" 就像前幾年 NIIPS 大會上有人開玩笑說過的大模型煉丹,現在的大模型就像大家拿到了一個好的玩具,但不知道這個玩具還能吐出什麼令人驚訝的東西。"
在 2016 年,AlphaGo 擊敗李世石時,我們也曾以為 AI 時代已經來臨,它會在許多領域将人類替代掉,我們也曾為此恐慌和興奮,但實際上如今将近 10 年過去了,AlphaGo 并沒有改變世界,甚至沒有改變任何人。
所以,何妨讓子彈再飛一會兒呢?
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App