圖片來源 @視覺中國
文 | 元宇宙日爆
又一家中國互聯網巨頭在追趕 ChatGPT 了。
3 月底舉行的博鳌亞洲論壇上,騰訊集團高級執行副總裁湯道生披露,騰訊正在研發 AIGC 以及大模型相關技術,類 ChatGPT 的對話機器人也在醞釀中。
百度、華爲,如今再加上騰訊,ChatGPT 出現之後,中國的互聯網科技企業似乎一夜覺醒。不光公司,還有資本及創業大佬。
3 月 19 日,創新工場董事長兼 CEO 李開複在朋友圈高調宣布,正在親自籌組中文版 ChatGPT 公司 "Project AI 2.0"。重燃創業野心的也不止李開複,美團王慧文、阿裏賈揚清、搜狗王小川、京東周伯文均親自下場,趕赴大模型賽道。
" 大佬攢局 " 往往是賽道火熱的信号,僅今年前三個月,上萬家新注冊的公司在經營範圍中寫上了人工智能。企業如雨後春筍般湧現,人才緊俏起來。應了周鴻祎那句話:一人捅破窗戶紙,千軍萬馬獨木橋。
這一次不光是資本生意,還有需求催生。在人工智能上,以 OpenAI 爲代表的搶跑選手引領自然語言大模型風潮,從産品上甩開中企老遠,而中國還沒有合格的 ChatGPT 滿足各行各業對 AIGC 的體驗。
騰訊們、李開複們現在做大模型還來得及嗎?投入 10 年的李彥宏說,應用更靠譜。但真正稀缺的,仍然是底層基礎設施。
互聯網大佬帶頭組隊
作爲目前全球最火的自然語言大模型産品,ChatGPT 至今不對中國用戶開放,背後的算法、芯片、數據更是全部被控制在美國公司手中。國産 ChatGPT 進入需求井噴期,一大批中國公司趕來,有互聯網大廠,有資本大佬,也有創業公司,誰都不想錯過這一次的 AI 革命。
3 月 19 日,創新工場董事長兼 CEO 李開複在朋友圈宣布,成立 Project AI 2.0 公司," 不僅僅要做中文版 ChatGPT," 他這個公司定位爲 AI 2.0 全新平台和 AI-first 生産力應用的 " 世界級公司 ",野心頗大。
一個月前,美團聯創王慧文在朋友圈發 " 英雄帖 ",出資 5000 萬美元,要創立新公司打造中國版 OpenAI。此外,阿裏巴巴 " 框架大神 " 賈揚清、搜狗前任 CEO 王小川、京東曾經的 AI 掌門人周伯文都表明了同樣的意願。
互聯網大佬蜂擁入局,中國企業重燃熱情,包括創業企業和上市公司。
企查查數據顯示,近三個月共有 108601 家新注冊業企業在經營範疇中标注了人工智能,同比增長超 24%。《元宇宙日爆》統計,截至今年 3 月,已有 20 家上市公司布局了 AIGC 相關應用,涉及世紀虛拟人、AI 寫作、AI 視頻、AI 繪畫、AI 營銷等。
國内上市公司 AIGC 相關布局
AIGC 創業公司千帆競發,涉及領域包括上遊的底層框架與工具、中遊的行業服務、下遊的包括文字、圖像、視頻、音頻、遊戲等應用場景,創業方向也從 C 端的娛樂遊戲拓寬至工業、金融、醫療、教育等 2B 領域。不同應用場景已出現了一批代表性的玩家。
國内創業公司 AIGC 相關布局
而在底層大模型上,中國互聯網科技巨頭的動作則最受矚目,包括百度、華爲、騰訊在内大廠均有自然語言大模型布局。
3 月 16 日,百度履行承諾,發布基于文心大模型的生成式 AI 産品文心一言,27 日又面對企業發布了智能雲 AI 底座文心千帆。
3 月 27 日,華爲雲官網顯示,旗下的盤古系列 AI 大模型即将上線,涉及 NLP(自然語言)大模型、CV ( 計算機視覺 ) 大模型和科學計算大模型(氣象大模型)。
3 月 30 日,騰訊集團高級執行副總裁湯道生披露,騰訊正在研發 AIGC 以及大模型相關技術,并向澎湃新聞表示,正在研發類 ChatGPT 的對話機器人,對于騰訊的聊天機器人是集成到 QQ、微信,還是通過騰訊雲向 B 端用戶服務,湯道生說:" 都會有。"
國内 AI" 三算 " 與海外存差距
人工智能在當下的中國展現出全面開花的熱鬧。而資金雄厚、人才濟濟的大廠被視作最能與 OpenAI 比肩的選手。但最早發布産品的百度,其文心一言在文本、代碼生成上尚不及 ChatGPT 的體驗,圖片生成的效果則被 Midjourney 拉開了距離。
賽道火熱,産品不佳。中國的人工智能發展進入至暗時刻。缺的不僅是有實力的大模型,還有與之直接相關的人才和 AI" 三算 ",即算力、算法、算據。
先是業内曝出,百度文心大模型團隊内的研發人員近期受到了其他公司的瘋狂追捧,有 3 年左右相關經驗的員工,可以直接給到原先年薪的兩倍。而有涉及海内外人才市場的獵頭稱,諸多互聯網大廠的第一訴求就是想找 OpenAI 項目裏的華人。獵聘大數據研究院的統計數據也顯示,近一年,AIGC 相關新發崗位同比增長了 42.5%。
搶人大戰不僅在國内上演。
由于一大批矽谷 AI 大牛排着隊擠進 OpenAI,谷歌一度遭遇 AI 人才流出。據外媒體統計,近幾個月 OpenAI 已經雇用了超過 12 名谷歌的 AI 人才。
但從公開消息看,到目前爲止,還沒有哪位 OpenAI 背景的華人專家流入中國大廠。
AI 人才緊俏,以芯片爲核心硬件基礎的算力一直被視爲 " 卡脖子 " 的狀态,而國産大模型的算據也與 GPT-4 存在肉眼可見的差距,預訓練等大模型算法的距離直接以 " 肉眼可見 " 的産品拉胯擺在了用戶面前。
在算據上,國産大模型也與 GPT-4 存在差距。
在自然語言大模型中,參數是衡量一個深度學習模型複雜度和能力的重要指标。參數多,意味着模型能夠處理更多的數據,學習更多的知識。國外有研究人員将 GPT 參數規模與大腦神經元做類比,GPT-3 的規模與刺猬大腦類似,GPT-4 擁有 100 萬億個參數,基本達到人類大腦的規模。
大模型參數對比
再看國産大模型,即使是排名靠前的 M6 大模型,其參數規模也仍與 GPT-4 相差一個數量級,更多的大模型仍在 " 原始階段 "。
GPT-4 百萬億的參數需要強大的算力來完成訓練。算力,同樣是 AI 的核心競争要素,核心的核心是芯片。
在 AI 芯片競争方面,英偉達處于壟斷地位,該公司推出的 A100 與 H100 是目前性能最強的數據中心專用 GPU,市面上幾乎沒有可替代的方案。ChatGPT 的訓練用的正是英偉達頂配版 A100。
然而,在中美競争下,A100 與 H100 已被限制出口中國,中國廠商隻能用閹割版 A800 芯片,數據傳輸速度被降低了 30%,影響着 AI 集群的訓練速度和效果。而國産優質芯片,雖能夠爲預訓練大模型提供算力支撐,但仍存在明顯差距。
芯片性能對比
以 OpenAI 爲例,該公司使用了數萬塊英偉達 A100 進行海量數據訓練和推理。如果以 1 萬枚英偉達 A800 GPU 爲标準,僅 GPU 采購成本就超 10 億美元。
如此現狀下,國内的大模型研發機構面臨兩種選擇," 燒錢 " 購買更多的芯片,等待國産芯片的算力突破。但現在的競争态勢下,等已經等不起了。
高昂的前期投入成本絕非普通創業公司可以負擔,還要具備絕對頂尖的研發技術。很顯然,AI 大模型仍是巨頭的遊戲。但掌握先發優勢的 OpenAI 以 " 日更 " 速度向前躍進,互聯網巨頭與資本面臨着一場 " 燒錢 " 硬仗。
OpenAI 搶跑,中企如何趕超?
回顧 ChatGPT 的叠代,OpenAI 至少進行了三次技術路線的 " 自我革命 "。
從 2018 年 GPT-1 的推出到今年的 GPT-4,OpenAI 用了近 5 年。而百度在自然語言大模型的研發上用了 10 年。
連李彥宏也認爲,中國基本不會再出現一個 OpenAI," 沒有必要再重新發明一遍輪子 ",在他看來," 大模型時代,最大的創業機會在應用," 他的判斷基于上一次的移動互聯網變革," 操作系統其實沒幾個,最成功的是微信、抖音、淘寶這些應用。" 他指出,未來 10 年,應用領域可能誕生 10 倍價值的機會。
周鴻祎也在公開場所表示,目前中國發展 GPT 技術,首先要占據應用場景,同步全力發展核心算法技術。爲什麽要同步?如果等算法趕上 GPT-4 再上馬,市場就錯過了。
另辟賽道,在現有大模型的基礎上創新産品應用可能是大部分企業的超車機會。
就像移動互聯網時代,盡管中國沒有自己的操作系統,但仍有 Tiktok 這樣的超級應用在海外市場殺出一片天。應用先行的優勢是能快速的将 AI 生産力轉化爲商業價值,這是在移動互聯網時代中國互聯網企業探索出的超車捷徑,也是在激烈的 AI 競争中,大部分中企們趕超 ChatGPT 最經濟、最現實的路徑。
但由于 GPT-3 之後,OpenAI 的所有模型就沒有再開源,GPT-4 的運行機制是什麽,國内企業仍無從得知。
面對競争對手全面的科技封鎖,中國人工智能想要長期發展就不能沒有 " 根 "。曠視科技 CEO 印奇認爲,中國攻堅 AI 大模型目前最重要的是要先能把 GPT-3.5 複現出來," 這是所有事情的起點 "。
無論如何,發展好自身的硬實力,不在關鍵技術上被 " 卡脖子 ",将是 AI 時代下中企們無法逃避的 " 必修課 "。
針對國産 AI 大模型,周鴻祎指出:" 發展大語言模型,别人已經指明了技術路線,剩下的就是長期主義指導下的時間問題," 他認爲," 中國有能力發展自己的 GPT,差距大概 2 年。"
百度有文心大模型,阿裏有 M6,華爲的盤古大模型箭在弦上,騰訊的混元大模型也在不斷叠代。當李開複、王慧文等一衆互聯網大佬也親赴大模型戰場時,底層的重要價值已經不言而喻了。
就像《三體》故事裏的明喻一般," 基礎科學 " 一旦被 " 智子 " 鎖死,人類便永遠失去探索宇宙真相的機會。底層大模型就是那個基礎科學,在人工智能上,中國想要超越,不光需要資本、巨頭,更需要的是能頂得住研發壓力的 " 面壁人 "。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App