圖片來源 @視覺中國
文 | 明晰野望
4 月以來,市場幾乎每天都有各種國産大模型的新信息,一衆科技大廠、創業公司陸續公布相關進展,加速入場。
争相湧現的國産大模型,特别是科技大廠基于投入、算力、大數據等方面的優勢,爲中國自主大模型的發展帶來了廣泛的可能性。
事實上,BTA、華爲等大廠在該領域早有研發,并非新入局者。之所以在 ChatGPT" 教育全社會 " 前 " 隐而不發 ",一是各家的核心業務不同,AI 研發的側重點也有所不同。二是正如阿裏雲周靖人所言,在 ChatGPT 出現前講 " 預訓練大模型 ",沒有人會感興趣。
當下,有人在琢磨如何快速推出自己的國産大模型搶占市場,也有人在以算力爲代表的底層基礎設施層發力。更有人直言,相比于 " 神仙打架 ",更關心國産大模型怎麽落地應用,看看這個先進生産力工具究竟如何改變産業與生活方式,以及能否實現超越,由追随到引領?
關于 " 與 OpenAI 差距 " 的讨論也從未停止,如李彥宏的 "2、3 個月 ",王小川的 " 不會低于兩年 ",時間定義雖不同,但均表明了其并沒有領先到難以追趕的程度。
大戲,才剛剛啓幕。
01 "iPhone 時刻 " 與增量市場
" 超越 " 不是僞命題,在中美科技競争、市場隔離的背景下,中國科技産業需要自己的 "iPhone 時刻 "。
人工智能則是最有希望誕生這一時刻的領域:在過去十餘年間,AI 進步由中美主導,投入也最巨大,因此機會主要也在中美之間。
Open AI 的成功,無疑強化了這一觀點,并給所有中國科技企業帶來了一劑強心針,照着這個路徑去做生成式 AI,是能夠走通的——這樣即能保證 " 革命性技術 " 誕生時離其最近,也能率先進入 " 增量 " 市場。
這是在科技行業低迷的當下,一個難得的增量空間。如果能取得先發優勢,就有可能開辟巨大的新市場,或給已有業務,如雲計算、電商、遊戲、社交、搜索乃至 B 端的千行百業加上 " 放大器 "。
大模型不僅是聊天軟件,更是生産力工具,已是共識。
在阿裏雲峰會上,張勇稱所有産品未來都将接入通義千問大模型,進行全面改造;劉熾平在騰訊财報會上強調,生成式 AI 可成爲已有業務的 " 倍增器 ",也可幫助開拓新增長線;任正非更是認爲,ChatGPT 把計算、管道流量撐大,華爲産品就有了機會。
其中的邏輯是,AI 是數字化時代的 " 操作系統 ",就像移動互聯網時代的 IOS 和安卓,加速促進了産業數字化的發展,對生産、生活方式進行下一次重塑,帶來更大空間的新領域,而大模型是整個 AI 産業鏈中,核心中的核心。
從長遠看,如果不能取得先機,未來就有可能會影響現有的整個商業模式,甚至被颠覆。
如周鴻祎在 4 月 21 日發出内部信,要求 360 全員擁抱人工智能,稱 " 已領先一個身位 "。近期接受采訪時也表示,國内 " 搜索引擎百度市占率 60%,公司 30%",強調 " 在戰略上對标微軟,搜索上踐行必應 ",改寫格局的企圖心強烈。
百度反應更爲激進,做出了全球第一個對标 ChatGPT 的文心一言。另據晚點财經報道,在文心一言内測前,李彥宏每晚和項目團隊開會,他們爲籌備産品甚至一度睡在公司。
中信建投的一份 " 會議紀要 " 也顯示,過去幾個月他們調研了很多一線互聯網公司,得到一個非常一緻的結論:這次是全面的一把手工程,不管是 BAT 還是字節、華爲,均是創始人親自督戰,對大模型團隊全力支持。上一次出現如此情景,還是 2009 年移動互聯網來臨的時候。
中信建投因此認爲:未來 6-12 個月的 AI 行業會很卷,但也很精彩,各家模型的登場才剛剛開始。
但僅是 " 開始 ",當下國内大模型超過萬億參數的,就有阿裏的 M6、騰訊的混元、智源研究院的悟道 2.0,華爲的盤古 Σ,千億以上的也有近十個。
從發布時間看,百度、阿裏、騰訊、華爲等一線科技大廠,在 ChatGPT 熱潮前均已推出過大模型。
百度的 ERNIE 1.0 于 2019 年推出,即後來的文心大模型,目前更新到 3.0 版本;阿裏在 2021 年發布語言大模型 AliceMind 和多模态大模型 M6,去年 9 月合并爲通義大模型。
騰訊在 2022 年 6 月發布混元大模型,目前更新至 2.0 版本。微信去年 10 月也發布了大模型 WeML;華爲盤古大模型于 2021 年 4 月發布,後續發布了 NLP、CV、多模态等多個大模型。
這些都說明,中國科技企業有技術和能力推動一場大模型的變局,當然,差距和阻力也依然客觀存在。
02 國産大模型需要 " 新想法 "
李彥宏在文心一言發布後曾說,百度有信心在綜合能力上,迅速追上甚至超過 ChatGPT。
這可能不是百度盲目自信,今天的大模型就像一場剛剛開跑的馬拉松," 你追我趕 " 是必然階段。 現在 Open AI 領跑,也許明天谷歌就會趕上來,但也有可能是阿裏、騰訊、華爲實現彎道超車。
科技行業不同于其他行業的魅力所在之處在于,每一輪科技創新都是由大的确定性和小的不确定性構成,帶有偶然性,并不是簡單的強因果關系。
但略顯遺憾的是,目前多數中國科技公司在做的大模型,包括百度和阿裏在算法方面和 GPT-3 架構基本類似,都是基于谷歌的 Transformer,其他方面也是追随 OpenAI 的腳步實踐,在叠代速度不如人的情況下,反而差距越拉越大。
李彥宏曾明言,百度 " 文心一言 " 在研發階段時曾與 ChatGPT 進行對比測試,當時差距是一個月能追得上。可過了一個月再次測試後,發現差距反而拉大了。
阿裏雲周靖人也坦承,目前通義千問與 ChatGPT 仍有差距,"GPT 還是屬于各方面都領先的地位 "。
更爲關鍵的是,ChatGPT" 暴力美學 " 式大模型路徑可能走到了盡頭。
近日 OpenAI 首席執行官山姆 · 奧特曼公開表示," 大語言模型規模已接近極限 "," 我認爲我們正處于巨型模型時代的末尾,目前尚不清楚未來的進步究竟來自何處 "。他同時否認了 GPT-5 的存在," 而且一段時間内也不會有 "。
自 ChatGPT 推出以來,競争對手衆多。
如馬斯克已經确認自建 AI 聊天機器人 TruthGPT 與之硬杠,亞馬遜也大力投資生成式 AI,谷歌大腦合并 DeepMind 聯手追趕等等,還有大批初創公司正在構建更大算法。此外,歐洲各國正在禁用或拟禁用 ChatGPT。
因此尚不清楚山姆 · 奧特曼出于何種考量做此表态,但也不排除巨型 AI 模型時代可能正在結束。這意味着大模型進化的 " 下一步 " 需要再次 " 另辟蹊徑 ",尤其是國産大模型更需要有 " 新想法 "。
目前生成式 AI 的應用在文本領域相對成熟,從海外已落地或處于 Demo 階段的應用案例來看,在代碼、圖片、視頻、遊戲等領域,海外均有所創新。
但中國顯然有更廣闊的市場及更豐富的應用場景,這也是中國科技公司天然的本土優勢:從 toC 走向 toB。
有很多科技公司的從業人士認爲,中國的大模型之路應該與美國市場不同。他們更認可一種 " 兩條腿走路 " 的方式,即一邊做大模型基礎平台開發,一邊直接瞄準垂直的行業場景落地,實現大模型與場景化的兩翼齊飛。
這樣既能持續獲得更多更豐富的各個行業裏 " 好的原材料 "(數據),也使更多的研發人員有機會深入到一線,用大模型去解決實際問題(應用場景),從而在工程化、産品化、場景化上不斷叠代,最終與技術底座形成飛輪效應,走向商業化的正循環。
如華爲盤古大模型強調在礦山、電力等場景的應用,騰訊 CV(計算機視覺)大模型在工業質檢、醫療影像等領域的落地,及諸多 AI 創業公司深耕垂直行業,都是出于此等考量。
從中長期來看,AI 大模型也一定會加速滲透到更多 toB 的場景,比如汽車、工業(制造業)、航天航空衛星、能源、生物制藥等領域,這也是中國數字化發展的主線。
03 "AI+ 一切 " 之數字經濟
2018 年時,華爲有個 " 達芬奇 " 計劃,旨在将 AI 添加到一切産品和服務中,也可以理解爲 "AI+ 一切 "。其中最首要的一步,就是開發 AI 芯片,挑戰英偉達。
那一年,從産業革命,技術創新的周期視角下來看,應該是數字化和智能化的開端,數據、算力、算法都迎來大爆發,更是新一輪硬件終端智能化趨勢的起點,比如汽車、穿戴設備、智能家居等等物聯網終端,至今全球已經有接近 1000 億的 Iot 智能終端實時在線。
但是,并沒有數字化時代現象級的應用誕生,不管是自動駕駛還是 VR、AR、智能家居、工業互聯網乃至元宇宙,過去幾年落地都不及預期。
中國也沒有誕生自己的英偉達,美國卻又增加了 OpenAI 這個 AI 新标杆。這說明,科技領域永遠沒有屬于追随者的時代。
而大模型之所以形成全球共振效應,因爲它可能是全面加速數字化應用落地的超級工具,這是一個全新的節點 : 大模型更多是一個工程上的突破而非技術突破,一旦商業模式确認,各行各業的落地速度會比過往快很多,這也是越來越多的企業急速湧入的根本性原因。
所以在全新節點下,4 月 18 日釘釘全面接入 " 通義千問 ",這意味着阿裏大模型正式面向 B 端客戶。此前在阿裏雲峰會上,張勇曾強調," 面對 AI 時代,所有産品都值得用大模型重做一次 "。
"AI+ 一切 " 的野望始終都在,這爲國産大模型的未來帶來了何止 100 種的可能性。而釘釘最想實現的一個可能 " 是成爲超級 APP",釘釘總裁葉軍如此說。
但在理論上,百度、阿裏、騰訊、華爲、字節憑借各自的曆史積累,都有可能成爲 "AI+ 一切 " 的赢家,而不是先做的就一定比後做的好。
目前從不同渠道流出的消息顯示,4 月份華爲會發布自己的模型,8 月份騰訊大模型要出來;字節版的 ChatGPT 已在内測,但内測之後體驗效果不好預計在 9 月上線。
不過決定最終誰能跑出來,一定是先 " 卷 " 一輪。
從中國經濟發展的曆史來看,無論是家電、新能源車還是電商、短視頻直播行業," 内戰必先于外戰 ",但 " 外戰優于内戰 "。
大模型之戰應該也遵循這個路徑,很多小模型或者小場景的商業閉環會被大模型 " 吃 " 掉。而大模型一旦成功,會是萬億市值規模的巨大空間,當然最後跑出來的也可能是兩、三個大模型。
屆時,不但會産生中國的 "OpenAI",中國的 " 英偉達 " 也會有,底層框架更會有。
因爲中國大模型隻有構建在國産技術底座上,每一層都實現自主可控,才有可能縱深地做持續閉環優化,這就跟芯片及再上層的芯片先進制程都要實現 " 自主 " 是一個道理。
那時國産大模型實現超越,切實可期。
但 AI 從來不隻是技術、算力、人才的角逐,更是國家戰略的角力。4 月份以來,網信辦發布了《生成式人工智能服務管理辦法(征求意見稿)》,科技部發起成立 " 國家超算互聯網聯合體 ",及從去年到現在出台的一系列有關數字經濟、數據要素相關政策,都表明了國家的關切與肯定。
也就是說,相對海外對大模型發展的矛盾态度,中國對整個數字經濟及人工智能的發展,是持一貫的支持态度,這爲中國大模型的未來,加上了一個至關重要的确定性。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App