國産大模型的100種可能

圖片來源 @視覺中國

文 | 明晰野望

4 月以來，市場幾乎每天都有各種國産大模型的新信息，一衆科技大廠、創業公司陸續公布相關進展，加速入場。

争相湧現的國産大模型，特别是科技大廠基于投入、算力、大數據等方面的優勢，爲中國自主大模型的發展帶來了廣泛的可能性。

事實上，BTA、華爲等大廠在該領域早有研發，并非新入局者。之所以在 ChatGPT" 教育全社會 " 前 " 隐而不發 "，一是各家的核心業務不同，AI 研發的側重點也有所不同。二是正如阿裏雲周靖人所言，在 ChatGPT 出現前講 " 預訓練大模型 "，沒有人會感興趣。

當下，有人在琢磨如何快速推出自己的國産大模型搶占市場，也有人在以算力爲代表的底層基礎設施層發力。更有人直言，相比于 " 神仙打架 "，更關心國産大模型怎麽落地應用，看看這個先進生産力工具究竟如何改變産業與生活方式，以及能否實現超越，由追随到引領？

關于 " 與 OpenAI 差距 " 的讨論也從未停止，如李彥宏的 "2、3 個月 "，王小川的 " 不會低于兩年 "，時間定義雖不同，但均表明了其并沒有領先到難以追趕的程度。

大戲，才剛剛啓幕。

01 "iPhone 時刻 " 與增量市場

" 超越 " 不是僞命題，在中美科技競争、市場隔離的背景下，中國科技産業需要自己的 "iPhone 時刻 "。

人工智能則是最有希望誕生這一時刻的領域：在過去十餘年間，AI 進步由中美主導，投入也最巨大，因此機會主要也在中美之間。

Open AI 的成功，無疑強化了這一觀點，并給所有中國科技企業帶來了一劑強心針，照着這個路徑去做生成式 AI，是能夠走通的——這樣即能保證 " 革命性技術 " 誕生時離其最近，也能率先進入 " 增量 " 市場。

這是在科技行業低迷的當下，一個難得的增量空間。如果能取得先發優勢，就有可能開辟巨大的新市場，或給已有業務，如雲計算、電商、遊戲、社交、搜索乃至 B 端的千行百業加上 " 放大器 "。

大模型不僅是聊天軟件，更是生産力工具，已是共識。

在阿裏雲峰會上，張勇稱所有産品未來都将接入通義千問大模型，進行全面改造；劉熾平在騰訊财報會上強調，生成式 AI 可成爲已有業務的 " 倍增器 "，也可幫助開拓新增長線；任正非更是認爲，ChatGPT 把計算、管道流量撐大，華爲産品就有了機會。

其中的邏輯是，AI 是數字化時代的 " 操作系統 "，就像移動互聯網時代的 IOS 和安卓，加速促進了産業數字化的發展，對生産、生活方式進行下一次重塑，帶來更大空間的新領域，而大模型是整個 AI 産業鏈中，核心中的核心。

從長遠看，如果不能取得先機，未來就有可能會影響現有的整個商業模式，甚至被颠覆。

如周鴻祎在 4 月 21 日發出内部信，要求 360 全員擁抱人工智能，稱 " 已領先一個身位 "。近期接受采訪時也表示，國内 " 搜索引擎百度市占率 60%，公司 30%"，強調 " 在戰略上對标微軟，搜索上踐行必應 "，改寫格局的企圖心強烈。

百度反應更爲激進，做出了全球第一個對标 ChatGPT 的文心一言。另據晚點财經報道，在文心一言内測前，李彥宏每晚和項目團隊開會，他們爲籌備産品甚至一度睡在公司。

中信建投的一份 " 會議紀要 " 也顯示，過去幾個月他們調研了很多一線互聯網公司，得到一個非常一緻的結論：這次是全面的一把手工程，不管是 BAT 還是字節、華爲，均是創始人親自督戰，對大模型團隊全力支持。上一次出現如此情景，還是 2009 年移動互聯網來臨的時候。

中信建投因此認爲：未來 6-12 個月的 AI 行業會很卷，但也很精彩，各家模型的登場才剛剛開始。

但僅是 " 開始 "，當下國内大模型超過萬億參數的，就有阿裏的 M6、騰訊的混元、智源研究院的悟道 2.0，華爲的盤古 Σ，千億以上的也有近十個。

從發布時間看，百度、阿裏、騰訊、華爲等一線科技大廠，在 ChatGPT 熱潮前均已推出過大模型。

百度的 ERNIE 1.0 于 2019 年推出，即後來的文心大模型，目前更新到 3.0 版本；阿裏在 2021 年發布語言大模型 AliceMind 和多模态大模型 M6，去年 9 月合并爲通義大模型。

騰訊在 2022 年 6 月發布混元大模型，目前更新至 2.0 版本。微信去年 10 月也發布了大模型 WeML；華爲盤古大模型于 2021 年 4 月發布，後續發布了 NLP、CV、多模态等多個大模型。

這些都說明，中國科技企業有技術和能力推動一場大模型的變局，當然，差距和阻力也依然客觀存在。

02 國産大模型需要 " 新想法 "

李彥宏在文心一言發布後曾說，百度有信心在綜合能力上，迅速追上甚至超過 ChatGPT。

這可能不是百度盲目自信，今天的大模型就像一場剛剛開跑的馬拉松，" 你追我趕 " 是必然階段。現在 Open AI 領跑，也許明天谷歌就會趕上來，但也有可能是阿裏、騰訊、華爲實現彎道超車。

科技行業不同于其他行業的魅力所在之處在于，每一輪科技創新都是由大的确定性和小的不确定性構成，帶有偶然性，并不是簡單的強因果關系。

但略顯遺憾的是，目前多數中國科技公司在做的大模型，包括百度和阿裏在算法方面和 GPT-3 架構基本類似，都是基于谷歌的 Transformer，其他方面也是追随 OpenAI 的腳步實踐，在叠代速度不如人的情況下，反而差距越拉越大。

李彥宏曾明言，百度 " 文心一言 " 在研發階段時曾與 ChatGPT 進行對比測試，當時差距是一個月能追得上。可過了一個月再次測試後，發現差距反而拉大了。

阿裏雲周靖人也坦承，目前通義千問與 ChatGPT 仍有差距，"GPT 還是屬于各方面都領先的地位 "。

更爲關鍵的是，ChatGPT" 暴力美學 " 式大模型路徑可能走到了盡頭。

近日 OpenAI 首席執行官山姆 · 奧特曼公開表示，" 大語言模型規模已接近極限 "，" 我認爲我們正處于巨型模型時代的末尾，目前尚不清楚未來的進步究竟來自何處 "。他同時否認了 GPT-5 的存在，" 而且一段時間内也不會有 "。

自 ChatGPT 推出以來，競争對手衆多。

如馬斯克已經确認自建 AI 聊天機器人 TruthGPT 與之硬杠，亞馬遜也大力投資生成式 AI，谷歌大腦合并 DeepMind 聯手追趕等等，還有大批初創公司正在構建更大算法。此外，歐洲各國正在禁用或拟禁用 ChatGPT。

因此尚不清楚山姆 · 奧特曼出于何種考量做此表态，但也不排除巨型 AI 模型時代可能正在結束。這意味着大模型進化的 " 下一步 " 需要再次 " 另辟蹊徑 "，尤其是國産大模型更需要有 " 新想法 "。

目前生成式 AI 的應用在文本領域相對成熟，從海外已落地或處于 Demo 階段的應用案例來看，在代碼、圖片、視頻、遊戲等領域，海外均有所創新。

但中國顯然有更廣闊的市場及更豐富的應用場景，這也是中國科技公司天然的本土優勢：從 toC 走向 toB。

有很多科技公司的從業人士認爲，中國的大模型之路應該與美國市場不同。他們更認可一種 " 兩條腿走路 " 的方式，即一邊做大模型基礎平台開發，一邊直接瞄準垂直的行業場景落地，實現大模型與場景化的兩翼齊飛。

這樣既能持續獲得更多更豐富的各個行業裏 " 好的原材料 "（數據），也使更多的研發人員有機會深入到一線，用大模型去解決實際問題（應用場景），從而在工程化、産品化、場景化上不斷叠代，最終與技術底座形成飛輪效應，走向商業化的正循環。

如華爲盤古大模型強調在礦山、電力等場景的應用，騰訊 CV（計算機視覺）大模型在工業質檢、醫療影像等領域的落地，及諸多 AI 創業公司深耕垂直行業，都是出于此等考量。

從中長期來看，AI 大模型也一定會加速滲透到更多 toB 的場景，比如汽車、工業（制造業）、航天航空衛星、能源、生物制藥等領域，這也是中國數字化發展的主線。

03 "AI+ 一切 " 之數字經濟

2018 年時，華爲有個 " 達芬奇 " 計劃，旨在将 AI 添加到一切産品和服務中，也可以理解爲 "AI+ 一切 "。其中最首要的一步，就是開發 AI 芯片，挑戰英偉達。

那一年，從産業革命，技術創新的周期視角下來看，應該是數字化和智能化的開端，數據、算力、算法都迎來大爆發，更是新一輪硬件終端智能化趨勢的起點，比如汽車、穿戴設備、智能家居等等物聯網終端，至今全球已經有接近 1000 億的 Iot 智能終端實時在線。

但是，并沒有數字化時代現象級的應用誕生，不管是自動駕駛還是 VR、AR、智能家居、工業互聯網乃至元宇宙，過去幾年落地都不及預期。

中國也沒有誕生自己的英偉達，美國卻又增加了 OpenAI 這個 AI 新标杆。這說明，科技領域永遠沒有屬于追随者的時代。

而大模型之所以形成全球共振效應，因爲它可能是全面加速數字化應用落地的超級工具，這是一個全新的節點 : 大模型更多是一個工程上的突破而非技術突破，一旦商業模式确認，各行各業的落地速度會比過往快很多，這也是越來越多的企業急速湧入的根本性原因。

所以在全新節點下，4 月 18 日釘釘全面接入 " 通義千問 "，這意味着阿裏大模型正式面向 B 端客戶。此前在阿裏雲峰會上，張勇曾強調，" 面對 AI 時代，所有産品都值得用大模型重做一次 "。

"AI+ 一切 " 的野望始終都在，這爲國産大模型的未來帶來了何止 100 種的可能性。而釘釘最想實現的一個可能 " 是成爲超級 APP"，釘釘總裁葉軍如此說。

但在理論上，百度、阿裏、騰訊、華爲、字節憑借各自的曆史積累，都有可能成爲 "AI+ 一切 " 的赢家，而不是先做的就一定比後做的好。

目前從不同渠道流出的消息顯示，4 月份華爲會發布自己的模型，8 月份騰訊大模型要出來；字節版的 ChatGPT 已在内測，但内測之後體驗效果不好預計在 9 月上線。

不過決定最終誰能跑出來，一定是先 " 卷 " 一輪。

從中國經濟發展的曆史來看，無論是家電、新能源車還是電商、短視頻直播行業，" 内戰必先于外戰 "，但 " 外戰優于内戰 "。

大模型之戰應該也遵循這個路徑，很多小模型或者小場景的商業閉環會被大模型 " 吃 " 掉。而大模型一旦成功，會是萬億市值規模的巨大空間，當然最後跑出來的也可能是兩、三個大模型。

屆時，不但會産生中國的 "OpenAI"，中國的 " 英偉達 " 也會有，底層框架更會有。

因爲中國大模型隻有構建在國産技術底座上，每一層都實現自主可控，才有可能縱深地做持續閉環優化，這就跟芯片及再上層的芯片先進制程都要實現 " 自主 " 是一個道理。

那時國産大模型實現超越，切實可期。

但 AI 從來不隻是技術、算力、人才的角逐，更是國家戰略的角力。4 月份以來，網信辦發布了《生成式人工智能服務管理辦法（征求意見稿）》，科技部發起成立 " 國家超算互聯網聯合體 "，及從去年到現在出台的一系列有關數字經濟、數據要素相關政策，都表明了國家的關切與肯定。

也就是說，相對海外對大模型發展的矛盾态度，中國對整個數字經濟及人工智能的發展，是持一貫的支持态度，這爲中國大模型的未來，加上了一個至關重要的确定性。

更多精彩内容，關注钛媒體微信号（ID：taimeiti），或者下載钛媒體 App