大模型的開源之戰，比操作系統來得更快一些

本文作者：劉奇，編輯：何玥陽，原文标題：《開源不是活雷鋒，但搭便車的機會出現了》，題圖來自：視覺中國

" 是的。谷歌在人工智能方面并沒有護城河，OpenAI 也沒有。在我們彼此競争的時候，第三派一直在悄悄地吃我們的午餐。"

" 第三派，我是說那些開源模型，開源能讓它們‘更快、更可定制、更私密，能力更強’。"

——谷歌研究員報告備忘錄

"Llama 2 爲初創企業提供了一條生命線，像我這樣的人希望開源模式存在，因爲我不喜歡把我所有的錢都給 OpenAI。"

——人工智能助理初創公司 Lindy 創始人

越是前沿的領域，越是充滿變數。

對公衆來說，大模型領域可能隻是出了幾個玩具般的 App，很厲害，但沒什麽用。真正的商用似乎還有一段距離。

但商業端，大小公司之間的争鬥已經進入了貼身白刃戰，戰況瞬息萬變，反轉頻出，感覺都有點燃起來了。

太多的細節，對于小白來說多少有些繁雜，要想吃明白這個瓜，可以去提綱挈領一個主線，在我們看來，這也是今年以來大模型領域的鬥争核心：

開源 VS 閉源。

一、開源：後發者的驅虎吞狼

就軟件來說，屬于它的科技史并不算長，但我們依然可以總結出一些規律。

比如，每一次全新時代來臨之際，其核心産品都會出現兩條路線，先發者閉源，後來者開源。

PC 時代的操作系統，Windows VS Linux；

移動互聯網時代的操作系統，iOS VS Android；

以及當下即将來臨的 AI 時代，GPT VS ？？

第一次，Linux 的出現比 Windows 整整晚了六年。Linux 的江湖地位不必多說，但商業價值相比後者的一家獨大，可以說是忽略不計。

第二次，Android 的出現僅僅比 iOS 晚了十個月。

結果是，Android 拿下了 80% 以上的市場份額，而蘋果拿走了手機市場 90% 以上的利潤。

這個數據爲長期以來的平均概數。最新數據，Android 市場份額跌到了 70%，蘋果的利潤占比則跌到了 85%。這與中國廠商的崛起有不小關系。

開源系統的影響力大幅提高，但在商業價值上依然被閉源系統吊打。

第三次，也就是這一次，商業化落地的進程還沒正式開啓，開源系統就已經來勢洶洶了。

産生這一路線分歧，有其必然的商業邏輯。

在前沿科技領域，每一次技術突破的背後都需要極大的研發成本。這其中對于企業自身的資本、精力、人員投入乃至運氣，都有着極高的要求。

比如此次的引領者 OpenAI，有報告顯示，OpenAI 每天僅維持其人工智能服務 ChatGPT 的運行就需要花費約 70 萬美元。

如果不是 OpenAI 光啓動資金就有 10 億美元，是個典型的富二代，怕是經不住這樣 " 燒錢 "。

其次，在巨額投入的先發優勢下，這類企業的産品質量也往往是市面上所能看到的最優選項，盡管這種優勢在中後期會随着技術進步的放慢而被抹平，但這也是支撐其做到直接收費的市場原因。

這是非常傳統的商業邏輯，典型例子如制藥領域，早期高投入研制特效藥，前期專利保護高價售賣進行回本，後期逐步放開惠及市場。

但與藥品市場不同的是，軟件領域有着極大網格效應，時間在這一行業中格外重要，先發者往往能做到赢家通吃。

藥品市場中，假設我新藥比你研發得慢一點，但隻要我比你便宜一塊錢，或者有其他差異化特性，我依然可以拿到屬于自己的市場份額，那大家自然都願意慢慢地搞專利保護，也就是閉源模式。

但在軟件領域中，市場的發展瞬息萬變，新入場的創業者、開發人員以及應用生态都在不斷湧現，而他們也需要付出學習成本以及維護成本，那麽越往後期，其更換成本就越高。

就像你手中的微信，也許你并不喜歡這款軟件，也許市面上有更加優秀的通訊産品，但你已經将自己的互聯網社交圈子安置在這個軟件上了，某種程度上就是别無選擇。這也就是所謂的赢家通吃。

而當初一同出現的米聊、易信、飛信等軟件，這些企業早期投入的成本，也就随着微信生态的建立打了水漂。

但 Android 的成功，意味着這類後發者還有一線生機：開源。

開源的本質，是驅虎吞狼。

拉開架勢 1V1 單挑确實打不過了，那就把我的入場券免費送出去，請所有人一起入場。

個人的失敗固然痛心，但同行的成功更令人無法忍受。

既然赢家最後的核心優勢是生态建立，那我就不讓你這麽順利地壟斷生态，通過免費的行爲，把這一環節的水徹底攪渾。

二、攻防戰的背後競合大于競争

梳理過往經驗，有這樣幾個規律和趨勢是可以清晰看到的：

1. 商業價值上，開源系統的優勢在于影響力的迅速擴散，閉源系統的優勢則是利潤更有保障；

2. 與 Linux 相比，安卓獲得了極大的商業成功，這與後發者的反應速度有着極大關系；

3. 結合上一點，考慮到這一次大模型領域中，後發者的開源進程已經進入了提前搶跑式的布局。

那麽我們有理由相信，在又一個新的時代中，開源大模型很有可能取得比 Android 更加優異的成績。

這對包括 GPT 在内的所有閉源大模型來說，都不是一個好消息。文章開頭所引用的谷歌研究員匿名報告，他所擔心的便是這一趨勢。

毫無疑問，當下是開源模型的強勢期。後發者下定決心拿出 " 免費開源 " 這一必殺器時，必将強有力地攪動行業現狀。

但另一邊，這也意味着 OpenAI 的先發優勢已經十分穩固，在閉源系統這一端，可以說已經拿下了這一城。

不要相信那些開源社區所說的 " 透明化、分享精神、更高效的組織形式 balabala"。

商業領域，尤其是要對股東負責的上市公司，是不可能純做活雷鋒的。真有信心硬剛 OpenAI，能賺錢爲什麽不賺？

回顧過去一年，雙方攻防數輪，精彩非常：

ChatGPT 月活剛突破 1 億，Meta 就立馬推出 LLaMA（" 羊駝 "）；

羊駝被 " 非故意開源 " 之後，基于開源模型産生的 GPT 平替大爆發， OpenAI 立馬反手打一個 GPT-4；

Dolly 2.0 首創開源、遵循指令、提供可商業化數據集的大模型，ChatGPT APP 就再次掀起風暴；

Meta 推出新一代開源大模型 Llama 2，這是大型科技公司首個開源的商用大模型，被稱爲 GPT-4 的 " 最強平替 "，後來首席人工智能科學家楊立昆就被叫到參議院接受衆議員質詢。

......

總體來說，雙方的主線依然是競速賽。

雖然也出現了 " 媒體輿論 " 和 " 政策監管 " 這些盤外招，但長期來看，未來的商業格局，還是取決于三點，也就是人工智能三要素：算法、算力、算據（數據）。

算法方面，我們不能否認當下的開源模型在過去的 GPT-3 中汲取了大量養分。而随着 GPT-4 更加封閉，其能否持續保持競争力，仍然有待進一步觀察。

清華大學電子工程系長聘教授周伯文說：" 我們目前隻知道它（GPT-4）是一個多模态大語言模型，但它如何理解圖片，如何用 RLHF 微調，以及參數量規模、訓練數據和成本等技術細節，OpenAI 全部選擇隐藏。"

這一點上，對 OpenAI 來說，大模型賽道的技術長度，或者說依然暫未開發的未來進化空間是其優勢。

也就是說，如果 GPT-5 乃至 GPT-6 持續推出，考慮到 AI 進化的荷塘效應，這一可能性幾乎是必然的，開源模型能否繼續保持相對競争力尚未可知。

算力方面，就是堆錢，雙方均實力雄厚，不展開。

算據方面，我們認爲，存量數據的價值意義遠不如基于 AI 産品所産生的原生數據。

如果說存量數據是 "AI 小寶寶 " 看電視被動學說話，那麽原生數據便是 "AI 小寶寶 " 在與人直接交流。更即時的反饋，更快速地糾錯，以及更貼合實際應用的數據價值，自然更有利于 AI 的進一步進化叠代。

基于此，ChatGPT APP 的戰略價值進一步被放大。

而開源生态方面，則需要觀察垂類原生應用的進展情況。

正如，羊駝被洩露後，一衆 GPT 的平替爆發，知識蒸餾（通過将大型模型的知識轉移到小型模型中，從而快速達到想要的模型質量）的出現大幅降低了計算成本，某種程度上直接削低了加入開源生态的門檻。

那麽這一進展也将間接促進開源生态的進一步繁榮。

總體來說，雙方各有優勢。

閉源大模型不斷向上拓寬行業的天花闆，随着不可避免的技術外溢，必然将引領着開源大模型的持續發展。

另一邊，開源大模型則在迅速橫向拓展着 AI 生态的繁榮，這一繁榮所帶來的新增市場，也将被閉源大模型所共同分享。

目前仍處于市場越做越大的階段。

" 在競争中共同成長 "，極有可能是未來的主題。

三、基座之争收尾下一階段争什麽？

随着開源模型的出現，這也意味着大模型時代的基座鬥争已經進入了尾聲。

閉源方面，OpenAI 坐穩了江山，接下來它的對手隻有自己和技術本身。

短期來看，開源上手成本低，使用靈活，同時給予了中小型企業極大的自主性和安全感，短期内必将形成強烈的沖擊。

但中長期來看，随着開源項目組建的系統進展，依然會需要大量人力和資源來維護，其綜合成本同樣會持續上升，屆時 OpenAI 的市場可能又會迎來回升。

基于此，未來的形勢或許會反複，但巨大的反轉不太可能會出現。

開源生态方面，Meta 的 Llama 目前具有着明顯的優勢。

開源之後，Meta 将擁有更多的可訓練數據，開發人員能夠幫助 Llama 2 去發現和解決漏洞，并且能夠很快打開市場，爲未來的商業化鋪路。

紮克伯格在四月份與股票分析師的電話會議上表示，随着開發者采用和改進這些模型或修補他們的安全漏洞，Meta 将能夠将這些改進納入其自己的消費者和廣告産品的 AI 模型中。

當然，考慮到當前仍處于 AI 時代的極早期階段，應用級生态的建立仍需要時間去觀察。同時考慮到中國市場的這一變量，開源大模型或許在未來仍需要參加半決賽乃至附加賽。

随着開源這一最終殺器的祭出，這也意味着通用大模型基座維度的競争中，最大的變數已經落地。

此外，随着開源模式的出現，一個新的階段也将被徹底開啓。即，應用層産品的湧現。

在此之前，人們往往會質疑其商業壁壘的問題，比較知名的如投資人朱嘯虎所說：" 如果 90% 的能力是 ChatGPT 提供，那麽 AIGC 應用就沒有什麽投資價值。"

其潛台詞是，無論你成長得多麽大，你的利潤都可以輕易被 OpenAI 拿走。

但開源模型的出現徹底打消了這一顧慮。随着開源社區的爆發式增長，具備基礎能力的大模型正在迅速普及。供給側的繁榮使得大模型趨于白菜價。

此外，應用級企業自主研發的門檻也被降到了最低，企業的自主性将得到極大保障。

應用級企業被巨頭釜底抽薪的可能性消失了，寒武紀式的物種爆發近在眼前。

可以預見的是，接下來應用級層面的 Killer App（殺手級應用）将成爲行業中的下一個核心賽點。

而整個市場的競争重心，也将從 100% 的技術驅動，向着代表着用戶體驗的産品驅動傾斜。

參考文獻

[ 1 ] 《爲什麽開源大模型終将勝出？》OneFlow- Varun Shenoy

[ 2 ] 《谷歌沒有護城河，OpenAI 也沒有》SemiAnalysis

[ 3 ] 《小羊駝：訓練成本僅 300 美元的斯坦福開源模型，适合創業公司打造自己的 AI 模型》阿爾法工場 [ 4 ] 《OpenAI 即将開源新模型，但不是最先進的那個》新智元

[ 5 ] 《ChatGPT 時代如何創業》傅盛演講

[ 6 ] 《大模型創業 300 天：成者 100 億估值，80% 敗者出局》AI 鲸選社