AI 行業火了大半年,時至今日誰才是産業鏈裏的掘金人呢?
可以是給大模型訓練提供數據的供應商、可以是自由定價的 C 端産品,但唯獨不會是大模型提供方。
究其原因,如何選擇好的賽道,首先要有不錯的商業模式,其次是行業上下遊的議價能力,最後看利潤。
無論是選擇好公司還是好賽道都離不開以上三點。
接下來我們具體聊聊:
爲什麽大模型賽道不行了?
AI 行業湧現的機會在哪裏?
絕大多數的大模型企業要淚奔
爲什麽這麽說?
因爲,大模型企業很難滿足上述提到的重要三要素。
從年初,OpenAI 帶着 ChatGPT 震驚全世界,封閉大模型成爲主流;谷歌、百度等海内外一衆互聯網龍頭都紛紛怕掉隊,哪怕是産品還不成熟,都着急忙慌的出來路演,就像第一次面世的 Bard 讓谷歌跌掉了 1000 億市值。
後來,Meta 發布開源大模型 Llama,變成了開源大模型的鼻祖,開源大模型讓衆多企業、研發人員有了追趕 GPT 的機會(沒有開源,那隻會望塵莫及,畢竟通用大模型的訓練成本不是随便一家企業能承受的);
也正是因爲有了開源大模型,才讓大模型市場發展的如火如荼,有了今日的 " 百模、千模大戰。
但是,随之而來的是大模型企業所面臨的問題。
首先,各家大模型與 Open AI 的差距還是很明顯,留給其他大模型廠家的市場空間就已經很小。另外,市場上其餘可選大模型非常多,比如衆多開源衍生品,但産品同質化嚴重,這也就會導緻大模型在面對客戶時的話語權非常低,毫無議價權;
其次,大模型企業爲了優化輸出結果,還需要不斷的叠代模型,而這需要大量、專業的數據投喂進行訓練,因此數據企業提供方也會成爲制約大模型發展的重要角色。
最後,大模型的訓練成本很高不說,想要做出超強大模型還得拼算力,也就是看誰能搶到更多英偉達 A/H100 芯片;
另外,在大模型定價方面隻會越來越難,開源已經是常态了,連 openAI 最近也要開源新的大模型了,如果 GPT3.5 開源,那對于其他大模型廠商來說可謂是毀滅性的打擊。
對于大部分的大模型方來說都面臨着一邊難收費,一邊要拼命花錢訓練模型,以後數據也會開始收費(又多了花錢的渠道),怎麽想大模型都不是一個看起來能輕易盈利的商業模式。
未來肯定很多企業會放棄這條擁擠、又不賺錢的賽道。除非是能追上 GPT4 的水平,真正做到讓用戶覺得好用,才會有絕對的競争力。
數據運營商的春天要來了
上文提到,扼住大模型發展的除了 AI 芯片,那就是訓練大模型必不可少的數據。
我們認爲,數據運營商将迎來發展的黃金期,不過還要适當考慮各國情況的差異性(這裏不做展開)。
數據是新型生産要素,這句話在大模型這裏得到非常好的體現。
值得關注的是,數據商将成爲行業賣水人。
谷歌最近就因爲非法搜集用戶數據用于訓練 AI 模型,被美國加利福尼亞州克拉克森律師事務所起訴,要求向用戶賠償數據使用費和告知數據用途。
數據價值已經開始顯現。
近日,海外 Prolific 公司不僅獲得 3200 萬美元融資,還賺了 1 億 + 美元的數據提供費用;每小時價格在 6 — 8 美元或更高。
也就是說,Prolific 這種爲企業或個人提供的數據是可以用于商業化并且具有版權的。這一點對于大模型廠商來說非常重要,能夠很好避免産生數據版權的糾紛。
Prolific 已獲得了 3000 多家知名組織,其中包括谷歌、牛津大學、斯坦福大學、倫敦國王學院和歐盟委員會等。超過 2 萬名科研人員在其平台上獲取高質量數據。
Prolific 也表示,高質量、真實訓練數據對于 AI 大模型來說能夠減少幻覺、非法輸出、增強 RLHF 能力。
我們認爲,數據運營商在大模型上的商業價值才開始顯現。
C 端應用是 AI 流量必争之地
哪裏有流量,哪裏就有财富。
之前業内都在讨論到底是封閉大模型還是開源大模型的生态會更好,哪個模式的商業價值更勝一籌;
最後得到的結論是:開源還是封閉其實不是最核心的問題,關鍵在于如何形成好的數據飛輪效應。
最近 " 數據飛輪 " 這個詞在科技圈内非常火,簡單來說是一種描述數據價值增長的循環過程。
在互聯網時代我們看到數據量的激增,而在 AI 時代數據爆發将遠超上一次。
如果從産品落地和價值變現的速度來看,那麽 C 端應用定是巨頭必争之地。
無論是微軟用 Microsoft 365 Copilot 開啓辦公 AI 時代、Windows11 即将内嵌人工智能助手颠覆每個人操作電腦的習慣;
還是一直在内卷的 AI 繪畫、和即将開卷的 AI 視頻;
C 端應用往往比 B 端更容易落地、也更容易變現,核心在于 C 端産品更标準化;
而 B 端的場景、訴求更多,很難統一,這也就導緻了落地進度更難,更别提還有很多隐私數據、know-how 等專業内容要考慮。
這也就爲什麽在國内互聯網流量紅利期賺的盆滿缽滿的是阿裏、騰訊、字節這樣的巨頭,因爲他們掌握了 C 端流量,而工業互聯網企業都活在了 " 貧民窟 ";
誰掌握了用戶流量、産品定價,現金收入便是有了保障,同時還能獲得廣告商的青睐;
另一方面,想要做 C 端應用的企業還有很多大模型可供選擇,就好比金山辦公已經開始這麽做了,基于三種大模型之上來調度,根據任務選擇性能最優的大模型。
總得來說,C 端一定會成爲 AI 行業最先變現的賽道。
本文作者:韓楓,來源:硬 AI,原文标題:微軟、谷歌、Meta:AI 巨頭「三國争霸」| 【硬 AI】;
未經授權不得轉載。