頭圖來自:視覺中國
近期 OpenAI 動作頻頻,而且個個驚雷貫耳,接連爆出要自研芯片、要與蘋果前首席設計師一同打造 AI 硬件設備。
同時 ChatGPT 的更新接踵而至:接入 Windows、重新聯網,實現多模态交互,甚至做到了既能看圖、又能聽聲音、還能說話 ……
也就是說,OpenAI 的進化速度,越來越快了。
模型越牛,估值越高。在過去一年時間,OpenAI 的估值也從 260 億美元翻到了最高 900 億美元,在還沒上市的超級獨角獸裏僅次于字節跳動和 SpaceX,據稱 OpenAI 今年收入預計将達到 13 億美元,市銷率接近 70 倍!公司正在和投資者讨論用這個估值出售股份。
然而,這個全球關注的超級明星,現在卻有不小的煩惱。
說白了,就是雖然作爲一個超級估值獨角獸,但本身也是一個超級燒錢吞金獸,13 億美元的營收相對龐大的開支簡直就是杯水車薪,它如今不僅加緊要考慮未來商業化變現的路徑問題,還要應對來自後來者越來越步步逼近的圍堵競争。
在波谲雲詭的商業世界裏,産品化節奏和資金投入一出現問題,這場以底層模型爲支撐的平台遊戲都将舉步維艱。
随着 Meta、Google 等玩家強勢覺醒,Anthropic+Amazon 的組合加入攪局,被強敵林立環繞的 OpenAI 下一步該怎麽走?
一、代理人之戰
OpenAI 在模型層并不寂寞,即使站在塔尖,一統天下還言之尚早。
尤其在和微軟的聯盟讓科技大廠們意識到成熟的大模型技術将給雲計算帶來新的業務需求,一番新的混戰随着谷歌、亞馬遜的加速布局撕開了口子。
近期,Anthropic 接受了亞馬遜 40 億美元的投資,兩家公司将在基礎模型商用方面進行更深入的合作。具體而言,Anthropic 将使用 AWS 的雲服務,而 AWS 将把 Anthropic 作爲底層模型之一,接入剛剛推出的托管服務,用于構建生成式 AI 應用。
作爲開發者,可以從多個基礎模型中選擇,用自己的數據來訓練,然後将它們部署到自己的應用程序裏,就不再需要搭建服務器這麽繁瑣。除了亞馬遜自己的大模型 Titan,Bedrock 服務裏已經加入了多個基礎模型。
亞馬遜不會找 OpenAI,原因和谷歌是一樣的,微軟 Azure-OpenAI 的綁定讓三家在公有雲市場上又多了一番變數。明着看是對下遊的押注,其實都是在給自己業務拉活兒。
亞馬遜、微軟和谷歌三家對公有雲市場形成了寡頭壟斷的局面。根據 Statista 的數據,今年二季度,AWS 、Azure 、Google Cloud 份額分别爲 32%、22%、11%,三家合計穩定在 65% 的份額。
找大模型行家合作還不夠,爲了更好地給模型開發者提供服務,同時少受英偉達牽制,科技大廠還必須自己做芯片。
與 OpenAI 使用英偉達芯片訓練不同,Anthropic 将采用亞馬遜自研的 Trainium 和 Inferentia 芯片來訓練。
大模型競賽從底層要求看,首先是算力競賽。
大廠自研芯片的努力逐漸在實現,既爲了降低成本,也想增厚自己出租服務器的利潤,多收獲像 ChatGPT 這樣的開發項目。
亞馬遜很早就開始把自研芯片往服務器堆;谷歌有 TPU,并且已經給另一家圖像模型的創業明星—— Midjourney 使用;據外媒報道,微軟也可能于下個月發布自研的 AI 芯片。
其次,巨頭們對大模型的想法,其實都在财報上說得明明白白。
他們的半年報裏已經反映了客戶對于生成式 AI 需求激增的趨勢,ChatGPT 掀起的大模型熱已經消化得差不多了,下半年科技巨頭開始圍繞自家應用層的生産力工具,完善增值服務。
比如微軟通過與 OpenAI 合作,率先将 AI 能力賦能到自己的應用全家桶。
Copilot 是微軟将 AI 融入産品矩陣的平台,被定義爲 " 日常 AI 伴侶 ",将作爲一個應用程序在微軟操作系統中使用,微軟從上個月起已經将其加入到 Win 11 的更新中。
面向 B 端的 365 Copilot 企業版也将于 11 月 1 日正式上線,正如我們上半年見到的,各類辦公軟件屆時将接入 AI 助手爲我們進行一些自動化操作來提高工作效率。
收費上幾乎完全對标了谷歌,這筆增值訂閱費用是除企業用戶已經支付的生産力套件訂閱費用外的額外費用。在今年 8 月谷歌 Workspace 推出的 Duet AI 同樣也向企業客戶收取 30 美元 / 月的費用。
Workspace 收入屬于 Alphabet 的 Google Cloud 類别,與 Google 的雲基礎設施一起今年二季度産生了 80 億美元的營收。在同一時期,微軟的 Office 産品和雲服務爲其帶來了 135 億美元的收入。
作爲 Anthropic 較早的投資者,谷歌雲搭建的 AI 平台讓用戶能夠部署和擴展機器學習模型。今年 4~7 月短短三個月的時間,谷歌雲的生成式 AI 項目數量增長了 150 多倍。
值得注意的是,和亞馬遜一樣,谷歌也選擇了多模型路線來擴充 B 端客戶的不同需求,包括引入 Meta 的 Llama 2 和 Anthropic 的 Claude 2 來擴充。同樣的,Llama 2 也将通過微軟雲服務進行分發。
兜裏不缺錢的大廠擁抱多模型并不稀奇,因爲暫時很難笃定哪一類模型将會有更好的應用前景,區别是他們并非站在模型創業者的立場思考,而是以戰略合作者的身份想去擴大自己的雲服務生态,整合中間模型層給自己的産品賦能。
随着訓練成本和調試模型的門檻進一步降低,模型—工具—應用各個層面應該會不約而同地湧進去一大批創業者,其中還包括大廠們現有的客戶,與其研發大模型去開發新的應用,還不如實實在在地收割這批新的需求來得經濟實惠。
另一方面,這有點像幾年前國内兩家互聯網大廠在各個領域掀起的代理人大戰,利用新技術在搜索引擎以及生産力工具不同領域向彼此發起沖擊。
正如微軟總裁納德拉所說:" 我們想讓谷歌跳舞。" 有了 OpenAI 的微軟,市值從 2022 年的 1.79 萬億漲至如今的 2.5 萬億,股價一度創下曆史新高。
二、OpenAI 的選擇
ChatGPT 剛出來的時候,大家都驚覺這是科技界新的 iPhone 時刻,将目光聚焦在背後的 OpenAI。
一個非盈利性,副線任務是與谷歌抗衡的人工智能研究機構,開發出了一款兼具實用性的 AI 聊天機器人,标志着一隻腳邁出象牙塔,正式踏入了商業世界。
諸如 AI 工具解放生産力,将人類從重複性勞動解放,再到賦能千行萬業、第四次工業革命等等宏大的叙事,配合 ChatGPT 網頁井噴的流量,OpenAI 的估值先坐上火箭蹿升。
這時的 Open AI 已經形成流量入口,加上 api 模型工廠組成的商業模式,而谷歌還在驚愕中醞釀着反擊。
也因爲 Killer Apps 還不多,在 ChatGPT 向世人嶄露頭角的時候,大家都在猜想 OpenAI 未來是否将統治整個模型層,參考的是操作系統、搜索引擎這種幾乎壟斷的市場。
但其實連 Open AI 自己都不這麽想。
在他們的 CTO 米拉 · 穆拉蒂看來,平台遊戲能夠玩下去的要求,就是讓盡可能多的人使用他們的模型,無論是 to B 還是 to C,但人們并不總是需要使用最強大的型号來滿足自己的需求。
作爲勁敵的 Anthropic 由原來 OpenAI 的研究主管 Dario Amodei 等人出來自立門庭,他們的底層分歧隻是對 AI 商用化和安全性存在不同見解,但同時有一點是同一批來自象牙塔裏的人共同笃信的,那就是規模法則(Scaling Law),在未來很長一段時間還會繼續發揮着魔力。
在 Transformer 架構成功融入模型訓練中後,數據規模超線性地增長驅動了模型性能的湧現。這就是說,模型參數規模越大,進步得越明顯,這是支撐 GPT3.5、GPT4、GPT5 甚至以後 6789 的信仰。
然而,開發頂級 LLM 模型的難度不小,代價不菲。GPT 不斷叠代會讓模仿者望塵莫及,當訓練一個更高層級的 GPT 模型花費成倍級增長時,資本需求自行創造了一定的準入壁壘,在這一層面上沒有多少公司能夠參與競争,模型叠代速度決定了 Open AI 和其他勢力的追趕差距,而規模法則助力了這一點。
正如台積電每一代制程升級的成本代代叠升,技術壁壘和花費跟上一代都拉開了巨大差距,但實際上大多數電子産品根本用不上最頂尖的芯片,也因爲廣泛的需求,落後好幾代的制程芯片能以更低的成本使用。
類似的,大模型領域将來可能也會出現這樣一種格局,Open AI 或者 Google 作爲最頂尖的大模型是極度稀缺的,在某些功能上遙遙領先,而總是落後一代的模型,可能要跟實際使用需求融合得更貼近。
最終兩三個最通用的模型可能會站在塔尖,孕育出無數個定制化小模型和應用,這也是 OpenAI 不願意錯過的商業機會。
幾天前,公司剛升級 Fine-tuning 用戶界面,不用寫代碼,上傳訓練數據就可以微調大模型, 通過額外的訓練,可以讓已經訓練過的大模型更好完成特定的任務,比如用你自己的風格寫文章的大模型。這就是要一步步把中遊工具層吃掉的意思。
成爲平台玩家之後,OpenAI 同樣不可避免地要應對商業競争和自身盈利的要求,經營大模型的成本花費不菲也曾令 OpenAI 變現的壓力驟增。
數月以前,Analytics India Magazine 的一份報告中稱,OpenAI 僅運行其人工智能服務 ChatGPT 每天就要花費約 70 萬美元,絕大部分花費主要來自高昂的 GPU 以及人才成本。
GPT3.5 爆火後,OpenAI 一步步開始構建商業化流程。先是推出 ChatGPT Plus 收費版,再有 ChatGPT 商業版,爲了增加營收,OpenAI 還多次調整了 GPT-4 的訪問限制。
同期 meta 和 Google 相繼發力給 OpenAI 帶來不小的壓力。其中針對了 Google 即将發布的 Gemini,察覺到威脅的 Open AI 就已經搶先爲 GPT4 增加圖像能力。在接下來的 11 月 6 日,OpenAI 開發者大會上還将公布 " 偉大的新工具 ",外界紛紛猜測那會是 GPT-5。
來源:ChatGPT APP
根據 The Information 爆料,OpenAI 在 2022 年虧損達到 5.4 億美元,但今年營收就能達到 13 億美元。才短短 10 個月的時間,多套組合拳的配合讓 OpenAI 完成了由虧轉盈,10 億美元,原是 CEO 奧特曼年初對 2024 年的目标。
截至 7 月份,ChatGPT Plus 付費用戶達到了 200 萬;在 B 端市場,企業版 ChatGPT 已經被超過 80% 的财富 500 強公司團隊采用。
但處在金字塔尖的模型叠代所需要的算力估計每年都會上升一個數量級,随着應用場景變得更廣,這會讓不同的專有模型數量倍增,進而大大提升模型部署所需要的算力。
根據機構分析,如果 ChatGPT 的訪問量達到谷歌搜索十分之一的水平,那麽每年 OpenAI 的 GPU 開銷将達到 160 億美元,這樣的開銷未來可能是阻止 OpenAI 進一步規模化的重要瓶頸。
OpenAI 自研芯片和特斯拉研制 Dojo 實際上很相似,針對性非常高,降本空間也很大。憑借公司對模型的積累,能夠根據模型的需求去明确芯片的設計指标,而且對于模型版本有着明确規劃,不至于出現芯片量産之後模型已經領先一代的局面。
正因在高性能計算芯片領域,算法和芯片架構協同才是主要的性能提升動力,OpenAI 在這方面處于一個比較有利的地位,憑借對算法的深刻理解,公司有望充分利用 Huang ’ s Law 做出芯片。
OpenAI 還有一項很重要的動作,可能來自應用端的延伸。ChatGPT 是公司第一個 Killer App,但聊天機器人的應用場景比較局限于文字交互。多模态的降臨再度豐富了應用落地的想象力,不過被 meta 搶先實現了。
Meta 上月末公開發布的這款價值 299 美刀的 AI 智能眼鏡搭載了 AI 助手 Meta AI,内置攝像頭,在功能上實現了多模态交互,能玩的事情就比較多了,比如,旅行時講解各種地标建築,翻譯多種語言菜單,指導維修水管,還支持第一視角的在線實時直播。
與蘋果前首席設計師喬納森一起研發的 AI 硬件,很可能就是一款支持 GPT4 甚至 5 的智能眼鏡,但對終端芯片的要求更高了,這次再次看到了OpenAI 可能借由硬件布局從定義模型層到産品應用層的潛在路徑。
三、尾聲
總的來說,多模型的趨勢對于 Open AI 也許是壓力,也許是機會,技術叠代遠遠未至極限,如何突圍并引領市場規模增長将會是它面臨的主要挑戰。
在 ChatGPT 誕生的大半年裏,也不乏像數據洩露安全,侵犯版權這樣負面事件影響人們對 AI 工具的信心,對這些彎彎繞繞,對人工智能的未來,OpenAI 沒有明确的計劃來應對。
當初 Sam Altman 一批人集結起來的第一個問題就是 " 我們要做什麽 "。
如果大模型也有着類似自動駕駛等級的劃分,那我們現在或許還處在 L1 到 L2 的階段,而當初這批熱血科學家個個都想做出 AGI,但究竟會不會有 L5 這個層級,沒人敢打包票。
OpenAI 和它的競争對手們都身處在同一片迷宮裏。
用 Altman 的話說,他們當前的狀态,就是每次走到拐角的地方,就拿手電筒照一照,最終到達終點。
本文來自微信公衆号:格隆彙 APP (ID:hkguruclub),作者:弗雷迪,數據支持:勾股大數據