圖片來源 @視覺中國
文 | AI 大模型工場,作者|星奈,編輯|方奇
如果有無數隻猴子,并且它們有無盡的時間,那麽這些猴子就有可能打出完整的《哈姆雷特》。
想象一下,如果我們将這些打字的猴子比作一個能夠生成随機字符的程序,而将《哈姆雷特》看作是一個按照一定規律排列的字符序列,那麽無限猴子的原理就與現在的大型 GPT 模型非常相似。
出門問問自研的大模型 " 序列猴子 " 的名字就來源于此。我們隻需要給機器提供大量的文本序列,然後通過強大的計算能力進行訓練,最終就可以得到一個擁有智能的 " 序列猴子 " 大模型。
今年 4 月誕生的 " 序列猴子 " 在經曆 8 個月的生長後正在成爲出門問問的王牌産品,此時,出門問問正憑借 " 序列猴子 " 沖刺港股 "AIGC" 第一股。
中國證監會國際部于 12 月 21 日披露了關于出門問問的境外發行上市備案通知書。出門問問已完成港股上市備案,或很快進行上市聆訊,此外,出門問問将計劃發行不超過 2.2063 億股普通股。
雖然過去一年大模型炙手可熱,但港交所仍未出現 AIGC 概念公司。如果此次成功上市,也就意味着,出門問問将成爲港股 "AIGC 第一股 "。
大模型經過近一年的野蠻生長,基礎模型的競争已經告一段落,應用落地的序幕剛剛拉開。在大模型所帶來的變局中,出門問問在一衆大模型公司中優勢在哪裏?能否成功上市?面臨的挑戰又有那些?以及如何構築自己的護城河?
第二次沖刺港股上市
早在今年 5 月 30 日,出門問問就第一次遞表港交所,試圖沖擊 "AIGC 第一股 ",後于 11 月底失效,并于第二天更新招股書,中金公司與招銀國際爲其聯席保薦人。
而這一次,出門問問的上市之路注定不易。
出門問問成立于 2012 年,由李志飛帶頭成立。李志飛是美國約翰霍普金斯大學計算機科學博士,曾任職于矽谷研究院,從事語音識别、自然語言處理、機器翻譯等領域的核心算法研究和開發。
公司以生成式 AI 和語音交互技術爲核心業務,是爲數不多的具有建立通用大模型能力的 AI 公司,也是是亞洲最早開發和商業化生成式 AI 大模型的公司。
據招股書顯示,出門問問從 2013 年至 2019 年間共進行了 7 輪融資,融資總額超過 2.3 億美元,投資方包括紅杉資本、海納亞洲創投基金、真格基金、Google、大衆汽車集團等知名企業及投資機構。
該公司的估值也從 A 輪融資的 510 萬美元,飙升到 D2 輪融資後的 7.57 億美元,估值暴漲 140 多倍。
在資本的強力助推下,出門問問業績發展迅猛。從财務上看,2020 — 2022 年間,出門問問營收爲 2.65 億元、3.98 億元、5 億元,對應經調整淨利潤分别爲 -1.57 億元、-0.73 億元、1.09 億元。
不過到了 2023 年上半年,出門問問營收、利潤雙降。據最新招股書顯示,出門問問上半年營收爲 2.62 億元,經調整利潤爲 6509 萬元,相較去年同期,該兩項指标分别下滑 23.7%、63.3%。
究其原因,主要系智能設備及硬件業務和車載業務收入下滑的影響。
目前,出門問問的業務可分爲兩大模塊:AIoT 解決方案以及 AI 軟件解決方案。
出門問問将 TicWatch 系列智能手表、智能跑步機、智能家居等産品納入 AIoT 智能設備業務。在 2022 年之前,是出門問問的核心業務,2020 和 2021 年分别貢獻了 83% 和 85% 的收入,2022 年,AIoT 解決方案在營收中的占比大幅下滑,至 39.4%。
AI 軟件解決方案包括面向内容創作者的 AIGC 解決方案以及針對企業的 AI 軟件解決方案。
具體來看,面向内容創作者的 AIGC 産品包括 AI 配音助手 " 魔音工坊 " 及其海外版 "DupDub"、AI 寫作助手 " 魔撰寫作 "、AI 數字人 " 奇妙元 "。
在 B 端,出門問問爲汽車、金融行業等多個行業提供人性化、智能化的 AI 語音交互解決方案。但事實上,該業務主要是爲汽車附屬 A 服務。招股書顯示,2021 年 -2023 年 6 月,來自于公司向最大客戶 A 的收入占比總收入的 0.8%、42.6%、53.0%。外界不少聲音猜測,此處的大客戶 A 即爲大衆汽車。
而 2022 年合作收入劇增源于 2021 年底雙方簽署的一份知識産權協議,即出門問問爲大衆汽車提供汽車語音交互解決方案等服務,合約金額 5500 萬美元。
随着今年 6 月該知識産權協議的結束,出門問問在車載市場長遠發展的穩定性堪憂。
押注序列猴子,用大模型增勢
在招股書中,出門問問提到 AIGC 近 250 次,公司對大模型的重視程度可見一斑。
李志飛可以說是中國最早一批關注到 GPT-3 的人,2020 年 6 月,GPT-3 出現後,出門問問就開始探索中國版的 GPT。他曾在多個場合表示:"GPT-3 是暴力美學的一次勝利。"
2021 年出門問問正式發布大模型 "UCLAI",但由于難以在商業化落地和研發成本之間找到平衡,便停止了對大模型的投入。直到 ChatGPT 橫空出世,AIGC 成爲炙手可熱的新興賽道,出門問問重拾大模型研發,并于今年 4 月推出大語言模型 " 序列猴子 "。
再次出發的出門問問,似乎對如何做大模型、以及如何實現商業化都有了全新的思考。
在大模型建設層面,多模态能力成爲出門問問發展大模型關注的重點。李志飛表示,大模型最終要産生各行各業的應用的話,一定是要通過 Agent 或者 Copilot 的方式去落地。而 Agent 的輸入輸出都依賴于多模态,沒有多模态,就沒有 Agent。
出門問問推出的 " 序列猴子 " 不僅限于語言能力,更是一款具備多模态生成能力的大語言模型。該模型不僅具有邏輯、推理、對話等通用語言能力,還能夠同時支持文字生成、圖片生成、3D 内容生成、語音生成和語音識别等不同任務。
李志飛認爲未來,大模型最好的 " 工作 " 是做人類的 CoPilot (助理),并預測 CoPilot 将會無處不在,在創作者、C 端、B 端将會有廣泛的應用。
在商業化落地層面,出門問問正在探索兩種新的商業模式:To PC(professional consumer),專業個人;To SMB(small and media business),中小型企業,即更關注創作者和小 B 端的商業化機會。
目前,出門問問 To PC 的商業化路徑已經較爲清晰,盈利模式也相對成熟,采取按月付費 + 按使用量付費的混合模式。官方數據披露,截至 2023 年 11 月 28 日,出門問問的魔音工坊、魔撰寫作、奇妙元等 AIGC 産品擁有超過 800 萬名累計注冊用戶,以及約 60 萬名累計付費用戶。
在小 B 端,出門問問主要提供定制大模型服務,提供個性化解決方案。目前已與春秋航空、趁早、中國移動、中國電信、易車 APP、中國工商銀行、VIPKID 等 500 餘個行業客戶開展合作探索,覆蓋企業咨詢、教育培訓、出海産品介紹、口播短視頻、直播等多類場景。
出門問問在大模型領域正在積極探索,但是能否真正跑通還有待時間驗證。
出門問問的故事怎麽講?
大模型的發展前景無疑具有巨大的想象空間。
出門問問在招股書中提到,根據灼識咨詢,按收入計,預計到 2027 年,中國 AIGC 市場規模将達 326 億元,2022 年至 2027 年的複合年增長率爲 136.3%。
水大魚大,縱使大模型商業前景還是一片藍海,但是大模型研發 " 燒錢 " 是不争的事實,目前沒有幾家企業能夠真正利用大模型賺錢也是事實。
以 LLaMA-13B 版本爲例,按 Meta 論文中的數據,其預訓練用 A100(80GB 顯存),跑 13.5 萬 GPU 小時。假設 1000 張卡,跑 135 小時,相當于 5 天半左右。而這 1000 張顯卡就差不多 1 億人民币。如果再加上其他硬件服務器、數據中心、電費、研發人員的成本,大模型預訓練的資金門檻就在幾個億到幾十億之間(對應百億級到千億級參數的模型)。
李志飛曾公開表示," 序列猴子 " 模型參數量約爲百億級别,可想而知其燒錢程度。盡管李志飛曾坦言出門問問近期不考慮融資,不需要外部融資也能支撐研發投入,但是深挖一下其融資進度就會發現,出門問問自 2019 年獲得最後一筆約 1687 萬美元的投資後,已經長達 4 年時間再未獲得過投資。
在最新的招股書中顯示,截至 2023 年 10 月 31 日,其現金及現金等價物隻有 1.598 億元。背後缺少資本支持的出門問問能走多遠?
除了現金捉襟見肘外,出門問問還需要應對激烈的外部競争。
ChatGPT 出現後,國内一年時間裏就誕生了 238 個大模型,百度、阿裏、騰訊、科大訊飛等大廠紛紛下場,并在 8 月份陸續面向社會開放。除了來自大廠的壓力,出門問問也面臨着來自同類型産品的競争。
面對如此多麻煩的出門問問,在沖刺港交所 IPO 之際,如何用現有資源構築自己的護城河,打消資本市場的疑慮?
如果說大模型上半場的競争壁壘是算力的壁壘,實際上是錢的壁壘,那麽進入到大模型競争下半場,數據和用戶或許能成爲企業新的護城河。
有人說垂直領域的數據積累是企業的護城河,并且可以利用數據飛輪加寬這條河。實際上,大家都很容易獲取的數據不是壁壘,用戶在自己産品中交互沉澱的數據才是壁壘,将數據與自己的産品相結合,形成數據飛輪,這才是比模型和算力更靠譜的壁壘。
具體到出門問問身上,無論是推出的 AI 智能手表、智能跑步機等智能硬件産品還是基于 " 序列猴子 " 推出的 " 魔音工坊 "、" 魔撰寫作 "、" 奇妙元 " 等 AIGC 産品,出門問問都在努力将用戶的使用數據和産品相結合,形成獨特的數據飛輪,以加深其護城河。
未來,随着大模型技術的不斷演進和應用場景的不斷拓寬,數據和用戶的重要性将會更加凸顯。對于出門問問來說,如何更好地利用數據飛輪效應,将其轉化爲可持續的競争優勢,将是決勝大模型競争下半場的關鍵。