在年前的一場生成式 AI 閉門會上,一位前 "AI 四小龍 " 之一的研發負責人表示:在我看來,今年(2023 年)的情況并沒有什麽不同呀,過去 AI 公司碰見的問題,今天仍然沒有解決啊。
如果财報會說話,恐怕會十分同意上述觀點。雲從科技 2023 年财報顯示,總營收爲 3.46 億元,同比下滑 24%,而淨虧損則達到 4 億元。截止到 2023 年 6 月,商湯科技在收入不變的前提下,毛利率下降了 21%,對比 2022 年同期 2% 的虧損,情況也不容樂觀。還未上市的 AI 企業用估值代替财報面對市場,因此還顯得十分光鮮,但老大 OpenAI 似乎也在告訴大家:這事兒沒那麽簡單。
過去大家認爲 AI 技術爆發的奇點在于,在某項工作上超越人類。但當計算機視覺的人臉識别準确率超過人工,從業者卻赫然發現,這個市場并不大,公司還是在虧損。
世界往往就是這麽骨感:AI 的技術突破了,但商業沒有,AI 企業的生存能力仍然堪憂。在這種情況下,大模型的驚喜就像一位藥性極猛的補藥,很容易導緻 AI 企業 " 虛不受補 ":龐大的算力要求、超高的團隊工程能力要求、極高的數據要求,令企業現金流雪上加霜。
一種強顔歡笑式的焦慮,成爲了今天國内 AI 産業的底色。由于估值過高、技術還不夠成熟,業内有投資人向虎嗅反饋,大家對 " 水面上 " 的項目望而卻步。許多創業公司也不對自己的未來抱太好期望,包括時下最熱門的賽道:AI 視頻生成。
隻有紅棉小冰(簡稱 " 小冰 ")是個特例。對比行業,他們同樣沒有盈利,公司員工也僅僅維持在數百人的規模,但綜合筆者與小冰公司的幾次交流情況來看,他們對公司的未來保持着驚人的樂觀,且選擇的路線——不管是技術、産品,還是商業路線,與許多大模型或 AI 公司大不相同,簡直可以用 " 另類 " 來形容。
小冰于 2024 年 1 月 4 日宣布大模型國内通過備案,其對外公布的資料不包含 B 端客戶規模、毛利等數據,但提及小冰開發的數字員工複購率在 80% 以上。在 To C 層面,小冰 X Eva APP 在測試期内吸引超過 80 萬名創作者克隆自己并向粉絲私域發布。在這些創作者中,全網 50 萬粉絲以上的大 V 網紅克隆人已超過 1000 人,創作者本人全網粉絲總量超過 7 億人。
這是一家十年間未改變過産品路線的公司,小冰将自己定位爲人工智能平台公司,其産品形态就像 AI 界的 MCN 機構,一直憋着勁的制造 AI Being ——一種和傳統産業概念不盡相同的新型數字人。
随着備案通過、靜默期退去,這家 " 又新又老 " 的 AI 公司,以一個 " 新物種 " 的身份,突兀的出現在了國内的大模型市場。
小冰的終極野望: AI Being
當元宇宙的概念死掉,數字人的概念卻還活着。如果嚴肅看待數字人市場,那麽今天的大部分 B 端數字員工可以換個名字:高級 AI 客服。
以 IDC 2022 年發布的一份《中國 AI 數字人市場現狀與機會分析,2022》報告爲例,浦發銀行的數字人規劃包括四點:數字人客服、文檔審核數字員工、内部培訓場景的 AI 數字員工、對客交互和銷售領域的 AI 數字員工。
圖片來自 IDC 報告:《中國 AI 數字人市場現狀與機會分析,2022》
細一琢磨,裏面有待商榷的問題很多。
所謂對客交互,實際還是對産品特性的解答,本質和客服是一樣的。至于文檔審核,則并不屬于數字人的産品特性,這是 AI 産業發展之初就具備的老功能。而内部培訓則聚焦于形式改變,培訓形式并不是痛點,主觀意願才是。從文本閱讀變成虛拟互動,反而不利于高效閱讀和記錄。員工不是小孩子,不是必須看着學習機才能學習。
這種換湯不換藥式的數字人研發與交付,也是當下 AI 公司盈利困難的原因之一。所謂的 " 百億級市場 ",甚至并沒有給某一家頭部公司,帶來億級的營收。
在商湯此前發布的白皮書及一系列演講中,被列爲 L4 級數字人,即實現部分智能化交互,在垂直領域創新服務模式。
圖片來自商湯科技對外演講
商湯在 2023 年 10 月的一則采訪中對外表示,現在商湯的虛拟人在工商銀行 APP 的數字模式中,可以接近 L4 級的使用體驗,但智能性還有差距。
可以看出,同爲數字人賽道的頭部廠商,小冰和商湯在所謂的 "L4 級虛拟人 " 上,都有成單客戶,但同時又不足以畫出商業大餅。
C 端場景目前是數字人的主陣地,2023 年 KOL 群體中最流行的事情,就是構建一個數字化的自己,代替真人出鏡拍攝短視頻。但這隻是低端玩法——對于成熟的 KOL 來說,構建數字人錄視頻,未必就比真人錄制節省了多少時間,且視頻效果還要進一步打折。
BiliBili 已經出道的、擁有 350 萬 B 站粉絲的虛拟偶像 " 洛天依 ",看起來是更高端的玩法。
而對于小冰而言, " 數字人 " 是命脈,其産品沿革,貫穿小冰公司的整個發展史。因此,小冰在這一産品上的的野心奇大無比,同時頗有點 " 傲嬌任性 "。
在采訪中,李笛用 AI Being 而不是數字人來形容小冰公司的數字人,他強調,AI 的未來在于爲用戶或客戶創造有情感價值的 AI Being,而不是隻在工具層面提供輔助的數字人。這種 AI Being,甚至要參與分成——從 AI Being 薪資中分潤的錢,是小冰新商業模式的一部分。
這意味着,ChatGPT 塑造的全知全能形象,隻是小冰規劃中的一部分。小冰公司理想中的 AI Being,會像真人一樣,有不懂的問題,有性格,有脾氣,會耍賴。通過圖靈測試,這是小冰在技術層面的終極目标。
李笛表示,小冰對數字人的定義包含六個維度:
1. 它必須有自己的性格;
2. 具備相應的知識體系;
3. 有對應的生物學特征;
4. 有創造力,享有獨立的知識産權;
5. 有完成特定任務的能力;
6. 有足夠多的落地場景;
他繼續補充道:" 之前不是有一個視頻,有一個用戶跟 GPT 說,自己是唐僧主治醫師,給唐僧割痔瘡,問 GPT 吃這個痔瘡能不能長生不老。視頻裏,GPT 給了一個非常好的回答,這個從回答的角度是好的,但離真人還有巨大的鴻溝——真人根本不會搭理這種問題。"
這樣的标準,放在任何一家公司身上,都可能被視爲 " 講故事 ",但偏偏在小冰這家另類的公司身上,被執行的有闆有眼。
除官方公示的落地案例以外,小冰曾先後發布小冰島、X Eva 兩個 APP 用來實驗 AI Being 環境下的社交行爲和粉絲經濟。在這兩個 APP 中,AI Being 會在一個群聊内彼此互動,會發布朋友圈,并互相留言回複,真人用戶的行爲,隻是他們 AI 社交之間的一部分。X Eva 逐漸成爲一個 AI 版的微信,小冰用其驗證 AI 克隆人的粉絲經濟。同時,小冰聯合網易雲發布了 X Studio,像 MCN 機構一樣集中孵化 AI 歌手,B 站的洛天依就入駐了這個平台。
不管是粉絲經濟,還是 MCN ,小冰将自己的盈利模式定位爲來自 AI Being 的收入分紅,這意味着小冰搖身一變,成了一家有着大量被動收入的 AI 公司,其未來的增長動能,是在粉絲經濟,而不是 API 調用,這是其 " 小冰式樂觀 " 的誕生源頭。
圖片來自 X Studio 官網
如果單純品評邏輯,這種商業模式似乎沒問題。如果從産品和技術兩個維度切入,則還有隐患需要處理。
在産品層面,他們的隐患在于要驗證 AI Being 是否爲真需求,李笛用三類典型場景來描述自己的産品價值:
1. 幫助一個真人偶像更好地與粉絲互動,比如記住每一個粉絲的名字,在作品評論區即時與粉絲互動;
2. 當一個真人偶像分身乏術時,他可以構建一個數字化的自己,出席活動、完成直播;
3. 當你在物理上,不可能與某人進行互動時,爲對方構建一個數字人,比如去世的親人。
在技術層面,小冰面臨的挑戰很大,一個與人類高度趨同的 AI 意味着,它的 EQ 表現有時比 IQ 表現更爲重要。
另類的大模型建設思路
這比當下主流的 Chat Bot 更複雜,它意味着深刻理解真人對話中的 " 暗邏輯 ",有時懂要裝作不懂,能回答但要考慮怎麽回答,目前在海外比較流行的 Pi 也在主攻這個目标。Pi 是由 DeepMind 前聯合創始人 Mustafa Suleyman 創建的公司 Inflection AI 開發的應用,主打的是一個陪伴。這個 Chat Bot EQ 很高,會很認真的傾聽你的訴苦,并安慰你、給你相應的建議。
但兩家公司曆史沿革不同,也因此造就了不同的風格。Inflection AI 創立于 2022 年,因此 Pi 的風格仍然是強烈的 ChatGPT 色彩—— EQ 很高,但同時全知全能。Pi 的形象更像一個知心鄰家姐姐,它理解你的一切苦惱,回答你的一切問題。但小冰創立與 2014 年,這十年間的 AI Being 以虛拟偶像和 AI 女友爲标志性應用,這使得小冰的 AI Being ,在 C 端上的表現,更像一個小你至少 3 歲的少女,耍賴和情緒化的表達是常态。
圖片來自 Pi 的對話界面,非常柔和、善解人意
對小冰的觀察進行到這裏,令人垂頭喪氣——當你以爲找到了小冰所處的生态圈,卻發現它走着走着,就又偏離了常規路線。
Inflection AI 走的是标杆式的 2023 大模型公司發展路線:完成十億美元以上的巨額融資(當前總融資超過 15 億美元),與英偉達保持良好的關系(英偉達直接參與最新一輪融資),以 OpenAI 的競争者身份出道并展開強硬對決。
有報道稱,Inflection AI 現在手握超過 2.2 萬塊 H100,将用于構建全球最大超算集群。目前最新發布的 Inflection-2 大模型,雖未透露具體模型參數,但其聯合創始人 Mustafa Suleyman 在一次對外采訪中透露,他們可以 " 用相當于 GPT-4 1/15、1/20 參數大小的模型實現和 GPT-4 相同的功能 "。GPT-4 包含 1.8 萬億參數,那麽樂觀估計 Inflection-2 的參數規模在 900 億左右。這還不是終局,Inflection AI 對外表示有信心在一年内,将 Inflection-2 的模型參數再提高兩個數量級。
但小冰不一樣,這個 " 嬌蠻公主 ",拒絕參加這場硬件大戰。
微軟對 OpenAI 的投資最早可追溯到 2019 年,而且金額不小(10 億美元)。而小冰和微軟的拆分,發生在 2020 年 Q3。即使是拆分,也不太可能完全阻斷從微軟到小冰的信息通路。因此,OpenAI 的進展對于小冰而言,理論上并不是個秘密,說小冰是全世界最早一批見識 GPT 能力的公司,也不爲過。
但小冰裏裏外外的發聲,歸結起來,都在重複着一句話:" 我們不卷模型尺寸。"
小冰的一個主戰場在日本,并單獨在日本設立了獨立的産研團隊,構建了 Rinna 大模型,在 Hugging-face 最受歡迎日本開源模型裏,占據了過半席位(各版本同時入選),從榜單來看,小冰大模型最大尺寸是 14B,即 140 億參數。但 3.6 B 的模型才是其征服日本市場的主流版本。
圖片來自 Huggin Face 官網,rinna 模型在 "Most likes" 排名中占半數以上
3.6 B,對比 GPT-4 差了兩個數量級,這甚至不滿足一些行研機構劃定的百億參數門檻。李笛的解釋是:" 我們很早就了解了 GPT-4 的表現和情況,目前從技術上判斷,要出現下一波能力湧現,需要在 GPT-4 的基礎上,把參數規模再提升三個數量級。這是什麽概念?這意味着不光是算力遇到了巨大的挑戰,工程層面也挑戰巨大。所以目前内部達成共識的結論是:這一波技術突破差不多接近尾聲了,2024 Q1,生成式 AI 的技術框架會基本确定,接下來的空間是留給應用的。不要過于樂觀的期待生成式 AI 連續出現巨大突破。"
另一個問題在于,小冰對于 OpenAI 的算力消耗,體悟更爲真實——微軟以算力代現金的方式入股 OpenAI 的消息,在業内廣爲流傳。而據業内人士稱,高峰時控制着全球近半算力的微軟,被 OpenAI 榨到油盡燈枯,内部許多部門陷入了某種程度上的算力荒。
一面是黃仁勳 " 計算技術每十年進步一百萬倍 " 的超級預言,一面是 OpenAI 狂暴的算力消耗,小冰選擇相信後者,認爲卷模型尺寸、卷算力是沒有前途的,AI 公司應該 " 頂住壓力 ",而不是随大流。
告别主流發展路線後,小冰的注意力集中在數據上。李笛說道:" 我們在研究中發現,真正決定模型表現的,不光是 Fine-tune,預訓練的數據可能更關鍵。如果預訓練的效果就不好,靠 Fine-tune 是調整不回來的。反之,如果能真正重視預訓練的數據工程,可能發現不用那麽大的尺寸,也能有比較好的效果。GPT-3.5 早期也花了大量的時間在預訓練數據的整理上,所以最終才有好的表現。"
在這一點上,GPT 從去年 4 月開始,蔓延至今的 " 變笨 " 問題,似乎也找到了合理的解釋,有内部消息認識透露:從 GPT-3.5 到 GPT-4,預訓練數據都做的相當不錯,但發布後對新訓練數據的整理沒有那麽好,反而導緻了性能下降。現在有一批用戶取消了 GPT-4 的付費訂閱,他們吐槽 GPT-4 已經退化爲 GPT-3.5 Plus。
公主家的餘糧也不多了
有内部人士向虎嗅透露,小冰今年的财務目标,是在業務層面盈虧打平,但基礎研發投入還是要繼續,小冰整體仍處于主要投入階段。
這爲小冰的宏大野心和其傲嬌的發展路線,蒙上了一層陰影。無論是上下文、多模态,還是每次對話的成本,當下的 生成式 AI、 AI Being 都還有一條很長的路要走。
李笛也同意,當 AI 被設定爲,一定要無論如何去回答的時候,它本質上還是距離拟人有很大差異的。要真正實現能通過圖靈測試的 AI ,實現小冰的目标,中間還差着幾次重大技術突破。
對于大部分 AI 企業來說,這是一場擊鼓傳花,資本是音樂,硬件投入是 " 花 ",在設計出理想的商業模式前,所有人都要祈禱音樂别停。對于小冰而言,這更像一場 " 冬眠 " ——技術的春天到來時,盡可能的發展;技術的春天結束後,進入冬眠狀态,等待下一個技術突破。
小冰目前還未公布海外成果與 2024 年計劃,從目前情況來看,本次備案通過是其機會之一。