文 | 新識研究所,作者 | 楊啓隆,編輯 | 丁力
最近幾個月裏,你有沒有發現在刷抖音、B 站的時候被突然插入的大模型應用廣告打個措手不及的頻率越來越高了?
近日,一篇有關大模型應用投流 " 買 " 用戶的文章被不少人看到,大模型公司在二十天中動辄幾千萬甚至上億的廣告投放費用令人咋舌。也被媒體報道爲 " 美國 AI 公司依然專注于前沿 AI 模型技術研究,中國 AI 大模型則踏上了‘卷’算力、‘卷’價格、‘卷’獲客、‘卷’變現能力的道路。"
此後,雖然有大模型企業出面表示相關數據統計有所不實,但也未具體透露真實投放金額。而據钛媒體 App 獨家獲悉,截至 10 月 29 日,kimi 智能助手、字節跳動豆包、騰訊元寶等所有 AI 應用 10 月全網廣告投放(投流)支出超過 3 億元人民币。
在日漸增加的投流費用的背後,其實是當前各家大模型在應用體驗層面難以做出颠覆性創新的事實,那麽,當前市面上最主要的和增速最快的大模型應用有哪些?在從燒錢擴大市場到用戶心智教育的這一節點,這些主流的大模型應用做出差異化了嗎?
而對于哪些是最主要的大模型應用、哪些是增速最快的大模型應用,新識研究所測評了《AI 産品榜》統計的數據,9 月份 AMU 前五或增速超過 30% 的大模型應用豆包、文小言、Kimi、訊飛星火、天工 AI 與最近異軍突起的騰訊元寶。體驗了這些火熱的大模型應用的效果如何。
數據來源:公衆号 @AI 産品榜
字節 " 專寵 " 豆包月活真的高,好用嗎?
作爲當下最火熱的 AI 産品,豆包 10 月的 MAU 達到了驚人的 5000 萬 + 的月活,這一成績也相當于榜單第二到第九的 10 月月活人數之和,其中雖然有據多方業内人士透露,抖音封殺了所有的大模型廣告,隻留下了豆包一家,讓豆包擁有最大短視頻社交平台的獨家支持的功勞,但作爲有如此大基數還在持續保持月活穩定增長的大模型應用,豆包在使用體驗上也确實很好。
具體來看,不同于 Kimi 與天工 AI 這種在創始與發展過程中逐漸将搜索當作落地能力與獲客招牌的大模型應用,在字節跳動手握國内最優質數據庫的支持之下,豆包幾乎涵蓋了當前市面上所有已經上量使用的大模型應用,包括 AI 搜索、AI 寫作、圖像生成、AI 閱讀、第三方創建的智能體以及其特有的語音通話。
在 AI 搜索功能中,豆包同市面上所有的大模型應用相同,提供了簡便搜索與深入搜索兩類搜索模式,深入搜索會根據更多的信源,來對問題進行更加全面和深度的總結,但同 Kimi 這樣專打在思考中搜索、在搜索的過程中思考的對手來說,豆包的 AI 搜索更像一個更大号的的信息處理器,但相比起其他的 AI 應用也算是用的過去。
圖源:豆包截圖
在接下來 AI 寫作方面,豆包就展示出了遠超平均水平的實力,在文章的體裁選擇方面有着 34 種提前預設好的場景,覆蓋了當前文字需求的絕大多數甚至全部的用途。
更好用的是,在選擇寫一篇文章的時候,除了主題之外,針對不同平台的寫作特點,豆包也會使用不同的寫作風格進行改變;同時,在直接生成文章之外,你還可以選擇在其中增加書寫大綱一步,在勾選後,豆包會給出将要生成文章的大綱,用戶可以确認大綱是否正确、對大綱的參考來源進行更改與增減後之後再進行輸出,這樣就避免了用戶坐在電腦前花上幾十秒甚至一兩分鍾的時間,最後得到一篇根本不符合最初設想的文章。
這樣的 AI 生成步驟,在月活最高的幾個大模型應用中,隻有豆包提供了這樣的選擇,說其絕對領先也沒有什麽問題。
圖像生成方面,豆包的功能也是最齊全的那個,除了簡單的文生圖之外,一些去除背景、擦除、區域重繪和擴圖功能也同樣提供給了用戶,相比于隻有圖像生成的友商,優點也一目了然,并且其中使用頻率最高的擦除與去除背景功能,還真的意外地好用,并不會出現奇奇怪怪的填充。
而在 AI 閱讀方面,在進行了多個文檔的總結提煉後,或是由于字節的能力,又或者是由于該用途的天花闆不高,在實際使用中沒有看到明顯優于其他大模型應用的地方。
在總結文檔之外,豆包也提供了 AI 看視頻的功能,用戶可以去 B 站等提供字幕的視頻網站,登錄後即可使用,但在嘗試過數個視頻之後,隻能說豆包的想法是好的,但把 B 站某位 up 主有關美國大選的視頻,用 AI 總結成蔡徐坤被軟封禁之後的二三事,也相差實在是太大太大了,這樣的功能雖然有的時候效果還算不錯,但面臨稍微複雜一點的視頻,隻能說還是不用爲上。
此外,豆包的語音通話也是比較特色的功能,英語口語陪練、心情樹洞、模拟面試、成語接龍功能,雖然在使用中無法隻有英語陪練和模拟面試有點作用,但還是無法很好地模拟真實場景,不過對于有對多模态溝通需求的人群來說,也是邁出了一大步,值得肯定。
在 PC 端下載豆包後,在框選相關文字後,豆包的助手也會以小浮窗形式出現,也起到了日常工作使用的助手插件功能,支持快速使用。
總結下來,就是作爲一個經常有長闆出現但沒有短闆的大模型應用,在友商競品們都有的功能中,豆包都有着強于平均水平并且偶有高光表現。而在豆包特有的功能中,雖然在使用上經常出現奇奇怪怪的問題,但邁出一步也是值得肯定的。在字節的優質數據支持下,也希望可以快速完善。而作爲月活絕對第一的大模型應用,豆包也确實 " 德可配位 "。
文小言、訊飛和騰訊元寶,蒙上 logo 差不多?
在豆包之後,月活排名第二的則是在最初領先的文小言(文心一言),當初文心一言剛剛面世之時的熱度可以說紅極一時,還需要去申請排隊,但從先發到目前的月活僅有豆包的四分之一來看,文小言确實落後了不少。
其中的主要原因,同付費離不開幹系,在友商們快速燒錢搶市場的時候,百度卻率先推出了付費功能,也成爲當前市面上主流的大模型應用唯一打開收費通道的一家。相比于競對們快速叠代的新功能與暢通無阻使用的最新一代大模型,文心大模型 4.0 實在沒有任何的不可替代性,再加上投放的不積極,這也成爲了其逐漸落後的原因。
圖源:文心一言截圖
不過,雖然文小言在充值上被诟病,但作爲起步最早的大模型應用,其中的某些功能還是有着一些亮點的。
譬如,在 AI 創作方面,文小言就提供了給出主題撰寫成文之外的其他選擇,由于給出了更多、更全提示詞,文小言無論是文章優化、日常辦公、專業文稿還是在其他一些用途的文章中表現都更好。
但是,文小言也并沒有做到完美,就比如在體驗過了豆包、元寶這些可以先生成大綱再根據更改後的大綱生成文章的大模型應用後,文小言在直接成文還是會出現成文後才發現方向錯誤而浪費時間的情況,也希望可以在相關方向進行跟進。
而在 AI 創作之外的文檔分析(總結文檔)、圖像生成、AI 修圖這些競對們都擁有的功能方面,文小言也确實沒有明顯的效果上的差距,它能提供的服務友商都能提供,它能達成的效果友商也沒有差到哪裏去。反倒是友商的一些新奇功能如文生視頻等,文小言卻隻能望而興歎。
綜合體驗下來,文小言當前的确算得上是一個合格的大模型産品,其中提供的各類服務也完全足夠用戶使用。但要說,文小言比競品有哪些明顯優勢的地方也無從談起,反倒是充值的價格着實不低。
在文小言之外,沒有開通充值的那些主打大模型能力的訊飛星火與最近異軍突起的騰訊元寶也幾乎面臨着同樣的境況。AI 搜索、圖像生成、AI 閱讀、總結文檔是大家共有的内容,用戶想要獲得更加優質、更專業的增量,隻能從官方或他人創建的智能體庫中尋找,但要說有什麽實在不可替代的内容也确實沒有。
這其實也是當前 C 端大模型應用競争的真實情況。大模型早已不再局限于初期的性能較量,而是擴展到了多樣化的應用領域。這些 " 拼爹 " 拼不過、流量處于第二梯隊,還沒有自身鮮明特點的綜合性大模型應用,其實有些 " 無助 "。
而對于市場來說,普通用戶所需要的應用暫時已經滿足,文小言、星火、元寶們也隻能去完善一下末端能力、卷卷投流了,但面對頭上用絕對月活壓死大夥的豆包來說,實在有些進退兩難。
Kimi 和天工,在 AI 搜索殺出一片天
除了體驗了 " 綜合 " 的大模型應用,榜單上的 Kimi 與天工 AI 我們也體驗測評了一番。Kimi 與天工 AI,更傾向做出絕對的長闆,成爲用戶們在這一方向上的 " 唯一指定合作夥伴 "。
其中 Kimi 就以長文本與搜索見長。
除了 Kimi+ 中提供的少數對話模闆外,Kimi 的頁面顯得實在是有些家徒四壁。AI 音樂、圖像生成什麽的都無從使用,但這卻一點不影響 Kimi 受到部分用戶的追捧。
圖源:Kimi 截圖
作爲 AI 大模型的獨角獸企業,月之暗面更加看重技術帶來的體驗升級。
據智小廣,Kimi 作爲自研大模型,在基座模型領域獨樹一幟。在多數廠商遵循 OpenAI 路徑,即增加參數規模與多模态功能的同時。Kimi 認識到,當前階段模型參數雖大,但真正決定效能的是其處理複雜問題的能力。其核心在于 " 注意力機制(Transformer)",它如同魚的記憶,專注于有限範圍的上下文信息。
而結果則是 Kimi 憑借其獨特的長上下文處理能力,赢得了用戶的青睐,成爲大模型領域的佼佼者。
此外,上個月 Kimi 推出的探索版,也着實讓其又火了一把。
不同于搜集信息總結再輸出,Kimi 探索版和 GPT-o1 都采用了類人的思考,多級分解複雜問題,執行深度搜索,并即時反思改進結果,提供更全面和準确的答案,幫助你更高效地完成分析調研等複雜任務。
更直接一點,就是 Kimi 探索版會自主規劃策略,将一個複雜的問題分解爲層次化的子問題,建立清晰的任務結構,然後分步來執行。之後再借助超大的容量優勢,并行搜索幾十個不同但相關的關鍵詞,大大增加可參考的内容。此外,在生成答案的過程中,還可以主動進行回溯,檢查最初的回答是否存在缺失和矛盾,再補充提供多方視角的信息供參考決策。
這樣專精于搜索的打法,碰上了喜歡把大模型應用當作搜索軟件的用戶自然是一拍即合,也獲得了以學生和白領爲代表的重度和高要求使用者青睐。
天工 AI,也走上了相似的道路。
天工 AI 雖然沒有 Kimi 那麽 " 極端 ",提供了綜合大模型應用都有的功能,并且相關效果還不錯,但真正讓其出圈的還是搜索。
圖源:天工 AI 截圖
作爲國内第一個 AI 搜索産品,天工 AI 也算是吃上了 AI 搜索的紅利。
在天工 3.0 大模型的支持下,天工 AI 和 Kimi 探索版相同,都采用了類人思考的方法,會把用戶提出的問題自動規劃和拆解,将其分解爲多個簡單的小任務并逐步解決。在解決過程中,天工 AI 在生成結果的過程中,同樣會檢查每一步的執行情況,确保最終結果的準确性。
此外,天工也在 AI 高級搜索上不斷深入,将金融與科研作爲進一步深化的方向。
譬如在财報閱讀方面,天工 AI 給出的功能包括金融政策查詢、指标查詢、财務數據對比、财報分析、公司分析、研報解讀、投資理财,雖然比起券商們的研報沒有主觀的方向與信息增量,但給出的相關分析相比于某些互聯網交易軟件的大模型來說還是優秀了太多。
在科研領域,天工 AI 接入了全球範圍内的學術數據庫,包括 arXiv 等權威論文網站,可以實時抓取最新的科研成果。其新增的文獻分析功能,支持按研究背景、方法、實驗設計等維度對論文進行全面解讀。用戶可以通過天工 AI 深入理解論文中的技術細節,甚至是數學公式和實驗數據。
而天工的用戶畫像,則也與 Kimi 相似,同樣是對搜索和對某些方向有高要求的用戶。
不過,雖然 Kimi 和天工 AI 做出了差異化,作爲獨角獸企業與非大廠玩家,在當前這個時點也留存下了不少的優質用戶,但 AI 搜索賽道中的優勢需要長期的技術叠代與資金支持才能維系,那些傳統大廠們,也已經突入這些差異化玩家的産品腹地。據 Tech 星球報道,截至目前,抖音、阿裏、快手、微信、百度都已推出了自己或獨立或内置的 AI 搜索産品或服務。
而在大廠們入局後,不出意外地,隻有那些對搜索有着高要求的用戶才會留存在 Kimi 與天工 AI 之上,這兩家也急需在 AI 搜索之外做出新的增量,擺在他們兩個面前尤其是除 AI 搜索之外其他功能相對 " 匮乏 " 的 Kimi 來說,用戶留存與商業化壓力巨大。