文 | 田哲
編輯 | 蘇建勳
随着人工智能進入大模型時代,全球科技競争正逐步聚焦于中美兩國。高昂的算力投入和海量的數據需求,決定了大模型的研發門檻極高,少數領先國家的大模型廠商正在這場技術競賽中争奪前沿優勢。
MiniMax 是較早出海的國内大模型廠商之一,據報道,MiniMax 今年的海外收入将超過 7000 萬美元。
目前,MiniMax 已在海外市場推出 HailuoAI、Talkie 兩大 C 端産品,分别主打 AI 視頻 / 音頻生成和 AI 内容社區。36 氪獲悉,MiniMax 的海外主要收入來源,除出海 C 端 AI 應用 Talkie 目前占比較大,Hailuo AI 訂閱服務和 B 端 API 服務也有所提升。
近日,騰訊雲北區雲原生總經理田豐、MiniMax 副總裁劉華,與 36 氪等媒體展開了一次對話,從全球競争格局、技術路徑到商業化方向,共同探讨了大模型技術的發展趨勢及兩者間的協作價值。
劉華介紹,Talkie 除了已有的付費訂閱制之外,廣告業務也是商業化收入來源之一。此外,MiniMax 在海外市場暫時不會開發定制化模型項目,目前仍以标準化 API 接口服務 B 端客戶。
原因在于,創業公司應将主要資源投入到核心技術的研發與叠代上,而不是耗費大量精力在滿足個性化需求的定制化項目中。" 如果一款大模型需要大量定制化開發才能滿足客戶需求,說明這代模型尚不夠成熟,與其投入時間與成本進行定制,不如加速模型叠代。" 劉華表示。
他透露,MiniMax 已确定未來的研發路線,主要聚焦于降低模型錯誤率、實現無限長的輸入和輸出、多模态路線發展。
首先,模型錯誤率方面,他認爲上一代的 GPT 系列模型錯誤率約 30%,沒有引起用戶較大重視的原因在于,其較多被用于沒有标準答案的文創領域,如果将大模型用于生産、研發、科研設計等場景,最好把錯誤率降低至個位數。而 MiniMax 理想中的錯誤率是 2%-3%。
其次,随着大模型任務逐步從文本擴展到語音和視頻,所需的 Token 量也在迅猛增加,因此新技術落地的關鍵在于,提高大模型處理大規模輸入和輸出的能力。
目前,MiniMax 最新研發的 Abab 7 系列模型基于 MoE 和 Linear Attention(線性注意力)機制的新架構,可顯著降低長文本的計算複雜度。
在劉華看來,美國的大模型行業仍保持一定程度的領先。據 36 氪觀察,OpenAI、Anthropic、XAI 等行業頭部廠商占據了強大的資源和技術優勢,譬如 OpenAI 的公司規模接近 2000 人,年度算力成本可能達到百億美元。
不過,中國大模型廠商追趕的速度非常快,尤其在語音和視頻等領域,中國的語音 API 服務已接近 GPT-4o 的水平。如果國内知名科技公司也進入這一賽道,也必然會憑借其資源優勢占據重要位置。
劉華認爲,中國的 AI 創業公司仍有着廣闊的發展空間。正如 MiniMax 得到了騰訊雲這類雲廠商支持,同時通過成功的商業化實現了資金循環。
此外,劉華認爲如果需要更好服務國内外用戶,必須堅持自研,打造真正原生性的解決方案,從而擁有具備獨立競争力的大模型。
談及與 MiniMax 的合作。騰訊雲北區雲原生總經理田豐介紹,騰訊雲爲 MiniMax 提供了一系列集計算、存儲、網絡爲一體的高性能智能産品,讓 MiniMax 釋放更多的精力聚焦在模型本身的訓練和工程化上。其中,對象存儲産品則提供了元數據加速方案來保障性能,以及多種精細化管理措施進行數據治理,降本增效。數據湖産品則專門針對語料數據預處理進行了專項優化,來提升任務處理性能,幫助 MiniMax 節約算力 30% 以上,性能提升 35.5% 以上。
據悉,騰訊雲高性能計算集群通過一系統化的運維機制,可做到網絡故障一分鍾内發現問題,三分鍾内定位問題,最快五分鍾恢複系統。其千卡集群的日故障數已刷新至 0.16,是行業平均水平的三分之一。
同時,騰訊雲星脈網絡可支持大模型訓練,實現大模型訓練過程中,網絡通信占比(通信時間占總體時間比例)低至 6%,整體訓練效率提升了 20% 以上。
正如美國大模型廠商已形成頭部效應,這一現象也将在中國市場出現。劉華認爲,未來隻有少數企業研發基礎大模型,大多數企業将逐漸轉向 AI 應用層面的研發。
至于 MiniMax,将依然堅持投入核心技術研發,用好的技術驅動好的産品,再讓好的産品帶來好的服務體驗和口碑,反哺技術。