作者丨張睿
編輯丨康曉
出品丨深網 · 騰訊新聞小滿工作室
在 " 百模大戰 " 席卷硬科技賽道後,基于不同場景的應用成爲大模型競争的又一發力點,這一次,擁有龐大用戶基數的頭部手機廠商也扣動了扳機。
自今年 8 月起,華爲、小米、vivo、OPPO、榮耀都透露了大模型的相關信息,并表示新一代旗艦手機會率先接入大模型。
據《深網》統計,華米 OV 的語音助手将具備端側大模型能力,語音助手在不聯網情況下也有語言理解、圖片生成等功能。
在大模型備案審核通過後,各家的語音助手也将擁有類似 ChatGPT 的深度對話、編程等能力。
與文心一言等以 App 形式存在的大模型不同,接入端側大模型的手機語音助手交互形式更多樣,例如 vivo 的藍心小 V 不僅可以語音生成圖片,還可以直接轉發至朋友圈。
當然,自研大模型是個 " 無限燒錢 " 的競争,投入動辄數十億元起。投入大模型需要強大資金儲備做後盾,以大模型驅動手機軟、硬件的每一次進化背後都是 " 鈔能力 "。
但無可否認,在智能手機出貨量持續下滑的行業态勢下,大模型或許會成爲手機行業突破自身創新窘境和模式局限性的一個機遇。
把大模型裝進手機的兩種路徑
手機廠商部署大模型主要有兩種路徑,一是做輕量化和本地部署的手機端側大模型;二是采用雲、端協同的架構設計,即在雲端部署百億、千億級别的大模型訓練模型,在手機端側部署十億級别的大模型,推出大模型矩陣。
主攻手機端側大模型的手機廠商以小米和榮耀爲主。
今年 4 月,小米組建了 AI 大模型團隊,并訓練出 13 億和 60 億參數規模的大模型。" 小米大模型技術的主力突破方向爲輕量化、本地部署,小米考慮的是優先在手機上實現端側跑通,讓每個人都能更好在手機上使用大模型。" 小米董事長雷軍在年度演講上透露。
目前,小米手機的智能語音助理小愛同學已經升級了大模型版本,并開啓了邀請測試。
與小米相比,榮耀自研大模型主要搭載了骁龍 8Gen3 這一快車。
2023 年 10 月 25 日,高通發布新一代移動處理平台骁龍 8 Gen3。與上一代産品骁龍 8Gen2 相比,骁龍 8 Gen3 不僅 GPU、NPU 性能大幅提升,更重要的是,它可以在終端側運行 100 億參數的模型。
榮耀 CEO 趙明在高通骁龍峰會上透露,榮耀自研的端側大模型參數規模達到 70 億。" 榮耀通過自研 70 億參數的端側大模型,可以很好地劃分個人隐私與人類知識庫的邊界,讓用戶隐私得到更好保護,這也是榮耀未來重點的創新方向,榮耀 Magic6 将接入自研大模型。"
與小米、榮耀主攻端側大模型不同,華爲、vivo、OPPO 自研大模型采用 " 雲、端協同 " 路徑,其推出的大模型矩陣覆蓋十億、百億、千億多個參數量級。
與 ChatGPT 等通用人工智能大模型不同,華爲的盤古大模型是一個面向垂直行業的大模型系列,目前已經叠代到 3.0 版本。據公開資料顯示,盤古 3.0 可以爲客戶提供 100 億參數、380 億參數、710 億參數和 1000 億參數的系列化基礎大模型。
在手機層面,華爲 P60 和 Mate60 系列手機的小藝智慧助手已經接入盤古大模型,并開啓了公測。
同樣采用大模型矩陣的,還有 vivo 自研的藍心大模型(BlueLM)和 OPPO 自主訓練的安第斯大模型(AndesGPT)。其中,藍心大模型覆蓋 10 億、70 億、700 億、1300 億、1750 億模型參數 5 個版本;安第斯大模型包含十億至千億以上多種不同參數規模的模型規格。
圖爲藍心大模型矩陣
圖爲安第斯大模型(AndesGPT)架構
對于爲何要推出大模型矩陣的原因,vivo 副總裁、AI 全球研究院院長周圍在接受采訪時透露," 主要受大模型形态、用戶需求及算力成本的影響 "。一是矩陣模式可以解決多模态大模型不同研發階段的需求;二是可以讓用戶在雲上使用大模型的同時在端側本地化運行關鍵數據,滿足隐私及安全需求;三是可以有效平衡雲端算力成本過高的問題。
無法停止的燒錢遊戲
雖然大模型的訓練、推理和邏輯能力受模型框架、數據質量、訓練方法等多重因素的影響,但現有大模型的智能水平主要取決于算力投入程度。
業内一種公認說法是,做好 AI 大模型的算力門檻是 1 萬枚英偉達 A100 芯片。
有行業人士給《深網》算了一筆帳,搭建一個算力集群的成本就在幾十億元。" 此前一台計算服務器的成本大約在 5 萬塊錢左右,現在滿配的 GPU 服務器價格在 100 萬 -200 萬元之間,一個算力集群一般要配備 500 台服務器。"
購買 AI 芯片僅是手機廠商自研大模型成本之一。由于大模型訓練一次的成本極高(例如 GPT4 一次訓練成本就要 6300 萬美元),所以在模型訓練之前,手機廠商需要對原始數據進行糾錯、價值觀把控等,數據清洗也是一塊不小的支出。
" 現在應用一次雲端大模型的成本大概在 1.2-1.5 分左右,vivo 國内 3 億用戶每天用十次,一年算下來也有百億左右的支出。"vivo 副總裁周圍透露。
周圍表示,數據和算力成本僅占自研大模型投入的一半,人員成本占了一半。自 2017 年組建 AI 全球研究院至今,vivo 每年在人工智能上的投入保守估計在 20 到 30 億元。
算力、數據、人員成本僅是 vivo 等頭部手機廠商部署雲端大模型的必要成本之一。與百度、阿裏巴巴等互聯網公司主要在雲端部署大模型不同,頭部手機廠商自研大模型的最終目的是服務用戶,讓手機擁有大模型能力。
但在手機端側運行大模型受手機存儲空間、耗電等一系列技術的影響,參數量越大,大模型在手機上越難跑通。
"10 億參數模型要占用手機 1GB 内存,70 億占有 4GB,130 億占用 7GB,所以我們優先考慮的是 10 億模型擅長做什麽,再慢慢把其他功能做起來。"vivo AI 解決方案中心總監謝偉欽對《深網》解釋。
大參數要占用大量的存儲空間,這意味着要在手機上跑通大模型就要同步升級内存、SoC 芯片等硬件,這對手機廠商來說,又是一筆不菲的投入。
手機行業急需一場颠覆性的創新
在 ChatGPT 點燃通用人工智能之前的很長一段時間裏,手機行業的創新集中在通訊、攝影、屏幕大小和形态等老生常談的領域。
在消費電子寒冬下,手機廠商 " 擠牙膏式 " 的改變很難激起用戶的購買欲望,換機周期一度從 2021 年的 28 個月延長至現在的 43 個月。而大模型的智能湧現能力恰巧讓手機行業看到了颠覆性創新的可能性。
" 大模型是颠覆性的技術範式轉變,和蒸汽機、電力及計算機一樣,對人類進步具有裏程碑的意義。" 多位手機品牌的創始人都曾在公司内部如此給大模型定調。
一加創始人、OPPO 首席産品官劉作虎表示,AIGC 會爲移動生活的體驗帶來革命性的變化,未來的手機會成爲用戶的超級助理。
" 我們在 2017 年部署大模型時,沈炜(vivo 創始人)就要求我們高規格投入以抓住這個百年難遇的趨勢。" 周圍透露。
在 vivo、OPPO 等手機廠商的預期裏,接入大模型的手機會演化成全新的智能體,成爲用戶的專屬私人助理。
曾有行業人士對《深網》表示,"100 億 -150 億參數級别的模型可以覆蓋絕大多數生成式 AI 的用例。如果終端可以支持這一參數級别,那麽運算可全部在終端上進行,無需雲端處理運算,屆時手機會會成爲真正的個人助理。"
華爲、vivo、OPPO 自研大模型的最高參數級别已經達到千億級别,但目前在端側隻能執行語言理解、文本創作、圖片生成等簡單的操作,涉及到訂票、APP 交互、設備控制等操作還是要調動雲端大模型能力。
眼下,頭部手機廠商在大模型的探索還處于起步階段。後續,随着模型叠代、創新應用和産品的推出,以大模型爲競争原點的時代正式開啓。