接入大模型，手機終于要長“腦子”了？

目前大模型和手機的結合方式，主要是圍繞語音助手進行體驗創新。

AI 大模型的戰火，燒到了智能手機上。

最近一段時間，華爲、小米、vivo、OPPO、榮耀等國産手機，均已對外公布衆多大模型相關成果。目前，頭部廠商不僅紛紛下場自研大模型，而且正在把能離線運行的端側大模型，植入到新一代機型中，打造所謂的 "AI 大模型手機 "。

相比調用雲端算力的通用大模型，端側大模型可以讓用戶更加高效、便捷、安全地使用 AIGC。不過将其應用到手機上也不容易，不但要考慮到模型量級、AI 體驗和手機能耗的平衡等問題，還要承擔從落地到叠代每年數十億元的成本投入，這對于手機廠商的硬實力也是種極大的考驗。

但大模型手機對于用戶和廠商均價值非凡：一是在用戶換機動力匮乏的寒冬下，AI 大模型将成爲手機廠商市場競争的重要籌碼；二是 AI 大模型未來有望變成每個用戶專屬的超級助理，革新手機乃至所有硬件終端的使用體驗。

廠商開卷大模型

在手機 + 大模型的競争中，每一個廠商都不想掉隊。

早在 7 月份，華爲就在開發者大會上發布了面向行業的盤古大模型 3.0，最高版本高達 1000 億參數，并官宣新一代智能操作系統 HarmonyOS 4 已接入了盤古大模型，小藝也成爲首個具有 AI 大模型能力的終端語音助手。9 月份，華爲宣布大模型版小藝開啓衆測，首批支持機型爲 Mate 60/P60 系列手機。

圖源：網絡

8 月的年度演講上，小米創始人雷軍透露其自研大模型（MiLM）中的 13 億參數版本已經成功在手機本地跑通，部分場景可以媲美 60 億參數模型在雲端運行結果，旗下 Y 語音助手小愛同學也已開始升級大模型版本。10 月底，小米宣布自研 AI 大模型已經接入最新發布的澎湃 OS，搭載到了小米 14 系列上。

圖源：網絡

10 月 26 日，榮耀 CEO 趙明宣布，即将推出的 Magic6 系列手機，将支持自研 70 億端側 AI 大模型。趙明表示，榮耀對于端側大模型的理解，将通過 MagicOS 8.0 和榮耀 Magic6 系列呈現出來，" 有非常多、非常驚豔的創新在裏面 "。

11 月 1 日，vivo 的藍心大模型矩陣（BlueLM）在其開發者大會上亮相，包含十億、百億、千億等不同參數規模，随後 vivo 還推出基于該大模型開發的應用 " 藍心小 V" 和 " 藍心千詢 "。11 月 13 日，vivo 發布了行業首款 AI 大模型手機 X100 系列，落地終端側 70 億參數大模型，跑通端側 130 億參數模型。

圖源：網絡

11 月 16 日，OPPO 在開發者大會上正式推出了安第斯大模型（AndesGPT）。根據官方介紹，該模型支持從 10 億至千億多種不同參數規模模型，将會被接入到 OPPO 的手機操作系統 ColorOS 14 以及物聯網操作系統潘塔納爾 OS，OPPO Find X6 等機型于同日首發升級正式版。

圖源：網絡

手機廠商密集布局自研大模型，主要是因爲通用大模型無法完美适配手機。

在手機上使用 AI 大模型并非新鮮事，ChatGPT、文心一言、訊飛星火、通義千問等通用大模型都推出了 App 版本，允許用戶在移動端體驗。不過這些 App 依賴的都是雲端大模型，需要調運服務器算力并進行數據傳輸，因此也存在成本和安全問題。

vivo 副總裁周圍曾在接受媒體采訪時表示，目前調用一次雲端大模型的平均成本在 1.2 分 -1.5 分人民币。考慮到每個手機廠商至少有上億的用戶量，假如每人每天調用 10 次，那麽每年産生的成本就會達到數十乃至上百億元。這部分成本由廠商長期負擔不現實，但由用戶付費也會降低使用體驗和意願。

此外，作爲全球普及率、使用率最高的終端硬件，手機中存儲着大量用戶隐私信息，如果被上傳到雲端便會存在安全隐患。前不久，WPS AI 就在用戶隐私問題上差點翻車，因爲其未更新的隐私政策中包含 " 将用戶文檔資料用于 AI 訓練 " 的表述，金山 WPS 被沖上熱搜并連夜道歉。

爲此，廠商們都在緻力于自研大模型，并且努力将大模型部署在手機本地，僅利用芯片的算力生成結果，無需聯網也能運行，也就是所謂的端側大模型。相較雲端大模型，端側大模型由于利用了手機終端的閑置算力資源，減少了數據傳輸，因此在很多場景下會更加高效、便宜、安全。

每年燒錢數十億

把 AI 大模型植入手機并非易事。

目前主流的雲端大模型，參數量都在千億級别，對于内存、算力、功耗的需求是一台手機根本滿足不了的。正因如此，手機廠商自研的端側大模型體量都比較小，将參數壓縮到了數十億到百億左右，以便在手機端運行。比如，vivo X100 系列搭載的就是 70 億參數版本的藍心大模型。

值得一提的是，端側大模型能夠成功落地手機，離不開芯片技術的進步。

vivo X100 搭載的天玑 9300 芯片，就是聯發科在 11 月 7 日剛剛推出的新一代旗艦産品，該芯片搭載了生成式 AI 技術，支持終端運行最高達 330 億參數的 AI 大模型。此外，聯發科于 11 月 21 日發布的次旗艦芯片天玑 8300，以及高通 10 月份新發布的骁龍 8 Gen3 芯片，也均支持終端運行超 100 億參數的大模型。

圖源：聯發科官網

輕量化、無需聯網的端側大模型，在響應速度、算力需求和信息保護上有與生俱來的優勢，但在模型能力上無法媲美雲端大模型。這是因爲參數是衡量一個 AI 大模型質量的重要指标之一，通常情況下，參數越多，大模型能力也就越強大。

爲了實現大模型體驗和手機性能的平衡，廠商們目前普遍采取了 " 端雲協同 " 的策略，同時部署端側和雲端兩種模型，根據不同的應用場景和需求來進行選擇。比如，涉及個人隐私、金融數據等信息的任務，以及知識問答、寫作繪畫等簡單任務就可以使用端側能力，而訓練模型等複雜任務則可以調用雲端能力。

端雲協同可以最大化地發揮 " 端側快 " 和 " 雲側強 " 的優勢，同時還能解決信息安全隐患、雲端算力成本過高等問題，可以說是現階段打造大模型手機的最優解。

這也正是很多廠商發布大模型矩陣的原因之一，前面已經提到，華爲、vivo、OPPO 發布的自研大模型方案，都覆蓋十億、百億、千億多個參數量級，其中輕量化模型就是用于端側部署，而大參數模型則是用于雲端部署。

圖源：網絡

但大模型是公認的燒錢大戶，無論是在端側還是雲端，其數據、算力、人工等方面的成本對于開發商來說都是一筆不菲的投入。

之前業内流傳的說法是，一萬枚英偉達 A100 芯片是做好 AI 大模型的算力門檻，而其單張成本就在 10 萬元左右，這意味着搭建大模型算力集群的成本至少要數十億元。在美國芯片禁令升級的當下，英偉達高算力芯片的價格還在蹭蹭上漲，而且有市無價。

此外，開發大模型的人工成本也很高。有行業人士表示，AI 研發工程師的年薪基本都要 7 位數，一個千人研發團隊一年至少也要 20 個億。根據雷軍在發布會上透露的數據，小米集團從事 AI 開發的研發團隊已經超過了 3000 人。

vivo 副總裁周圍接受媒體采訪時透露，自 2017 年組建 AI 全球研究院至今，vivo 每年在人工智能上的投入保守估計在 20 億 -30 億元。他還表示，大模型是硬科技的賽道，研發投入和難度跟通信、芯片是同一個級别的。

重塑手機體驗？

廠商不遺餘力的投入，是因爲大模型對于手機行業價值非凡。

在 ChatGPT 出現之前，手機行業的創新長期都集中在攝像、屏幕、通信、材料、芯片等領域，在全球手機市場疲軟的當下，這種 " 擠牙膏式 " 的變化很難刺激消費者的購買欲望，用戶的換機周期也在持續拉長。根據 Counterpoint 數據，2022 年全球手機換機周期已經延長至 43 個月。

大模型的誕生，讓行業看到了新的創新方向。大家普遍認爲，AI 能力将成爲未來用戶換機和選擇手機品牌的重要考量因素，而大模型就是手機廠商在市場競争中的重要籌碼。

一個手機能不能跑大模型、能跑多大的大模型，和内存、算力等硬件配置息息相關。因此在初期發展階段，大模型手機就成了手機品牌彰顯硬核配置、打造高端形象的有力武器。

等到大模型成爲行業标配，手機廠商的戰場則會轉移到大模型手機的體驗上。從華米 OV 的答卷看，目前大模型和手機的結合方式，主要是圍繞語音助手進行體驗創新。

一方面，在大模型的賦能下，語音助手的語義識别、圖像識别等能力都得到了強化，從而能夠更加智能化的執行指令，提升用戶的交互體驗。

以語音助手的 " 語義搜索 " 功能爲例，過去想要在手機上搜索文檔或者圖片，隻能依靠分類 AI 的識别，通過某些場景關鍵詞描述縮小搜索範圍，例如風景、美食、人像等。而在有了大模型能力後，用戶就可以通過自然語言描述圖片、文檔内容來完成搜索。

圖源：網絡

另一方面，有了大模型的加持，語音助手也将具備雲端大模型 App 同款的 " 智能問答 "、"AI 寫作 "、"AI 繪畫 "、" 實時字幕 "、" 文檔總結 " 等功能，化身提高工作和學習效率的生産力工具。

圖源：網絡

此外，在手機廠商的預期裏，未來的大模型手機還将朝個性化方向發展，變成用戶的專屬私人助理。就如同現在被廣泛應用的算法推薦，經過長時間的使用後，用戶的數據也都會被用于端側大模型的訓練和叠代，進而讓大模型手機像一個 " 老朋友 " 一樣越來越懂用戶。

到了那一天，由于不同品牌之間存在生态壁壘，用戶更換手機所要付出的代價也将會更大，這樣手機品牌也就能借助大模型來增強用戶粘性，進一步鞏固自己的護城河。

不過眼下大模型手機還在起步探索階段，未來哪家廠商能夠決勝千裏，還要取決于模型、應用和産品的叠代創新。