目前大模型和手機的結合方式,主要是圍繞語音助手進行體驗創新。
AI 大模型的戰火,燒到了智能手機上。
最近一段時間,華爲、小米、vivo、OPPO、榮耀等國産手機,均已對外公布衆多大模型相關成果。目前,頭部廠商不僅紛紛下場自研大模型,而且正在把能離線運行的端側大模型,植入到新一代機型中,打造所謂的 "AI 大模型手機 "。
相比調用雲端算力的通用大模型,端側大模型可以讓用戶更加高效、便捷、安全地使用 AIGC。不過将其應用到手機上也不容易,不但要考慮到模型量級、AI 體驗和手機能耗的平衡等問題,還要承擔從落地到叠代每年數十億元的成本投入,這對于手機廠商的硬實力也是種極大的考驗。
但大模型手機對于用戶和廠商均價值非凡:一是在用戶換機動力匮乏的寒冬下,AI 大模型将成爲手機廠商市場競争的重要籌碼;二是 AI 大模型未來有望變成每個用戶專屬的超級助理,革新手機乃至所有硬件終端的使用體驗。
廠商開卷大模型
在手機 + 大模型的競争中,每一個廠商都不想掉隊。
早在 7 月份,華爲就在開發者大會上發布了面向行業的盤古大模型 3.0,最高版本高達 1000 億參數,并官宣新一代智能操作系統 HarmonyOS 4 已接入了盤古大模型,小藝也成爲首個具有 AI 大模型能力的終端語音助手。9 月份,華爲宣布大模型版小藝開啓衆測,首批支持機型爲 Mate 60/P60 系列手機。
圖源:網絡
8 月的年度演講上,小米創始人雷軍透露其自研大模型(MiLM)中的 13 億參數版本已經成功在手機本地跑通,部分場景可以媲美 60 億參數模型在雲端運行結果,旗下 Y 語音助手小愛同學也已開始升級大模型版本。10 月底,小米宣布自研 AI 大模型已經接入最新發布的澎湃 OS,搭載到了小米 14 系列上。
圖源:網絡
10 月 26 日,榮耀 CEO 趙明宣布,即将推出的 Magic6 系列手機,将支持自研 70 億端側 AI 大模型。趙明表示,榮耀對于端側大模型的理解,将通過 MagicOS 8.0 和榮耀 Magic6 系列呈現出來," 有非常多、非常驚豔的創新在裏面 "。
11 月 1 日,vivo 的藍心大模型矩陣(BlueLM)在其開發者大會上亮相,包含十億、百億、千億等不同參數規模,随後 vivo 還推出基于該大模型開發的應用 " 藍心小 V" 和 " 藍心千詢 "。11 月 13 日,vivo 發布了行業首款 AI 大模型手機 X100 系列,落地終端側 70 億參數大模型,跑通端側 130 億參數模型。
圖源:網絡
11 月 16 日,OPPO 在開發者大會上正式推出了安第斯大模型(AndesGPT)。根據官方介紹,該模型支持從 10 億至千億多種不同參數規模模型,将會被接入到 OPPO 的手機操作系統 ColorOS 14 以及物聯網操作系統潘塔納爾 OS,OPPO Find X6 等機型于同日首發升級正式版。
圖源:網絡
手機廠商密集布局自研大模型,主要是因爲通用大模型無法完美适配手機。
在手機上使用 AI 大模型并非新鮮事,ChatGPT、文心一言、訊飛星火、通義千問等通用大模型都推出了 App 版本,允許用戶在移動端體驗。不過這些 App 依賴的都是雲端大模型,需要調運服務器算力并進行數據傳輸,因此也存在成本和安全問題。
vivo 副總裁周圍曾在接受媒體采訪時表示,目前調用一次雲端大模型的平均成本在 1.2 分 -1.5 分人民币。考慮到每個手機廠商至少有上億的用戶量,假如每人每天調用 10 次,那麽每年産生的成本就會達到數十乃至上百億元。這部分成本由廠商長期負擔不現實,但由用戶付費也會降低使用體驗和意願。
此外,作爲全球普及率、使用率最高的終端硬件,手機中存儲着大量用戶隐私信息,如果被上傳到雲端便會存在安全隐患。前不久,WPS AI 就在用戶隐私問題上差點翻車,因爲其未更新的隐私政策中包含 " 将用戶文檔資料用于 AI 訓練 " 的表述,金山 WPS 被沖上熱搜并連夜道歉。
爲此,廠商們都在緻力于自研大模型,并且努力将大模型部署在手機本地,僅利用芯片的算力生成結果,無需聯網也能運行,也就是所謂的端側大模型。相較雲端大模型,端側大模型由于利用了手機終端的閑置算力資源,減少了數據傳輸,因此在很多場景下會更加高效、便宜、安全。
每年燒錢數十億
把 AI 大模型植入手機并非易事。
目前主流的雲端大模型,參數量都在千億級别,對于内存、算力、功耗的需求是一台手機根本滿足不了的。正因如此,手機廠商自研的端側大模型體量都比較小,将參數壓縮到了數十億到百億左右,以便在手機端運行。比如,vivo X100 系列搭載的就是 70 億參數版本的藍心大模型。
值得一提的是,端側大模型能夠成功落地手機,離不開芯片技術的進步。
vivo X100 搭載的天玑 9300 芯片,就是聯發科在 11 月 7 日剛剛推出的新一代旗艦産品,該芯片搭載了生成式 AI 技術,支持終端運行最高達 330 億參數的 AI 大模型。此外,聯發科于 11 月 21 日發布的次旗艦芯片天玑 8300,以及高通 10 月份新發布的骁龍 8 Gen3 芯片,也均支持終端運行超 100 億參數的大模型。
圖源:聯發科官網
輕量化、無需聯網的端側大模型,在響應速度、算力需求和信息保護上有與生俱來的優勢,但在模型能力上無法媲美雲端大模型。這是因爲參數是衡量一個 AI 大模型質量的重要指标之一,通常情況下,參數越多,大模型能力也就越強大。
爲了實現大模型體驗和手機性能的平衡,廠商們目前普遍采取了 " 端雲協同 " 的策略,同時部署端側和雲端兩種模型,根據不同的應用場景和需求來進行選擇。比如,涉及個人隐私、金融數據等信息的任務,以及知識問答、寫作繪畫等簡單任務就可以使用端側能力,而訓練模型等複雜任務則可以調用雲端能力。
端雲協同可以最大化地發揮 " 端側快 " 和 " 雲側強 " 的優勢,同時還能解決信息安全隐患、雲端算力成本過高等問題,可以說是現階段打造大模型手機的最優解。
這也正是很多廠商發布大模型矩陣的原因之一,前面已經提到,華爲、vivo、OPPO 發布的自研大模型方案,都覆蓋十億、百億、千億多個參數量級,其中輕量化模型就是用于端側部署,而大參數模型則是用于雲端部署。
圖源:網絡
但大模型是公認的燒錢大戶,無論是在端側還是雲端,其數據、算力、人工等方面的成本對于開發商來說都是一筆不菲的投入。
之前業内流傳的說法是,一萬枚英偉達 A100 芯片是做好 AI 大模型的算力門檻,而其單張成本就在 10 萬元左右,這意味着搭建大模型算力集群的成本至少要數十億元。在美國芯片禁令升級的當下,英偉達高算力芯片的價格還在蹭蹭上漲,而且有市無價。
此外,開發大模型的人工成本也很高。有行業人士表示,AI 研發工程師的年薪基本都要 7 位數,一個千人研發團隊一年至少也要 20 個億。根據雷軍在發布會上透露的數據,小米集團從事 AI 開發的研發團隊已經超過了 3000 人。
vivo 副總裁周圍接受媒體采訪時透露,自 2017 年組建 AI 全球研究院至今,vivo 每年在人工智能上的投入保守估計在 20 億 -30 億元。他還表示,大模型是硬科技的賽道,研發投入和難度跟通信、芯片是同一個級别的。
重塑手機體驗?
廠商不遺餘力的投入,是因爲大模型對于手機行業價值非凡。
在 ChatGPT 出現之前,手機行業的創新長期都集中在攝像、屏幕、通信、材料、芯片等領域,在全球手機市場疲軟的當下,這種 " 擠牙膏式 " 的變化很難刺激消費者的購買欲望,用戶的換機周期也在持續拉長。根據 Counterpoint 數據,2022 年全球手機換機周期已經延長至 43 個月。
大模型的誕生,讓行業看到了新的創新方向。大家普遍認爲,AI 能力将成爲未來用戶換機和選擇手機品牌的重要考量因素,而大模型就是手機廠商在市場競争中的重要籌碼。
一個手機能不能跑大模型、能跑多大的大模型,和内存、算力等硬件配置息息相關。因此在初期發展階段,大模型手機就成了手機品牌彰顯硬核配置、打造高端形象的有力武器。
等到大模型成爲行業标配,手機廠商的戰場則會轉移到大模型手機的體驗上。從華米 OV 的答卷看,目前大模型和手機的結合方式,主要是圍繞語音助手進行體驗創新。
一方面,在大模型的賦能下,語音助手的語義識别、圖像識别等能力都得到了強化,從而能夠更加智能化的執行指令,提升用戶的交互體驗。
以語音助手的 " 語義搜索 " 功能爲例,過去想要在手機上搜索文檔或者圖片,隻能依靠分類 AI 的識别,通過某些場景關鍵詞描述縮小搜索範圍,例如風景、美食、人像等。而在有了大模型能力後,用戶就可以通過自然語言描述圖片、文檔内容來完成搜索。
圖源:網絡
另一方面,有了大模型的加持,語音助手也将具備雲端大模型 App 同款的 " 智能問答 "、"AI 寫作 "、"AI 繪畫 "、" 實時字幕 "、" 文檔總結 " 等功能,化身提高工作和學習效率的生産力工具。
圖源:網絡
此外,在手機廠商的預期裏,未來的大模型手機還将朝個性化方向發展,變成用戶的專屬私人助理。就如同現在被廣泛應用的算法推薦,經過長時間的使用後,用戶的數據也都會被用于端側大模型的訓練和叠代,進而讓大模型手機像一個 " 老朋友 " 一樣越來越懂用戶。
到了那一天,由于不同品牌之間存在生态壁壘,用戶更換手機所要付出的代價也将會更大,這樣手機品牌也就能借助大模型來增強用戶粘性,進一步鞏固自己的護城河。
不過眼下大模型手機還在起步探索階段,未來哪家廠商能夠決勝千裏,還要取決于模型、應用和産品的叠代創新。