OPPO 發布自主訓練的 AI 大模型 AndesGPT(來源:OPPO)
11 月 16 日,OPPO 正式推出大模型安第斯,分爲端側運行、雲端運行等不同參數規模,最高支持千億參數。3 天前,vivo 發布了高端旗艦新品 X100 系列,聲稱是全球首個百億大模型在終端調通的大模型手機。此前,華爲、小米、榮耀等手機廠商高調宣稱在端側部署大模型。
人工智能(AI)大模型被手機廠商寄予厚望,但端側部署對手機内置芯片提出了更高要求。如何滿足大模型千百億級參數對算力、存儲和能耗要求是個大問題。在手機創新乏善可陳、市場相對低迷的當下,手機大模型還被廠商賦予了增加用戶黏性等其他重大責任。炙熱的大模型,手機能否承受其重?
大模型紛紛接入手機
今年 7 月起,AI 大模型就成爲手機廠商發布會的高頻熱詞。餘承東、雷軍、趙明 …… 手機廠商的 CEO 們紛紛爲 AI 大模型發聲;榮耀、華爲、OPPO、小米、vivo、三星等手機廠商——推出自研大模型或者宣布将大模型接入手機。
來源:記者根據公開資料整理
7 月,榮耀發布了 Magic V2 折疊屏手機,聲稱是 " 全球首款原生集成 AI 大模型的國産手機 "。10 月,榮耀 CEO 趙明宣布,榮耀 Magic6 系列将搭載第三代骁龍 8 移動平台,支持 70 億參數的端側 AI 大模型。
在 8 月的華爲開發者大會上,華爲常務董事、終端 BG CEO 餘承東宣布,盤古大模型接入了華爲 HarmonyOS 4 及華爲小藝智慧助手,華爲 P60 和 Mate 60 用戶可以通過小藝智能助手進行體驗。
華爲盤古大模型
同月,小米創始人、董事長兼 CEO 雷軍發布了小米自研的 MiLM 兩個輕量級大模型(64 億參數和 13 億參數)。10 月底,小米正式推出将 AI 大模型植入澎湃 OS 系統的小米 14 手機。
10 月,OPPO 宣布自主訓練的 AI 大模型——安第斯大模型(AndesGPT)接入新小布助手 AndesGPT,并于 11 月 16 日将 AndesGPT 能力正式接入 ColorOS 14 新系統。
11 月,vivo 一口氣發布了 1750 億、1300 億、700 億、70 億、10 億五個量級的自研 AI" 藍心 " 大模型。根據 vivo 提供給記者的相關資料,130 億參數的藍心大模型實現端側跑通,1750 億參數的藍心大模型已達到 GPT-3 參數水平。
相比國内手機廠商,三星和蘋果兩大手機巨頭顯然慢了半拍。三星在 11 月才展示出其 AI 大模型 " 高斯 ",搭載其 AI 大模型的 Galaxy S24 系列手機預計要到明年上半年才發售。
蘋果還未官宣其 AI 大模型,據分析,蘋果計劃最早在 2024 年年底将生成式 AI 技術整合到 iPhone 和 iPad 中。
爲何要端側部署?
當前,AI 大模型接入手機有兩種選擇:其一是部署在雲端,其二是部署在端側。目前來看,廠商部署在端側的都是十億級輕量級大模型,部署在雲端的則是千億級 AI 大模型。大模型手機端側部署是指直接存儲在手機設備内部,僅利用芯片的算力生成結果。
" 内存占用不能影響手機的正常使用和運行,同時反應速度要快,功耗還不能太高。" 相關專家在接受《中國電子報》記者采訪時表示。
受限于當前手機 GPU 和 NPU 硬件能力,當前大部分手機端僅能運行數十億級别輕量級的大模型,但是這些輕量級的模型訓練參數較小,在一定程度上會影響結果精準輸出,進而影響用戶的使用體驗。
爲了平衡内存、執行速度、功耗三大問題,現階段的 " 端雲協同 " 是手機廠商部署大模型時的普遍選擇。雲端千億級别大模型解決複雜的需要大算力、大參數模型的問題,手機端測的自研模型通常用來運行數據安全性高、需要實時反饋、網絡條件較差的輕量化問題。
vivo 發布藍心大模(來源:vivo)
記者發現,vivo 發布的藍心大模型就分爲千億、百億和十億三個量級,70 億級大模型部署在端側,負責解決用戶的簡單問題,複雜問題仍需聯網向雲端的千億大模型 " 借智 "。
記者在采訪時了解到," 雲端協同 " 成爲現階段最優方案,但智能手機端側布局大模型是終極方案。爲何端側部署 AI 大模型如此重要呢?
首先,智能手機端側 AI 大模型對高速網絡的依賴度更低,反應更迅速。比如,高通最新的第三代骁龍 8 移動平台處理器能夠将生成圖像的時間從 15 秒降至不到 1 秒,接入 AI 大模型的小米 14 和榮耀 Magic6 都搭載了第三代骁龍 8 移動平台處理器。
此外,AI 大模型部署在端側更經濟,也利于保護用戶隐私。vivo 副總裁、vivo AI 全球研究院院長周圍透露:" 雲端大模型成本高是個不容忽視的問題,大模型一次對話差不多要 0.012 元到 0.015 元。如果有兩三億用戶,一天用 10 次,一年下來要超過上百億元的開銷,高昂的成本制約了大模型的很多應用可能。"
談到端側 AI 大模型的隐私安全保護優勢,小米相關負責人表示,借助 AI 大模型,在沒有網絡的環境下,用戶可以通過自然語言在本地圖庫中完成快捷搜索,例如直接搜索 " 綠色的冰激淩 ",AI 大模型就可以幫助用戶找到所有包含綠色冰激淩的圖片,全程無聯網充分保障了用戶的隐私安全。
芯片不能承受之重?
端側 AI 大模型是手機廠商們的 " 必争之地 ",然而,AI 大模型走進手機對芯片提出了更高要求。在算力、存儲方面,手機芯片該如何滿足端側大模型千百億級的參數要求呢?
高通、聯發科等手機芯片企業已經開始布局。10 月 24 日,高通發布第三代骁龍 8,在端側可運行超 100 億參數的大模型,面向 70 億參數的大預言模型每秒可生成 20 個 token,在終端側隻需 0.5 秒就能利用 Stable Diffusion 完成文生圖。
10 月 24 日,高通推出第三代骁龍 8 芯片,在 CPU 上采用 1+5+2 的八核架構設計,具體包括一個 3.3GHz 的 Cortex-X4 超大核,五個 3.2GHz 的 Cortex-A720 大核,以及兩個 2.3GHz 的 Cortex-A530 小核,相較前代 CPU 峰值性能提升 30%,能效提升 20%。
第三代骁龍 8 移動平台(來源:高通官網)
據悉,骁龍 8 Gen3 重新設計 AI 計算單元,采用全新微架構推出 Hexagon NPU,最高支持 45 TOPS 算力,AI 計算能力提升 98%,能效提升 40%。
聯發科自然也不甘示弱,11 月 6 日晚間,聯發科發布專爲生成式 AI 設計的第七代 AI 處理器 APU 790,内置硬件級生成式 AI 引擎,處理速度是上一代的 8 倍,能實現更加高速且安全的邊緣 AI 計算。
此外,聯發科官宣旗艦 5G 生成式 AI 移動芯片天玑 9300。在 CPU 上創造性地采用了 " 全大核 " 的架構,最高頻率可達 3.25GHz,包含 4 個 Cortex-X4 超大核、4 個主頻爲 2.0GHz 的 Cortex-A720 大核,峰值性能較上一代提升 40%,功耗節省 33%。
針對 AI 大模型參數大、内存大的難題,聯發科大幅減少 AI 大模型對終端内存的占用,支持終端運行 10 億、70 億、130 億、最高可達 330 億參數的 AI 大語言模型。
vivo 首發聯發科 AI 芯片天玑 9300(來源:vivo)
11 月 13 日 vivo 發布的高端旗艦新品 X100 系列,作爲全球首個百億大模型在終端調通的大模型手機,首發搭載了聯發科 AI 芯片天玑 9300。
中科計算技術西部研究院戰略專家王軍輝表示,未來端側 AI 大模型的部署 " 一方面要探索适合輕量級部署的模型,另一方面要推出匹配大模型的加速器,在算力、效率和能耗上找到合适的平衡點 "。
盡管高通、聯發科等手機芯片企業爲手機 AI 大模型端側部署提供了一個權宜、暫時的解決方案,但真正讓 AI 大模型重塑手機功能和生态還有很長的路要走,現在芯片設計體系還遠遠達不到大模型千億級參數對算力、存儲、能耗等各方面的要求。
還要肩負其他厚望
AI 大模型無論是端側部署還是雲端部署,都會給用戶帶來不一樣的體驗。
華爲手機用戶參加畫展拍下感興趣的畫作圖片,發給小藝智能助手,借助 AI 視覺大模型,畫家和畫作的相關信息立即反饋,仿佛百科全書。
撰寫英文郵件毫無頭緒,vivo 用戶可以求助 " 藍心千詢 " 自然語言對話機器人,幾句簡單的中文描述郵件的主要意圖,文字規整的英文郵件便 " 躍然紙上 "。
小米 HyperMind 思考中樞能夠自主理解用戶的使用偏好和生活習慣,爲每天早上 9 點出發上班的用戶,自動生成和推送通勤交通建議。
在手機同質化越發嚴重的當下、廠商難以挖掘新的增長點之時,AI 大模型被寄予了沉甸甸的期望。
"AI 大模型很難在現階段或者近幾年帶動手機的銷量上升。"GfK 中國科技事業部資深分析師侯林接受《中國電子報》記者采訪時表示,AI 大模型僅能爲手機錦上添花,當前還看不到颠覆性的變化。但從長期來看,AI 大模型與智能手機不斷磨合進步,具備用戶離不開的能力時,可能會帶動中國乃至全球的換機潮。
另外,AI 大模型部署在端側可能會沉澱大量用戶數據在手機上,會讓智能手機從标準商品走向千人千面,用戶在一款手機沉澱下的數據,會增強用戶與品牌之間的黏性,甚至會帶動消費者購買同品牌的其他終端産品。
小米 " 人車家全生态 " 戰略(來源:小米)
例如,被 AI 大模型加持的澎湃 OS 将手機、全屋智能與汽車串聯起來,形成 " 人車家全生态 ",系統将會 " 越用越懂用戶 "。用戶白天在公司上班,系統會自動開啓離家模式,家裏的一切安防設備會自動打開;用戶晚上到家後,系統将開啓在家模式,智能窗簾會關閉,智能空調會根據天氣和用戶習慣打開到合适的溫度。
此外,沉澱了用戶隐私數據和語言風格的端側 AI 大模型将具備更多定制化能力,或将拉動手機廠商的軟性服務。