當 AI 逐步滲透到生活的方方面面,AI 正持續向端側靠近,從手機都電腦再到汽車等産業都将迎來轉折。
浙商證券在研報中指出,生成式 AI 發展之初,由于計算規模巨大,運算處理基本都彙集在雲端進行,如今爲了提升用戶的體驗,AI 能力需要落地到數十億終端設備,成本必将大幅提升,因此,AI處理重心正不斷向邊緣轉移,混合 AI 成大勢所趨,多家科技巨頭 " 盯上 " 各類端側 AI 應用,已競相布局。
浙商證券稱,AI 不止于雲,端側是模型應用不容忽視的重要場景,從概念來看,雲側 AI 是指,在數據雲端彙集訓練,模型通用性強。從終端采集和感知到的聲音、視頻等數據都通過網絡傳輸到雲中心側進行後續處理。
而端側 AI 則是終端設備上進行的輕型模型運用。更多 AI 計算和推理工作負載在手機、筆記本電腦、XR 頭顯、汽車和其他邊緣終端上運行。随着用戶對生成式 AI 應用需求日益增長,端側 AI 的隐私和安全、低延時、可靠性、低成本等技術優勢凸顯。
那麽,當前端側 AI 已發展到哪一步了,未來又會有哪些進展?
AI PC:産業落地轉折點漸行漸近
浙商證券指出,由于 PC 已經有成熟的消費市場,AI PC 已接近産業落地的轉折點。支持人工智能的 PC 市場有望在 2025 年和 2026 年大幅擴張。根據 Canalys 預測,到2027 年 60% 的 PC 将具備人工智能功能。
浙商證券認爲,AI PC 爲各領域提供創新解決方案:
1)高速 AI 處理:AI PC 能快速處理圖像識别、語音識别、自然語言處理等 AI 任務,提高生産力和娛樂體驗;
2)增加 AI 應用:ISV 有望提供 NPU 應用程序,将 AI 功能整合到現有應用程序中;
3)新用例開發:AI PC 推動新的業務用例和服務,包括醫療診斷、自動駕駛等多領域;
4)提升用戶體驗:通過語音、手勢互動、AI 個性化支持和高級安全功能改善用戶體驗。
從 AI PC 進展來看,"英特爾on 技術創新大會 2023" 官宣将在今年 12 月 14 日正式發布面向下一代的 AI PC 的英特爾酷睿 Ultra 處理器 Meteor Lake ,以加速 "AI PC" 時代的到來。
此外,英特爾提出 "AI PC 加速計劃 ",宣布将爲軟件合作夥伴提供工程軟件和資源,以在 2025 年前實現爲超過 1 億台 PC實現人工智能特性:
首次引入了針對人工智能加速的 NPU:NPU 能與所有計算引擎的内置 AI 功能結合實現更高能效的 AI 計算,通過 NPU 降低 CPU 和 GPU 的 AI 工作負載,帶來高能低耗的表現。
通過 GPU、NPU、CPU 不同層級的 AI 算力網絡,MeteorLake 能很好的将 AI 從雲端引入到客戶端 PC 和企業邊緣 PC。
"AIPC 加速計劃 ",旨在爲軟件合作夥伴提供工程軟件和資源。酷睿 Ultra 處理器 "MeteorLake" 将于 12 月 14 日正式發售。
10 月 24 日,聯想舉行了主題爲 "AI for All" 的 "2023 聯想 Tech World 創新科技大會 ",重點展示了聯想在端側大模型方面的能力,以及聯想的首款 AI PC 産品:
個性化優勢凸顯:相比雲端公用大模型,聯想 PC 級大模型 Lenovo AI Now 在面對 " 去斯德哥爾摩的音樂節的行程規劃 " 問題時表現出更加個性化,能夠将家庭地址、酒店偏好等考慮進去。
AI PC 預計 2024 年 9 月後上市,未來還将進入車端。楊元慶會後表示,搭載端側大模型的 PC 要明年 9 月以後才上市,按照規律前期将占有 10% 的市場份額,日後會成爲主流。此外,聯想表示未來端側大模型還将進入車端。
推出針對企業用戶的混合人工智能計劃,旨在保護數據安全。通用訓練後大模型可通過企業的特定數據進行額外的訓練和微調;在端側再加入企業知識矢量數據庫中的特定知識,最後鏈接舊有 ERP 系統、CRM 系統、MES 系統等供應商數據庫,得到混合 AI 系統。
AI 手機:産業爆發前夜
浙商證券認爲,AI 手機有望成爲個人智能助理,爲手機行業帶來創新,對比蘋果 2011 年推出的手機助手 Siri:Siri 采用一問一答的形式,而 AI 手機具有人格化、記憶、感知和管理能力,觸發主動服務,具體來看:
1)智能化和便利的服務體驗:手機作爲使用頻率最高,使用時間最長的電子産品,也是鏈接智能汽車、PC、耳機以及其他智能終端的中樞,植入 AI 大模型後能成爲真正的個人智能助理。
例如語音助手能提供更自然的交互與更精準的意圖識别服務,圖像識别和處理功能可以爲手機帶來更出色的拍照和圖像處理能力,文本生成能力可用于快速撰寫購物評價、生成發言稿等場景。
2)數據更加安全精确:AI 手機需要的數據保存在端側更安全,較雲有隐私優勢,手機用戶自己生成的數據對于智能助理的訓練更加精确。
3)從單個 AI 應用到統一 AI 生态:融入手機系統中的大模型,可以打破各 APP 之間的壁壘,比如郵件、備忘錄、日曆的互相調用,在某一工
作節點發送特定郵件。
AI 手機進展:
1.高通成功将AI布局在安卓手機,2023 年 2 月 23 日,高通技術公司成功在搭載了骁龍芯片的安卓手機上運行了 Stable Diffusion,作爲一款現象級應用,Stable Diffusion 可以基于大模型從文本生成圖片,神奇的背後是複雜的模型和巨大的運算量,其模型參數超過 10 億個。
2.谷歌發布全新 Pixel 8 系列手機,搭載谷歌自研 Tensor G3 處理器和 Titan M2 安全芯片,在手機上首次應用AI智能大模型。谷歌還發布了新版安卓系統 Android 14,以及生成式 AI 加持的谷歌助手 Assistant with Bard。
3. 華爲 / 小米 /OPPO/VIVO
華爲發布 HarmonyOS 4 :通過盤古大模型的底層能力加持,華爲将爲用戶帶來智慧終端交互、高階生産力效率、個性化服務的全新 AI 體驗變革。
小米澎湃 OS:自研端側大模型 MiLM,輕量化語言模型 (13 億參數),手機端側大模型部分場景效果媲美雲端,進一步實現 " 人 / 車 / 家全生态 " 智能化。
OPPO Andes GPT 模型:Andes GPT 作爲 OPPO 自主訓練的生成式專屬大模型,以端雲協同爲基礎架構設計思路,推出從 10 億至千億多種不同參數規模的模型規格。10 月 11 日,聯發科宣布攜手 OPPO 、 ColorOS , 合作共建輕量化大模型端側部署方案,共同推動大模型能力在端側逐步落地。
VIVOOriginOS 4:聯發科與 VIVO 在 AI 領域展開深度合作,率先實現了 10 億和 70 億參數 AI 大語言模型、10 億參數 AI 視覺大模型在手機端側的地。
端側 AI 需要強大芯片硬件支持
考慮到硬件配套、隐私安全、用戶體驗等," 雲側 + 端側 " 的協同設計思路成爲手機行業共識。
模型訓練需要巨大的算力,一定都會在雲端進行,與雲端大模型不同,手機無法支撐通用大模型百萬億甚至千億級别的參數,在此類消費級終端需要做适配處理,提升用戶體驗:
1. 明确雲側和端側的特點和功能,各取所長,協同工作。雲側→大模型訓練;端側→推理。
2. 需要對手機 SoC 芯片做一定的升級,增加大模型所需的 GPU、NPU、APU 等單元。
3. 精簡參數,降低内存占用,以适配手機硬件。減小參數量、量化技術調整、有争對的精調模型等,使模型能夠在端側流暢應用。e.g. 高通使用 AI 模型增效工具包(AIMET)将模型從 FP32 縮小到 INT8。
本文觀點主要來自于浙商證券研報:《2024 · AI" 下凡 " ——端側 AI 深度跟蹤報告》分析師蔣高振,華爾街見聞略有删節