圖片來源 @視覺中國
文丨光錐智能,作者|劉俊宏,編輯丨王一粟
大模型重塑一切的風,吹到了手機行業。
在見識了大模型重塑 IT 基礎設施、營銷、辦公、自動駕駛等行業後,深陷于手機行業銷量和技術雙周期 " 低谷 " 的手機廠商們,急迫且高調地湧入大模型 + 手機的賽道。
走在前面的是華爲和小米。今年 8 月,華爲和小米先後宣布自家手機助手接入大模型。一時間,手機助手也擁有了類似 ChatGPT 一般的深度對話、自然語言理解以及編程能力。
然而,這樣依賴雲端的大模型部署方式,在使用上需要用戶等待太久,并且消耗大量帶寬和算力資源,對話也經常不流暢。
于是,在手機端部署大模型,形成端雲協同的大模型的方案,成了所有手機廠商們的一緻選擇。
爲了把大模型塞進手機,OPPO、vivo、小米紛紛先後推出手機端十億參數級别的 " 輕量版大模型 "。芯片廠商聯發科和高通也根據大模型的需求推出了更适合 AI 計算的手機 SoC(系統級芯片)。
在 11 月即将到來的 OPPO 和 vivo 開發者大會後," 華米 OV" 們将再次在手機大模型上齊聚一堂。
如今,如何用好大模型的能力,雖然手機廠商還在初級階段,但已經在許多方向上有了共識,比如:如何壓縮模型、如何雲和端協同、如何在底層打通大模型和系統、應用的能力等。
在硬件進化多年之後,手機也再次走到了軟件定義手機的新節點,這更考驗手機廠商的研發實力。也正因爲如此,最近手機廠商也紛紛發布和升級自己的自研操作系統,以求在軟件體驗上勝出一籌。
可以預見,一波大模型➕手機的新賣點就在路上,而随着大模型對算力要求的提升,能否拉動起一波新的換機潮,把手機廠商們從寒冬中拉出來?
聚焦大模型," 華米 OV" 的新戰場
中國的手機廠商們喜歡 " 抱團作戰 ",在進軍大模型上也不例外。
" 華米 OV" 各就各位後,大模型在手機上的落地到底怎麽樣?即将進入到 " 實踐檢驗真理 " 的時刻。
首先是近在眼前的 vivo 開發者大會。早在九月,vivo 執行副總裁、首席運營官胡柏山就宣布即将發布自研大模型,并且會和新機一起跟大家見面。
不過,可能是 " 新聞太大,憋不住 ",才一個月過去,vivo 副總裁、全球 AI 研究院院長周圍,開始在微博上不斷 " 劇透 " 即将推出的大模型的信息和能力。
其中,即将發布的 vivoLM(vivo 大模型)一共分爲 5 個版本,按照參數量又分成十億(1B/7B)、百億(66B)和千億(130B/175B)三個級别。其中,7B 的版本是 vivoLM 将對外開放的版本。
在具體的能力上,大模型是很好的文本生成助理,同時也是很好的知識獲取入口。周圍認爲," 文本生成助理,除了普通的生文、總結、擴寫,它甚至能幫你寫 SWOT 分析。同時它也是很好的知識獲取入口,隻要問對問題,它就可以用人人都能聽懂的語句解釋很多專業領域的知識,比你在搜索引擎裏淘金要高效的多,真正的‘旦用難回’。"
按照這個描述,大模型當下與手機的結合可能更接近一個智慧助手的形象。
10 月 11 日,OPPO 宣布基于 AndesGPT 大模型打造的新版 AI 助手——新小布 1.0 開啓了第一輪公測。
OPPO 對手機大模型的應用展望,也是助理形象。" 今天 AIGC 真的像一個人在跟你對話,這是最超出想象的一個體驗。所以,未來的手機一定是你的超級助理。" 在關于 AIGC 和大模型技術的颠覆性上,OPPO 高級副總裁、首席産品官劉作虎在近日的采訪中表示。
比起 "OV" 在 11 月的 " 趕場 ",華爲和小米已經在各自的手機助手上開始了應用。
8 月 4 日,在華爲開發者大會上,華爲常務董事、終端 BG CEO、智能汽車解決方案 BU CEO 餘承東宣布推出大模型加持的全新小藝,更新的功能還是主要體現在智慧交互,能夠完成自然語言理解的設備控制、文案内容輔助、圖片二次創作等功能。
在小米這邊,8 月 14 日小米開啓了小愛大模型的邀請測試,覆蓋大量手機機型和部分智能音箱。升級版的小愛具有理解上下文、更高質量的問答、生成式内容輸出等能力,基本上相當于把文心一言、訊飛星火這種大模型 App 的能力直接嵌入到了手機中。但與 App 不同的是,這種嵌入會更加底層,交互也更多種多樣。
大模型如何裝進手機裏?
把大模型裝進手機,猶如把大象裝進冰箱,有三步。
首先,手機行業雖然在大模型應用的具體架構和路徑上看法不同,但 " 雲端 + 終端 " 的協同設計思路已經達成了共識。
在數據中心,大模型動辄幾百億、上千億的參數,訓練時對應上萬張 GPU 的硬件需求,完整的大模型根本不可能塞進手機 " 消費級 " 的硬件裏面。
而純雲端的方案下,用戶在等待網絡通信的時間、雲計算傳輸時間、判斷反饋時間的疊加下,等待時間太長,體驗非常差。光是結合大模型的輸入法推薦詞的耗時都要長達兩秒,根本沒法用在實時聊天場景中,更别提在地庫、電梯、老辦公樓這些信号較弱的地點了。
再加上,想提供更多的智能輔助,勢必也會接觸到更多用戶信息。這些信息全上傳雲端,那麽隐私等信息安全也無法保證,而就算信息安全能夠支持,這些信息全部上傳雲端,當前存量龐大的智能硬件所産生的天量數據,将對本就 GPU 硬件吃緊的廠商們帶來進一步的網絡帶寬、存儲等各方面硬件上的壓力。
正如高通高級副總裁 Alex Katouzian 所言," 随着連接設備和數據流量加速增長,疊加數據中心成本攀升,(我們)不可能将所有内容都發送到雲端。"
如此一來,要想讓移動終端(手機)擁有大模型的能力,就勢必要在端側安排端側大模型來 " 接應 "。
雲端和終端的分層,是端雲協同的第一步。
" 模型訓練需要巨大的算力,一定都會在雲端進行。而手機端的應用,其實是推理。在推理的時候,模型可以隻激活一部分的模塊、一部分的神經元來計算," 小米技術委員會 AI 實驗室大模型團隊負責人栾劍表示。
另外,雲端和端側的大模型具體的應用場景也有所不同。
例如在手機上可以執行一些簡單的任務,比如寫作、建議、文生圖等。另一些涉及到複雜的知識體系和實時性的信息,不太适合數據采集和學習的,例如訂票、訂酒店等操作,可以調動雲端的能力。
接下來,是改造手機 SoC,在原本的硬件平台基礎上添加适合大模型的 GPU、NPU(神經網絡處理器)、APU(加速處理器)等硬件。
在新款旗艦芯片上,針對大模型的搭載,高通和聯發科都有相對應的升級。例如在 10 月 25 日新鮮出爐的骁龍 8Gen3 上,NPU 性能提升 98%,并且還給了兩個低功耗的 NPU 單元。令人驚喜的是,骁龍 8Gen3 支持 100 億參數的模型。這意味着,當前高通的新硬件裝下手機廠商們的大模型綽綽有餘。
另一邊,與 vivo 和 OPPO 深度合作的聯發科,在其即将推出的天玑 9300 芯片上也集成了新的 AI 處理器。
不過,硬件上的升級還遠遠不夠。要想把大模型 " 塞進 " 巴掌大的手機裏,還需要對大模型 " 瘦身 "。
在參數層面,手機廠商們普遍選擇十億級别的大模型落地。例如小米的 13 億、vivo 的 10 億和 70 億、OPPO 的 70 億等。參數量的減小,有效降低了大模型在側端占用的存儲空間,避免了千億級的大模型,光是參數就要占據幾百 G 存儲空間的尴尬。
在參數精簡後,廠商們還需進一步調整模型,來讓小參數同樣能得出大參數的結果。
以華爲的全新小藝爲例,小藝是在華爲盤古大模型的基礎上,針對終端消費者場景構建并精調的對話模型。在調整中,小藝重點學習了終端消費者可能産生的數據,如對話、設備操作,購物、吃穿用度等生活常識。在針對學習讓大模型 " 專精 " 後,華爲在 prompt(提示詞)和輸出格式做了逐字分析和壓縮,最終實現推理時延減半。
另一邊,當前的量化技術也在推動大模型變小。例如将模型從 FP32 縮小到 INT8。所謂 FP32,是一種單精度浮點數,可以表述小數點後 7 位,相當精确,但是運算開銷較大。INT8 就是 8 位整數,隻占用 1 個字節,運算開銷較小。這個過程,可以理解爲把原本精細的計算部分模糊化,量化操作讓端側的大模型無需達到雲端的 " 盡善盡美 ",也能給出合理的答案。
端雲協同、硬件升級、大模型壓縮,經過這三步,大模型基本就可以合格的裝進手機中。
但實際上,大模型真正跟系統和應用結合才剛剛開始,一個軟件驅動行業的新周期漸露曙光。
抓住大模型,抓住下一輪手機銷量排位賽
大模型進入手機,來自手機軟件能力的升級,變得前所未有的重要。
參考 vivo 大模型負責人周圍在微博的 " 劇透 "。在大模型的用處中,vivo 分爲自然語言處理、圖像處理、推薦系統、人工智能安全、自動化決策和模型訓練優化五個大類。
對于手機廠商布局端側大模型的動作,栾劍表示:" 首先我覺得從手機廠商來說,一定會探索這種可能性。如果不探索的話,未來有可能在這個領域落後 "。
而在用戶側的感知上,以生成圖像、圖像識别的圖像處理和商品推薦、音樂推薦的推薦系統爲例,大模型的加入,将給智能手機帶來智能化的新高度。
前者可以對應當前手機的 AI 優化攝影功能。區别于之前妙鴨相機這種小程序,大模型接入後的攝影将不再局限自動 P 圖、建議拍攝位置等功能,可以實現自然語言調整圖片内容,甚至還能建議你,自拍擺什麽姿勢最好看。
而後者推薦系統将有望打破音樂、購物、出行、餐飲、長短視頻等一系列 APP 的 " 封閉 " 壁壘,實現不需要打開對應 APP 就全方位接收推薦算法。
這樣一來,大模型或許将改變 APP 的 " 勢力割據 ",重塑應用軟件的生态也不是沒有可能。
更爲關鍵的是,大模型将會和手機廠商自研的操作系統深度結合,提供系統級的體驗。
而手機軟件體驗上的差異,将解決當下手機廠商 " 硬件大同小異,隻能外觀找不同 " 的同質化問題。
消費者挑選更智能的手機,将不需要看評測、對比拍攝樣張、看跑分、看溫度表現等等産品之間的細微差别。大模型的 PK,手機産品将直接表現爲 " 智力水平 " 的高低,這也正是爲何手機廠商們當前開始熱衷大模型 " 打榜 " 的原因之一。
從 AI 定義汽車,到 AI 定義手機、PC,大模型的注入将在一定程度上重塑手機市場的銷量格局。
當前手機廠商們 " 下餃子 " 式的入局大模型,還隻是個開始,後續應用落地、模型叠代、優化體驗等環節,眼見着将成爲手機行業玩家們的新一輪 " 無限遊戲 "。
而來自軟件層面 " 看得見,摸得着 " 的智能化體驗,也将對過去手機發布會關于 " 攝像頭如何來之不易 "、" 性能參數又赢蘋果 "、" 手機殼材質太極限了 " 這些内容的大侃特侃,注入全新的内容活力。
更重要的是,大模型倒逼手機算力的提升,也将帶來一波換機潮。
過去,因硬件配置過剩,出現了一台手機用 5 年的 " 手機釘子戶 ",大模型的升級體驗或許将給其一個無法拒絕的換機理由,從而爲手機行業帶來銷售層面的增長。