圖片來源 @視覺中國
文 | 光子星球,作者 | 吳坤諺,編輯 | 吳先之
急需找到新飛輪的手機廠商,盯上了大模型。
華爲在 8 月初的開發者大會上宣布将在 HarmonyOS 4 中搭載的 AI 助手小藝接入大模型,并在 8 月底邀測;小米也差不多同一時間開啓了其 AI 助手小愛接入大模型的邀測。OPPO 與 vivo 緊随其後,兩者均在 11 月開始手機大模型的落地嘗試。
" 将大模型塞進手機 " 于業界并不是新鮮事兒,不談自 10 月中旬開始密集預熱的 vivo,榮米 O 三家均曾在今年召開的發布會上透出過相關消息。業界普遍看法是智能手機賽道的硬件部分幾乎卷無可卷,而大多跑在雲端的大模型恰是一個遊離于硬件之外的變量。
需要注意的是,端側部署對大模型賽道而言同樣也是行業趨勢。以 ChatGPT 爲例,作爲雲側大模型的典型代表,其訓練與推理都跑在微軟的 Azure 上,用戶則通過浏覽器或 App 獲取結果。input-output 來回之間,不僅存在影響使用體驗的時延,耗能、算力等雲端成本也居高不下。
從實際場景與需求來看,不少需求完全可以通過邊緣設備來滿足,尤其是手機、PC、新能源車等廣泛應用的終端。
于是,大模型的端側部署逐漸成爲共識,不僅有手機廠商鉚足了勁訓練模型,PC 賽道聯想與芯片賽道的高通等均在前段時間發布了端側 AI 的相關解決方案。尤其是剛剛發布的高通骁龍 8 Gen3 以及聯發科天玑 9300,其 AI 性能的提升可以說是手機端大模型的基礎。
行業需求與硬件條件都已被滿足,大模型終于可以進入手機之内。可令人頗爲意外的是,率先掏出 " 完整産品 " 的手機廠商竟是 vivo。
vivo 大模型成色如何?
11 月 1 日,vivo 召開開發者大會,于會上發布了自研大模型矩陣 " 藍心 "(BlueLM),包含十億、百億、千億等不同參數規模。同時還發布了适配其大模型的自研操作系統 OriginOS 4。
面對大模型這塊 " 應許之地 ",vivo 的急切幾乎寫在臉上。
據 10 月 26 日市場調研機構 Canalys 公布的最新數據,vivo 出貨量出貨量下滑,排名也出現下跌。vivo 迫切需要大模型以及 OriginOS 4 來扭轉局勢,率先下場 " 開卷 " 并不讓人意外。
而且與大模型相比,本次 vivo 推出的 OriginOS 4 的更新跨度略顯寡淡。在公域讨論中,不僅其虛拟顯卡、異構計算空間與輕量化等叠代幅度不及預期,vivo 用戶中聲量頗高的原子通知等模塊也沒有升級。也就是說,大模型才是本次發布會的主角。
從業務模式看,vivo 本次發布會展示的路線與此前業内其他玩家相似,以人工智能助手爲載體,采取端側 + 雲側混合的部署方式,其中作爲重頭戲的端側大模型,呈現本地化、輕量化的明顯特征。
這麽做的目的顯而易見,手機這一方小天地所提供的功耗、算力與機房不可同日而語。隻是如何将模型能力與手機深度結合成爲手機廠商們迫切需要突破的 "konw how"。
對此,vivo 給出的解決方案是推出多參數規格模型,其中主要面向文本場景的 10 億規格與面向自然對話、知識問答長焦的 70 億規格爲端側部署的重頭戲。在官方介紹中,10 億規格單獨面向端側,70 億規格設爲端雲兩用,自 700 億起均爲雲端部署,這也體現了 vivo 在端雲協同上 " 讓上帝的歸上帝,讓凱撒的歸凱撒 " 的矩陣思路。
這與谷歌在今年 5 月的 I/O 開發者大會如出一轍,當時谷歌發布的大模型 PaLM2 有四個參數規格,其中小參數模型可在離線狀态下實現每秒處理 20 tokens,适配于終端的離線使用。
如果就此認爲 vivo 是 " 拾人牙慧 " 則未免過于嚴苛。實際上,vivo 早在 2017 年便着手組建内部人工智能團隊,時至今日,vivo 人工智能研究院已有過千研究人員。
縱使其技術沉澱總體上不如阿裏、百度等第一梯隊,但開源社區的存在也讓稍晚入場的玩家們能迅速趕上大部隊。而 vivo 在 2018 年成立的知識圖譜研究院也能在一定程度上補強其作爲手機廠商可能遭遇的訓練數據不足問題。
至于模型能力方面,vivo 在預熱時期便交出了一份不錯的答卷。據悉,BlueLM 在中文大模型第三方測評集 C-Eval 中獲得了 " 受限訪問模型 " 類目的第一名。其官方通告中稱 BlueLM 是行業内首家 7B 端側大模型。
但是在測評中斬獲高分卻實際表現不如人意的模型不在少數,更是有業内人士稱這份榜單已經在過去一段時間被 " 刷脫皮 " 了,隻能代表模型 " 做題 " 的能力而無法體現推理、安全、應變等能力。照此來看,vivo 的業務成果顯然還需要更多實際檢驗。
況且,vivo 目前展示的雲端模型能力如文生圖、交互等并未跳出大模型賽道窠臼,新意有限。而且其作爲重頭戲的端側模型能力還停留在測試階段,同時端側能力的展現也必然受到手機硬件的限制。
我們了解到,多位受邀參與藍心内測的用戶使用的是以 X90 Pro 爲代表的旗艦機,這批機型也是目前 vivo 釋出的大模型應用公測适配時間表中最爲靠前的。
請輸入圖說
毫無疑問,大模型正在成爲手機廠商開辟高端化的第二戰場,同時也是盤活用戶,激活 IoT 的重要變量。盡管如此,vivo 依靠大模型增加高端産品價值的打算,還存在諸多變量
歸根結底,大模型的推出既是 vivo 高端化的新基石,也是其試圖拉動新機與高端産品的一駕馬車。
低端機型自然難以勝任這場高端化的戰争。以 vivo 于本次發布會前發布的基礎機型 Y100 爲例,這是上述适配計劃中最晚上線的機型之一,如此類似 " 背刺 " 的舉動背後是 vivo 希望靠高端産品重回王座的 " 小算盤 "。
縱使如此,大模型的推出還是不太能成爲 vivo 高端産品的加分項。
開源社區端側大模型創業者王陽(化名)告訴光子星球,大模型在端側的能力表現在于其 NPU(專門爲深度神經網絡計算而設計的處理器)所帶來的 AI 性能。而在 vivo 既往機型中,并不注重 NPU 能力,因此老機型大概率難以順暢地跑大模型。
至于即将發布的,搭載聯發科天玑 9300 旗艦芯片與新一代 AI 處理器的新機型 vivo X100 系列或許能順暢使用模型能力,但在在市面上早已存在文心一言、訊飛星火等大模型應用的情況下,留給手機端的空間沒有想象中那麽大。相比于能力,或許 vivo 這次展示的玩法更值得深究。
讓手機再智能一些?
力推微軟成爲 OpenAI 天使投資人的微軟 CTO Kevin Scott 曾公開表示,模型本身不是産品,而是基礎設施。言下之意是在訓練精調出模型底座後,産品化的探索才是一衆玩家們 " 二次創業 " 的核心。
大模型于手機端的 " 再産品化 " 水到渠成,但部署于手機端的大模型,還需要進一步産品化探索。從目前曝光的信息看,vivo 将通過一款名爲小 V 助手的應用來實現大模型能力,而目前業内主流路線也是将大模型能力嵌入既有的人工智能助手之上。
智能手機使用者存在對大模型理解能力的現實需求,無論是被戲稱爲 " 人工智障 " 的智能助手還是在容量爆炸下日益臃腫的應用與數據,都需要手機能更懂交互,幫助用戶梳理信息。而大模型的加入,本質上便是爲手機帶來自然語言理解能力。
未落地實裝的情況下,端側模型可能出現的功耗、散熱、時延等用戶體驗問題可以暫且不談。在王陽看來,vivo 模型落地面臨的首要問題是多款模型配合使用時,如何區分不同模型的能力邊界以及如何調用," 這關乎最終的産品形态以及呈現 "。
面對場景泛化且需求複雜的 C 端,不同需求調用的模型各不相同。例如端側的 10 億規格模型與 70 億規格模型需要針對用戶本地數據學習,試圖 " 更懂用戶 "。那麽能否通過模型能力以及與之适配的 OS,在手機上實現複雜指令是重要指标。
目前來看,BlueLM 展示的複雜指令功能頗具亮點。在新發布的 OriginOS 4 之下,小 V 助手常駐側邊欄的右下角,點擊即可彈出。不僅操作邏輯相對雲側模型更短,更适配手機使用,同時也可以理解 OS 内的一些複雜指令,例如智能搜索相冊、初步完成第三方 App 指令以及 OS 内設置等。
值得一提的是,小 V 助手在功能與路徑上,和 vivo 既有的 Jovi 語音存在隔離,兩者相互獨立,這是明顯有别于此前其他廠商提出的端側大模型路徑。
從功能上看,小 V 助手基本可以做到 Jovi 語音的全覆蓋,那麽兩者區分的目的很可能是爲了便于用戶感受兩者之間的差别。而且小 V 助手的産品邏輯形态與微軟全家桶中搭載的 Copilot 相似,兩種不同的路徑很可能會在未來完成整合。
這也體現出目前的 BlueLM 還處于試水階段,産品形态難言成熟。
據參與 BlueLM 内測人士反饋,以 vivo 旗艦機型使用模型能力,輸入 20 tokens 以内的純文本生成需求還存在 2s~5s 的時延,這對于後續實裝而言不算是個好消息——雲側模型的時延并未得到很好的解決。這一點或許會在搭載芯片廠商最新 AI 芯片的機型中得到改善,隻是對于消費者來說,這并不構成換機的理由。
此外,作爲行業内首個手機大模型,vivo 的雲側模型能力還面臨許多雲廠商大模型的 " 圍剿 "。
例如 vivo 宣布将上線應用商店的對話機器人藍心千詢,1750 億的參數規格與當下應用商店中的大模型相比并不顯眼。雲廠商中的百度已經就近日發布的文心 4.0 專業版試水收費,而藍心千詢看起來更多隻是 vivo 大模型生态中不算亮眼的一員,其道路顯然有阻且長。
不得不提的還有 vivo 作爲後來者,技術沉澱的差距也将限制其大模型業務的進一步推進。
軟件方面,vivo 大模型已經成爲阿裏雲旗下 Pai 機器學習平台的宣傳素材,我們甚至可以從 " 藍心千詢 " 的命名中找到 " 通義千問 " 的影子。跑在雲上的業務意味着長期成本,這一點在 OpenAI 上體現得淋漓盡緻。成本視角下,如果 vivo 希望将 BlueLM 發展成爲長期生态,自建 IDC 顯然比上雲更利于長期發展。
硬件方面,華爲與蘋果兩家頭部廠商早已在現有産品線中集成自研的 NPU 能力,vivo 則還需依賴于芯片廠商。即使模型訓練與調優方面可以構築一定壁壘,但作爲核心的硬件差距仍導緻其與頭部廠商拉開了數個身位。
大模型的終端戰事
大模型的加入,讓我們重新認識到智能手機的本質是一種集成多種能力的智能終端,且同時身兼硬件與 OS 兩大入口。得天獨厚的條件使得手機天然需要與大模型相結合。
那麽其他終端是否也可以接入大模型,就像重做應用一樣重新定義終端的能力邊界?
對于這一問題的探尋可以追溯到深度學習網絡爆發之時,而對端側模型可能性探讨也源于業内人 " 老生常談 " 的時延、能耗、隐私等問題,大模型的爆發成功地讓手機成爲裝舊酒的 " 新瓶 "。
實際上,早在本次往手機裏塞大模型的熱潮正式開啓前,新能源車攜自動駕駛早已成爲大模型的一個終端。業内也不乏智能可穿戴設備搭載大模型的暢想,隻是手機似乎即将憑借場景多樣性與網絡便利而後發先至。
更進一步說,當手機廠商密集發布大模型并投入使用後,屆時便是端側模型的一個絕佳的練兵場。我們也可以自手機大模型的落地情況,探讨多種終端搭載大模型的方法論。
畢竟,無論手機上的模型如何出色,短時間内能做到的最佳表現無非是一位用戶生活領域的 " 秘書 "。其他智能終端搭載大模型所帶來的想象力無疑更大。
例如目前因移動支付而逐漸退出曆史舞台的 ATM,能否憑借大模型,讓用戶無需前往銀行排隊辦理深度業務;亦或是同屬 B 端場景的智能攝像頭,在醫療領域識别患者基本體征、在工業領域快速質檢、在農業領域智能灌溉等。而今憑借雲側模型未能廣泛打開的 B 端市場,也可能将迎來端側這一變量。
這也是爲什麽 vivo 會在其生态尚不及華爲、小米完善之時,便在本次發布會上展示了搭載在新款 vivo Watch 的藍河操作系統(BlueOS)。作爲 vivo 面向通用人工智能時代研發的跨端系統,其推出旨在通過手機帶動一系列 IoT 産品,無疑具備不錯的想象空間。
vivo 亦宣布開源其 7B 規格模型,并推出了藍心大模型開發套件 BlueKit,生态建設的野心昭然欲揭。或許目前 vivo 隻走到了讓 IoT 聽得懂指令的階段,但這對于 vivo 其後的高端化、生态化等戰略相當重要。
手機大模型的能力未知,面臨的挑戰很多,正式發布與落地之後,勢必爲業内帶來更多 " 開卷 " 的方向。更多千奇百怪的落地姿勢,正在等待業界的解鎖。