手機 AI 浪潮的 2.0 時代來了。
自去年安卓廠商紛紛接入大模型,推出第一批主打 AI 功能的手機之後,手機與 AI 的融合進程就切換到了快車道。上個月,蘋果甚至在 AI 功能還未正式推出時,就将它作爲 iPhone 16 的主打功能進行宣傳,足見競争形勢的激烈。而現在,安卓陣營這邊的第二代手機 AI 産品也紛紛蓄勢待發。
必須承認,要将 AI 大模型能力融入手機,廠商所面臨的問題依然嚴峻。這裏并不完全是模型性能的問題,而更在于産品設計。當下「AI + 手機」産品的自動化、便捷化的程度不足,相關功能滲透率依然不高,遠沒有「出圈」。
想要打造真正好用的「手機 AI」,不隻是要做出好的 AI 功能,而是要從系統層出發,對系統内整體的交互邏輯進行重構,使它變得更智能。
2024 vivo 開發者大會上,vivo 推出煥新升級的 OriginOS 5。這代新系統不隻是 AI 功能更強大、更智慧,系統全局的各項能力也都再次叠代。vivo 的目标,是讓 OriginOS 成爲 AI 時代最好用的手機系統。
01 以「便捷」爲核心的設計
過去一年,大部分手機廠商做 AI 功能的思路,都是先圍繞「聊天」式的交互展開。
以「聊天」爲起點很合理,因爲「智能語音助手」已經是手機上存在了十年以上的功能,AI 大模型的應用落地也是從 ChatGPT 等「聊天機器人」開始的。
問題也正出在這裏。對普通用戶來說,要完整地組織語言發出一條指令,編寫一條 prompt,是一個成本很高的行爲。智能手機相比 ChatGPT 這種沒有任何數據基礎的 AI 應用,最大的優勢在于,很多數據其實已經在手機上了,不應該再讓用戶手動輸入。
但在這個過程中,也有兩個問題要解決。一是要将 App 内各種各樣的數據轉化爲 AI 能夠理解的格式,其次則是在授權的層面要做出清晰界定,防止隐私洩漏和數據污染的問題。
這就是 OriginOS 5 最核心的 AI 功能升級,Jovi 語音助手與「藍心小 V」深度融合,藍心小 V 不再是一個單純的語音助手,而是擁有了更全面的功能。用戶現在可以長按導航條喚醒藍心小 V,喚醒之後,不隻是可以語音、文字輸入指令,而是可以直接框選當前屏幕上的内容,輸入給藍心小 V,進行搜索等後續處理。
這一設計非常巧妙,因爲大部分時候我們想要搜索、處理,就是我們眼前正在看到的内容,通過「圈搜」的方式,最大程度降低了輸入的負擔,也避免了 App 适配和兼容的問題,可以覆蓋手機内一切場景,還保證了隐私的邊界。
小 V 圈搜的用法覆蓋了各種場景。比如看到一篇小紅書筆記,可以圈搜圖片上人物的相關資料、相關商品;圈出一段聊天記錄、機票火車票訂單來創建日程;截取一段電子書、文章、工作材料進行翻譯、生成一篇備忘筆記……
更重要的是,用戶在框選内容之後,依然可以主動輸入指令,進行各種不同的處理,而如果這個「視覺識别」的邏輯拓寬到攝像頭,用戶可以拍攝現實中的任何内容輸入給 AI,進一步将藍心小 V 的可能性拓寬到無限大。這個功能在目前已在 OriginOS 5 裏落地,是以「vivo 看見」的形式存在,主要聚焦于視障人群,幫助他們理解周圍的環境。借助 AI 大模型的理解、檢索、生成能力,這個功能的外沿還有被進一步拓寬的空間。
基于同樣的「讀屏」邏輯,vivo 還對輸入法進行了優化,推出了小 V 寫作功能。在各種聊天界面、電商評價、朋友圈發布界面,都可以基于當前手機屏上顯示的内容,自動生成内容,輔助用戶進行文字編寫。
這一切都并不是模型層面的革命,而是單純的産品創新。但它帶來的體驗優化顯而易見。想通過 AI 助手 App 實現類似的「智能回複聊天」功能,用戶需要在聊天界面截圖、裁切,在 AI App 裏編寫 prompt,得到回應,再将回應的内容複制到聊天框,而現在則隻需要點擊按鈕就可以實現。
除了讀屏之外,OriginOS 5 還加強了各種場景下,多模态數據的「自動處理轉換」能力。新的小 V 電話助手、小 V 幫記可以将電話、線上會議的音頻實時轉成文字,顯示字幕,并進一步實現「智能生成摘要」、「同聲傳譯」等功能。這個功能的用法已經很成熟,我們今天大部分電話會議都會有錄音,以及轉寫的文字版。但在手機系統内植入這一功能的最大優勢在于,它可以将不同協作平台、不同場景下的電話、會議記錄集合到一起,更易于管理。
大模型 AI 是一個覆蓋面極爲廣泛,但也因此很抽象的技術,難以進行具體的功能定義。大部分廠商,都把這個問題化作一個開放的輸入框,丢給用戶去思考。最終導緻了 AI 産品的邏輯并不複雜,就是一個聊天界面,但用戶實際依然不知道它有什麽用,要怎麽用。
可以說,OriginOS 5 開啓了一次「便捷化」革命,将手機上的數據,送到離 AI 大模型接口更近的地方,方便用戶更容易觸達。這是 AI 2.0 時代最重要的主題。
02 幫 AI 建立「長期記憶」
除便捷化之外,當下所有大模型 AI 産品,面臨的另一大難題是「記憶」:幾乎所有大模型産品,都無法對用戶進行深入了解。在和用戶對話的過程中,之前内容的權重會被迅速稀釋。也就是說,AI 特别「健忘」,很多時候用戶要重複輸入同一指令,來保證 AI 還記得之前的要求。
對手機來說,問題也是類似的。我們進入移動互聯網時代已經超過十年了,很多人手機上、雲端儲存的,是十年跨度的數據,這些數據淤積在手機裏,檢索起來變得非常困難。
這裏最典型的場景是相冊。很多人相冊裏都儲存了上萬張照片,要從中迅速找到一張特定的老照片,變得非常困難。所以過去幾年每個手機廠商都在做相冊的自然語言檢索,依據位置、人物等等标簽進行分類……
但在相冊之外,如何讓手機真正成爲我們的「人生數據庫、回憶錄」,依然是一個更大的問題,而這又恰好是大模型 AI 能夠發揮作用的一個場景。
vivo 在 OriginOS 5 的相冊裏加入了「時光剪影」功能,不隻是幫用戶迅速找到想要的照片,而是對照片進行二次組織、加工。它可以自動篩選出一段時間裏的照片,通過大模型理解這段回憶,進行智能剪輯、配文、配樂,其中還新增了支持生成 AI 人聲音樂的功能。
這是全行業的大趨勢。過去我們在計算機上處理的數據都是「文件」,是以「數據庫」的邏輯進行組織的。但在智能手機時代,這些數據是我們自己拍的照片、寫的筆記、與他人聊天的記錄,是非常具體的經曆和回憶,完全可以用一種更貼合人腦思維的方式,以富文本、視頻的形式,進行多模态的組織。
在 OriginOS 5 上,最能體現這一思路的功能是「小 V 記憶」。功能上,目前小 V 記憶很像一個「日記本」,能夠把不同模态的數據整合在一起,以類似手帳的方式呈現出來,其中包括圖片、視頻、文本、網頁……
而在「小 V 記憶」的「圖譜」功能裏,它把用戶本機的文件數據全部進行了标簽化處理,按照語言邏輯,生成了一張圖譜,借此将不同的文件串聯在一起。而這些數據,明顯有成爲 AI 知識庫的潛力。就是說,未來用戶可能可以利用 AI 助手,來快速挖掘自己手機上的所有文件信息,以及信息之間的關系。
而更重要的是,AI 也可以借助這一套私人知識庫,建立起對用戶的深入、長期理解,來滿足個性化的需求。也就是說,未來我們在和 AI 交互的時候,很多具體的需求,不需要在指令裏詳細說明,AI 就能「心領神會」。
在實現輸入的便利化,建立起長期記憶和私密知識庫之後,手機與 AI 結合的未來,還有巨大的想象空間等待着探索。
這次 vivo 放出的新功能中的「訂座助手」,就能讓我們稍微一睹這樣的未來。它基于大模型的理解和生成能力,在用戶輸入用餐需求後,會自動查找餐廳、獲取商家聯系方式,撥打過去并代替用戶與商家進行訂座溝通,最後返回結果,臨近預約時間,用戶會收到提醒,之後可以一鍵導航到餐廳。
聽起來可能有點太超前,甚至像科幻小說的情節。但它的确展示出,當 AI 充分利用了手機的各項功能之後,能便捷地實現多麽複雜的任務。
03 智能手機系統的下一步是做「減法」
盡管 AI 是 OriginOS 5 最重要的叠代更新方向,但我們應當意識到,AI 隻是手段,它背後隐含的更重要的時代背景,是智能手機的「減法革命」。
過去十年,智能手機叠代的大方向是做「加法」。屏幕越來越大,儲存越來越高,伴随着通信技術和帶寬的提升,可以說,智能手機終結了信息匮乏。
但現在,越來越多用戶面臨的問題是信息過載。我們生活中的設備越來越多,App 越來越多,爲搶奪用戶注意力的過度設計也越來越多。買一張機票有 4 個 App 推送通知,很多内容看完就忘了在哪看過,各種菜單的層級、選項,多到眼花缭亂。即便用了這麽多年的智能手機,也常常找不到自己想要的功能在哪。
所以,智能手機下一步的發展方向,特别是軟件層面的叠代,就是要解決這個問題。
OriginOS 5 上,另一個很重要的功能更新是「原子島」。表面上,它的産品邏輯和 iPhone 的「靈動島」非常相似,後者是爲了适應 iPhone 硬件變化推出的功能。但「原子島」不太一樣,它不隻是利用屏幕的一塊區域顯示點什麽,更重要的是,它還具備「預測、建議、信息流轉」的能力。
比如,「原子島」會基于日程事件、用戶習慣,主動提供 AI 服務建議。比如用戶複制了一行地址,拖到「原子島」區域,就能快速跳轉到地圖;複制圖片,就會優先出現「發送到微信」等分享選項。複制航班代碼,原子島就會自動彈出查詢航班信息的按鈕。
過去,智能手機的功能都被封裝在 App 裏,不同 App 之間缺乏協調機制,導緻了信息的重複問題。而「原子島」、「小 V 建議」的出現,就是要利用更少的 UI 元素,實現更多的功能服務。過程中通過 AI 能力來預判用戶的需求,從龐雜的信息中濃縮、總結出重要的部分,幫助用戶「消化信息」。這也是 AI 大模型與手機結合的重要意義。
智能手機系統上一次類似的革命,是 UI 設計從拟物走向扁平化,凸顯出信息,降低用戶的視覺負擔。這一點上 OriginOS 5 依然在持續優化,統一了很多視覺動效,增強了界面之間的空間關系效果,并強調「數字化設計」,增強關鍵信息的呈現。
最後,OriginOS 5 也對最基礎的流暢性、續航、網絡信号等性能進行了升級優化。通過「Ledger 儲存賬本」對内存進行底層統一調度,減少了 App 長時間前台使用時,過度占用内存的問題,減輕了 App 負載帶來的卡頓。還對動畫流暢度、能效續航、抗老化能力分别進行了針對性優化。
實際上,無論是基礎的流暢性能優化,界面交互上的創新,還是最前沿的大模型 AI 功能,它們最終都指向了同一個目标,即如何在提供最豐富功能的同時,最大程度減少用戶的負擔,保持操作系統的高效。這是未來智能手機操作系統「好用」的關鍵。OriginOS 5 通過一系列的便捷化設計,AI 功能創新,性能優化,已經成爲 AI 時代最好用的國産手機 OS 之一。
找到正确的方向路徑,通過與 AI 能力更深入地結合,OriginOS 的未來也因此變得更值得期待。
* 頭圖來源:vivo
本文爲極客公園原創文章,轉載請聯系極客君微信 geekparkGO