随着生成式 AI 日益火爆,大語言模型能力引發了越來越多對于智慧語音助手的期待。
我們相信,AI 大模型能力加持下的智慧語音助手一定會很快落地,這個預判不僅來自對 AI 大模型的觀察,更來自對鴻蒙的了解。鴻蒙一定會很快升級大模型能力,放眼業界似乎也隻有鴻蒙能夠在短期實現這一點。
之所以這樣說,是因爲讓大語言模型融入終端生态不僅是個算法問題,更需要讓 AI 模型能夠了解、指揮、交互操作系統生态中的海量能力。這不是短期内能夠做到的,而是需要從操作系統與基礎軟件層面,不斷去發展 AI,适應 AI,最終讓大語言模型、生成式 AI 代表的新 AI 能力,水到渠成、瓜熟蒂落般成爲用戶體驗的一部分。
而華爲恰恰是最早将 AI 能力帶到手機中的廠商,鴻蒙系統從最初就基于智能技術來打造和演進。可以說,AI 就是鴻蒙最濃墨重彩的基因之一。這種基因會不斷生長,滿足更多用戶對智能體驗的想象和期待。
8 月 2 日,華爲常務董事、終端 BG CEO 餘承東在微博分享了一個視頻。内容是向用戶 " 劇透 " 了 HarmonyOS 操作系統的一項重磅功能:讓小藝來幫助用戶生成内容。
從微博中展示的小藝新能力來看,其已經具備了 AI 大模型與生成式 AI 的典型特征,創作的一則 HDC 邀請文辭恰當、邏輯通順,且能夠準确描繪出關鍵詞。
這也意味着,即将到來的鴻蒙 4,極有可能帶來業内首個植入系統的 AI 大模型語音助手。
這似乎是一段《紅樓》裏的木石前盟,無更無改,注定發生。鴻蒙與 AI,就花開在這個夏天。
AI 基因
鴻蒙一以貫之
早在 2017 年,華爲就在手機端發力 AI 能力。此後多年當中,AI 攝影、AI 智慧助手等大量 AI 能力逐漸成爲了華爲的招牌。而很多朋友沒有注意到的是,今天廣爲人知的鴻蒙特性,也是建立在 AI 技術底座上的。
軟件解耦、新一代物聯網技術與 AI,讓鴻蒙從誕生之初就具備了更加智能的多終端協同體驗。它通過軟總線、分布式技術,将多個物理上相互隔離的設備融合成一個 " 超級終端 "。而 " 超級終端 " 想要發揮作用,首先要解決兩個問題:一是操作系統需要理解用戶所在場景,二是用戶可以靈巧、便捷地完成多終端操作。這兩個目标,都需要大量依靠 AI 技術來實現。
在 2019 年正式發布的 HarmonyOS 系統中,就可以看到随處可見的 AI 算法與 AI 體驗。
随後,在鴻蒙的高速進化中,智能化能力也随之演進。2021 年 6 月,華爲正式發布 HarmonyOS 2,帶來了統一控制中心、超級終端、萬能卡片全新體驗,大量用戶開始了解、習慣全新的鴻蒙特性。
2022 年 7 月,HarmonyOS 3 開啓升級,帶來了包括超級終端、萬能卡片、流暢性能、隐私安全等特性在内的六大升級,智能化體驗也得到了進一步提升。
提起鴻蒙生态中的 AI 能力,就不得不提到小藝。爲了管理海量設備與服務,語音助手的中樞作用必不可少。因此,小藝基于其 AI 能力,就成爲了鴻蒙生态所有設備的統一入口、服務精準推薦的統一助手。同時,通過 AI 彈性部署、優選觸點、協同服務等技術,小藝也在不斷提升自身的智能化體驗。
由此可見,鴻蒙生态不是突然要發力 AI,而是鴻蒙就發端于 AI,成長于 AI,并成爲 AI 技術持續演進的沃土。深種在鴻蒙土壤中的 AI 靈根,在等它的花信年華。
大模型與小藝
水到渠成的緣分
在今天,智能語音助手已經無處不在,但它的體驗卻依舊有很多問題。比如說:
1.AI 對話依舊不流暢,尤其是多輪對話、中長期記憶對話體驗不佳,從而導緻用戶缺乏持續打開語音助手,提出複雜需求的意願,久而久之降低了語音助手的使用價值。
2. 語音助手的自然語言理解能力不強,邏輯推理能力不足。産生了用戶必須用嚴格的詞彙和讀音才能準确進行語音交互,日常化、口語化的對話大量無法識别。這一點對于老人、孩子以及不了解 AI 語音交互的用戶來說非常不友好。
3. 語音助手僅夠喚起服務,不能夠生成内容。這就導緻語音助手能夠帶給用戶的價值極大降低,難以培養用戶持續的語音交互習慣。
不難發現,大語言模型與生成式 AI 的能力,恰好可以填補語音助手的這些缺憾。但在此前,大模型的開發者普遍集中于 AI 廠商,距離消費終端的應用場景與軟硬件體系距離較遠。
如何才能彌補這個距離呢?答案是需要一個水到渠成,瓜熟蒂落的過程。
大模型走向終端場景,首先需要算法本身的能力。這方面,華爲已經有了足夠的積累。7 月 6 日,來自華爲雲的盤古氣象(Pangu-Weather)大模型登上《Nature》正刊。這項研究成功解決了現有 AI 氣象預報無法處理不均勻的 3D 氣象數據等關鍵問題,讓其成爲了首個精度超過傳統數值預報方法的 AI 方法,并且預測速度提升了超過 10000 倍,可秒級完成對全球氣象的預測。
在多年的積累下,盤古系列大模型已經在多個領域走到了全球前列。加上華爲在 AI 開發平台、AI 開發框架領域的積累,都讓大模型與鴻蒙結合變得更加順利、周全。
而在終端側,華爲對 AI 技術進行了豐富的探索。比如說,我們此前已經看到了小藝的智慧搜圖功能。這一功能就結合 AI 多模态能力,通過對泛化語義的理解搭配模型小型化處理技術,率先在業界實現了手機自然語言搜圖。
從模型到工具,從軟件能力到開發者生态,鴻蒙都做好了準備,迎接 AI 大模型的到來。浪漫一點說,鴻蒙多年的 AI 耕作,可能就是在等待這個夏天。
鴻蒙 4 的 AI 約定
就在這天花開
大語言模型、對話式 AI 的可能性,就應該在終端語音助手的角色上綻放出來,而其花開處,可能隻會在鴻蒙的花園裏。
從推測角度來看,鴻蒙 4 中我們可能就會看到深度融合了大語言模型的小藝。雖然我們現在對其具體能力還不得而知,但結合大模型的能力以及鴻蒙過往的表現,還是可以預判一下接下來會發生什麽。
在這裏,我們不妨一起來進行些暢想:
1. 像和真人對話一樣與小藝交流。
大模型帶來的強泛化,強魯棒特性,極大增強了 AI 的自然語言處理能力。說白了,就是讓 AI 可以更好理解語言,無論是諧音、比喻、指代都不成問題。這樣的能力毫無疑問将是接下來鴻蒙 4 的升級重點。我們接下來将會像和真人一樣與小藝交流,甚至忽略它語音助手的真實身份。
2. 看到,聽到,也能服務到。
基于小藝來喚醒服務閉環,是鴻蒙系統的一大特性。那麽基于大模型帶來的多模态理解能力,有理由相信接下來小藝會加強服務的觸達能力。讓小藝聽和看,都将成爲鴻蒙 4 的服務入口。
3. 把簡單留給自己,把複雜留給小藝。
在大語音模型剛剛興起的時候,很多人都願意故意說一大段話,讓 AI 去逐層理解分析其中的意思。如果說在當時這隻是遊戲,那麽在鴻蒙 4 中大模型的邏輯推理就會變成能力,更多更複雜的任務,将會由小藝在鴻蒙的世界中來執行。
4. 不僅是找東西,更會創造東西。
長久以來,語音助手扮演的角色都是尋找服務和信息的入口。但在大模型時代,語音助手可以不止找到,而是去生成和創造。接下來,或許我們将依靠小藝來完成辦公、生活、學習中的各種任務,幫我們創造各種内容。
不妨帶着這些暢想,一起去看看其中有幾個能夠在鴻蒙 4 當中實現。鴻蒙與 AI,這段木石盟注定要在這個夏天花開結果。
答案,就藏在接下來的 HDC 當中。當然,鴻蒙與 AI 的更多情緣還藏在未來,藏在萬千開發者的腦洞中,藏在無數用戶的期待裏。