谷歌語音助手将升級，大模型讓其變得更聰明

作者 | 虞景霖

編輯 | 鄧詠儀

北京時間 8 月 1 日，據 Axios 獲得的谷歌内部備忘錄顯示，谷歌計劃将最新的大語言模型（LLM）技術引入 Google Assistant，提高其内容生成能力，該技術類似于 ChatGPT 和谷歌自研的 Bard 聊天機器人。

大模型熱潮來臨後，巨頭們都正在用大模型将自家産品一個個 " 升級 "。比如微軟與 OpenAI 建立合作後，将生成式 AI 助手就嵌入到 Edge 浏覽器、Microsoft Office 和 Azure 雲服務中，讓服務變得更加智能

Goggle Assistant 的升級同樣體現了這一點。

Google Assistant 是谷歌開發的語音助手，相當于亞馬遜的 Alexa 和蘋果的 Siri。用戶隻需說出喚醒詞 "OK Google" 或者 "Hey Google"，Google Assistant 就會執行用戶在這之後發出的語音命令，例如暫停視頻、指定任務或者接聽電話。

Axio 的備忘錄并沒有詳細說明 Assistant 将要增加哪些具體功能，但大概率将具有和 Bard 類似的 AI 聊天功能—— Bard 是谷歌基于 PaLM 2 之上建立的對話式 AI 模型。

新的 Google Assistant 或将采用 LaMDA 來生成邏輯通暢、文本自然的對話語言，從網絡上收集信息後回答用戶問題。

而引入大模型之後的 Google Assistant，也會更加 " 聰明 "。以前，Google Assistant、Siri、Alexa 一類的語音助手，常被視作 " 假 AI" ——因爲它們隻能支持簡單的用戶交互，例如回答 " 明天天氣如何？" 一類的簡單問題，或者提供圍繞問題搜集到的信息，供用戶參考，還經常答非所問。

将 Bard 和 Google Assistant 結合，是一項互補的操作。Bard 能根據從網絡上搜索到的信息回答問題，但無法單獨執行用戶指令，和 Google Assistant 結合後，依附一定的載體，就能實際執行播放音樂或設置鬧鍾等服務，這将大大增強 Assistant 回答、解決用戶問題的能力。

随着 Google Assistant 的升級，谷歌内部團隊也将進行重組，部分原 Google Assistant 團隊成員将面臨解雇。

谷歌對 Google Assistant 的改造早有預兆。2023 年 5 月，谷歌的人工智能團隊發布了一份題爲 " 利用 LLMs 在移動設備上實現對話式交互 " 的報告，涉及移動用戶界面的大語言模型應用測試。

報告提到，将大預言模型和 GUI（Graphical User Interface，即圖形用戶界面，用圖形方式顯示的計算機操作用戶界面）進行整合，包括了總結屏幕内容、根據顯示的内容回答問題、将指令映射到用戶操作界面等四大功能。

其中，最受關注的一個功能是 " 将指令映射到用戶操作界面 " ——本質上，這相當于是利用指令（語音或文本）控制來用戶的終端設備。例如，通過指令打開手機應用程序、調整手機蜂窩網絡模式等。

如今，谷歌也正是計劃從移動端着手推進強化 Assistant 計劃。安卓端的 Google Assistant 已經具備了由 AI 驅動的功能，能夠幫助用戶總結網頁内容。

移動端的改造隻是開始，可以預見，Google Assistant 升級後，起調整影響範圍比想象中的要廣得多，因爲 Google Assistant 已經作爲 AI 助手嵌入到了 Google 各類産品之中——比如智能音箱和智能顯示器。

" 每月有數億人使用 Assistant，我們緻力于爲他們提供高質量的體驗，" 谷歌發言人 Jennifer Rodstrom 在給 The Verge 的一份聲明中表示，" 我們很高興能探索大語言模型如何幫助我們強化 Assistant，讓它變得更好。"