作者 | 虞景霖
編輯 | 鄧詠儀
北京時間 8 月 1 日,據 Axios 獲得的谷歌内部備忘錄顯示,谷歌計劃将最新的大語言模型(LLM)技術引入 Google Assistant,提高其内容生成能力,該技術類似于 ChatGPT 和谷歌自研的 Bard 聊天機器人。
大模型熱潮來臨後,巨頭們都正在用大模型将自家産品一個個 " 升級 "。比如微軟與 OpenAI 建立合作後,将生成式 AI 助手就嵌入到 Edge 浏覽器、Microsoft Office 和 Azure 雲服務中,讓服務變得更加智能
Goggle Assistant 的升級同樣體現了這一點。
Google Assistant 是谷歌開發的語音助手,相當于亞馬遜的 Alexa 和蘋果的 Siri。用戶隻需說出喚醒詞 "OK Google" 或者 "Hey Google",Google Assistant 就會執行用戶在這之後發出的語音命令,例如暫停視頻、指定任務或者接聽電話。
Axio 的備忘錄并沒有詳細說明 Assistant 将要增加哪些具體功能,但大概率将具有和 Bard 類似的 AI 聊天功能—— Bard 是谷歌基于 PaLM 2 之上建立的對話式 AI 模型。
新的 Google Assistant 或将采用 LaMDA 來生成邏輯通暢、文本自然的對話語言,從網絡上收集信息後回答用戶問題。
而引入大模型之後的 Google Assistant,也會更加 " 聰明 "。以前,Google Assistant、Siri、Alexa 一類的語音助手,常被視作 " 假 AI" ——因爲它們隻能支持簡單的用戶交互,例如回答 " 明天天氣如何?" 一類的簡單問題,或者提供圍繞問題搜集到的信息,供用戶參考,還經常答非所問。
将 Bard 和 Google Assistant 結合,是一項互補的操作。Bard 能根據從網絡上搜索到的信息回答問題,但無法單獨執行用戶指令,和 Google Assistant 結合後,依附一定的載體,就能實際執行播放音樂或設置鬧鍾等服務,這将大大增強 Assistant 回答、解決用戶問題的能力。
随着 Google Assistant 的升級,谷歌内部團隊也将進行重組,部分原 Google Assistant 團隊成員将面臨解雇。
谷歌對 Google Assistant 的改造早有預兆。2023 年 5 月,谷歌的人工智能團隊發布了一份題爲 " 利用 LLMs 在移動設備上實現對話式交互 " 的報告,涉及移動用戶界面的大語言模型應用測試。
報告提到,将大預言模型和 GUI(Graphical User Interface,即圖形用戶界面,用圖形方式顯示的計算機操作用戶界面)進行整合,包括了總結屏幕内容、根據顯示的内容回答問題、将指令映射到用戶操作界面等四大功能。
其中,最受關注的一個功能是 " 将指令映射到用戶操作界面 " ——本質上,這相當于是利用指令(語音或文本)控制來用戶的終端設備。例如,通過指令打開手機應用程序、調整手機蜂窩網絡模式等。
如今,谷歌也正是計劃從移動端着手推進強化 Assistant 計劃。安卓端的 Google Assistant 已經具備了由 AI 驅動的功能,能夠幫助用戶總結網頁内容。
移動端的改造隻是開始,可以預見,Google Assistant 升級後,起調整影響範圍比想象中的要廣得多,因爲 Google Assistant 已經作爲 AI 助手嵌入到了 Google 各類産品之中——比如智能音箱和智能顯示器。
" 每月有數億人使用 Assistant,我們緻力于爲他們提供高質量的體驗," 谷歌發言人 Jennifer Rodstrom 在給 The Verge 的一份聲明中表示," 我們很高興能探索大語言模型如何幫助我們強化 Assistant,讓它變得更好。"