劃重點
1 微軟、Meta、OpenAI 以及谷歌等公司都在開發名爲智能體的新人工智能軟件,它們幾乎可以在無人指導的情況下處理複雜任務。
2 微軟計劃在下個月的開發者大會上宣布其智能體功能,OpenAI 正在秘密研發能夠操作計算機的智能體。
3 研究人員正在尋找防止智能體失控的方法,比如錯誤地删除文件或在用戶設備上執行有害操作。
騰訊科技訊 據國外媒體報道,由于許多企業對投資對話型人工智能保持審慎态度,微軟、OpenAI 以及谷歌等人工智能領域的領軍企業正積極推出新功能,力求将這項技術塑造爲一項不可或缺的技術,能夠在幾乎無需客戶指導的情況下處理複雜任務。
科技巨頭新戰場
以微軟爲例,據該公司内部員工透露,微軟正在積極開發一款新軟件,其強大功能包括根據客戶的訂單曆史自動創建、發送并跟蹤發票,甚至能夠用另一種語言重寫應用程序代碼,并驗證其是否按預期運行。這款新軟件将借助 OpenAI 的先進技術進行升級,進一步完善微軟現有的 Copilots 套件,該套件目前主要用于會議總結或草拟電子郵件等工作。據悉,微軟計劃在下個月的年度 Build 開發者大會上正式公布其中的部分新功能。
這些功能均屬于被稱爲智能體(Agent)的範疇,這是一種能夠在最少的人類幹預下實現目标的人工智能軟件。OpenAI、谷歌以及 Facebook 母公司 Meta 都在積極研發各自的智能體。盡管人工智能聊天機器人以其生成真實答案或向程序員推薦代碼行的能力赢得了業界的廣泛贊譽,但客戶們普遍認爲,要想進一步釋放投資潛力,它們仍需要能夠自動化處理更複雜任務的軟件。
大型數據庫提供商 MongoDB 的 CEO 戴夫 · 伊蒂切裏亞(Dev Ittycheria)在談及人工智能的當前應用時表示:" 我注意到電子郵件中出現了一些新功能提示,比如‘你想用人工智能重寫這張便條嗎?’然而,這些功能并未真正給我的生活帶來颠覆性的改變。" 他進一步透露,Mongo 的員工和客戶都在期待更爲出色的功能,才願意在人工智能領域投入巨額資金," 我堅信智能體将是工作流程的下一個重大突破 "。
OpenAI 正在秘密研發一種全新的智能體,它們能夠利用計算機的強大功能,同時操作多個應用程序,實現如将文檔中的數據自動傳輸到電子表格等高效任務。除此之外,OpenAI 和 Meta 也在積極開發另一類智能體,它們擅長處理複雜的多步驟任務,例如制定行程規劃,并據此自動預訂旅行住宿等。
谷歌的核心人工智能團隊 DeepMind 也在這一領域展開研究,其成果得益于安莫爾 · 古拉蒂(Anmol Gulati)的傑出貢獻。古拉蒂是初創公司 Adept 的聯合創始人,該公司專注于開發能夠使用計算機的智能體。
據一位熟知谷歌計劃的知情人士透露,Adept 已經成功籌集了超過 4 億美元的資金,并計劃在今年夏天推出全新的智能體服務。Adept 首席執行官戴維 · 栾(David Luan)表示,該公司從基礎開始構建人工智能系統,并通過分析人們在電腦上工作的視頻來訓練模型,如制作 Excel 電子表格等。經過精心訓練的 Adept 模型已經能夠在計算機上像人類一樣執行各種操作,比如在網頁導航中搜索網上房源,或在客戶關系管理系統中記錄電話内容。
當前智能體仍不完美
随着智能體概念逐漸在人工智能領域嶄露頭角,谷歌及其他公司的高管們或許會讓客戶感到些許困惑,因爲他們對于智能體的定義存在分歧。舉例來說,谷歌上周宣布的一系列所謂的智能體,但它們實質上僅僅是 ChatGPT 等會話聊天機器人的變種,這些變體經過訓練能夠處理特定任務,如支持客戶服務互動。然而,它們往往并不具備執行多步驟任務的能力。
一年前,當開發人員發布了兩個由大語言模型驅動的開源智能體後,智能體的概念首次引起了廣泛關注。有人利用這些智能體創建了各種演示,這些演示中的智能體能夠自動編寫播客大綱或彙總商業競争對手的研究。然而,當人們意識到這些智能體仍遠未達到完美的境地後,這種炒作熱潮便迅速降溫。根據開發者的反饋,盡管這些可用的智能體能夠構思出實現更大目标所需的任務列表,但它們的執行過程往往是成敗參半,因爲它們很容易陷入重複性的動作循環中。
面對這一現狀,微軟等公司并未急于推出最複雜的智能體,而是選擇逐步改進其軟件當前版本中的自動化功能。據一位微軟員工透露,今年早些時候,微軟成立了一個由雲和人工智能執行副總裁斯科特 · 格思裏(Scott Guthrie)領導的新團隊,專注于爲公司的 Copilot 産品開發智能體。例如,微軟正在爲 Dynamics 應用中的銷售人員打造一項即将推出的智能體功能,該功能旨在主動提出應用可以執行的多步驟操作建議,而這些操作在以前通常需要用戶明确指示 Copilot 來完成。
舉例來說,微軟計劃中的功能将能夠檢測到企業客戶尚未完成的大型産品訂單,随後自動起草發票,并詢問企業是否需要将該發票發送給下單的客戶。據知情人士透露,一旦得到确認,智能體将能夠自動追蹤客戶的回複和付款情況,并将這些信息準确記錄在公司的系統中。
微軟的一名員工透露,盡管微軟研究部門的負責人彼得 · 李(Peter Lee)去年已經指示研究人員探索構建更複雜智能體程序的方法,如 OpenAI 正在研發的使用計算機的類型,但微軟的研究團隊仍在努力尋找防止智能體失控的對策,以防止其錯誤地删除文件或在用戶設備上執行其他潛在的有害操作。
軟件程序員可能是首批能夠體驗到高級智能體的專業人士,正如他們是最早受益于對話式人工智能的群體一樣。這得益于微軟旗下的 GitHub Copilot,該工具能夠在開發人員鍵入代碼時爲他們提供實時的代碼行提示。GitHub 首席執行官托馬斯 · 多梅克(Thomas Dohmke)表示,在未來的一年裏,GitHub Copilot 将實現更多功能。他透露,當開發者描述他們在代碼庫中遇到的問題時,智能體将能夠審查該問題,提出修複方案,并自動編寫和運行相應的代碼。
GitHub 首席執行官托馬斯 · 多姆克
多姆克進一步補充說:" 我們目前的重點是構建能夠處理更大任務的智能體。在不遠的将來,我們将見證更多的智能體在協助開發者完成各項工作方面發揮重要作用。"
與此同時,Magic 和 Cognitive AI 等初創公司也因聲稱它們的編碼智能體能夠勝任人類程序員的多項工作而備受矚目。然而,這些說法尚需進一步的驗證。
兩大最新進展提供助力
最近的兩項進展爲人工智能提供商在開發具有更廣泛用途的智能體方面帶來了曙光,這些智能體能夠執行諸如規劃個人未來一周的約會、創建行程和地圖,或是像人類一樣精準地填寫表格等複雜任務,同時能夠整合來自各種數據源的信息。
美國加州大學伯克利分校的計算機科學教授、同時身爲人工智能初創公司 Anyscale 和 Databricks 的聯合創始人伊恩 · 斯托伊卡(Ion Stoica)指出,開發者在利用大語言模型生成合成數據方面取得了顯著進步,這些合成數據進而可用于訓練其他模型。在代碼生成領域,這一技術尤爲實用,因爲開發者可以引導模型在一系列參數中創建并解決問題。
斯托伊卡進一步提到,第二個重要進展在于 "Grounding"(基礎訓練),這主要涉及到将抽象、符号化的信息與現實世界中的具體事物或現象進行有效關聯。在構建人工智能模型的過程中,這種能力使得模型能夠自動驗證其他模型的輸出是否有效,例如測試一個模型生成的代碼是否真正解決了特定問題。
斯托伊卡表示:" 在未來一年裏,我們将看到模型在解決問題和推理能力方面的顯著躍升。這很大程度上取決于 Grounding 技術的進展:如果我能自動驗證輸出的有效性,那麽我就可以利用大型模型本身來優化輸出,這将帶來革命性的變化。"
盡管智能體的發展尚未達到全面起飛的階段,但人工智能提供商及其客戶們仍在技術上做着不懈的努力,旨在消除當今聊天機器人常犯的錯誤,這些錯誤一直阻礙着企業在實際應用中廣泛采納這類技術。
Datadog 的首席執行官奧利維爾 · 波梅爾(Olivier Pomel)指出:" 即使聊天機器人的準确率能達到 99%,但對于一些需要近乎完美精度的應用來說,這仍然遠遠不夠。"Datadog 是一家專注于幫助企業跟蹤雲應用性能的公司。
這種 Grounding 工作需要能夠對人工智能模型産生的結果進行事實核查的軟件支持,這與 OpenAI 及其同類公司形成鮮明對比,他們緻力于開發規模越來越大的會話人工智能。這些大型模型的目标在于比其前身更加聰明、準确。OpenAI 及其競争對手寄望于更大的模型能夠更好地爲智能體提供動力,但關于大模型改進速度有多快,目前尚難預測。(編譯 / 金鹿)