AI 究竟還能完成什麽出乎人類意料的工作?最近,Nvidia 公司的人工智能研究員把語言模型 GPT-4 引入到了沙盒遊戲《我的世界》中,試圖從中發掘出 AI 更複雜的能力。
5 月 25 日,英偉達團隊與加州理工學院等諸多高校在内的研究者們發布了 Voyager,按照他們在論文中下的定義,Voyager 是一個具有大型語言模型的開放式具象化智能體,被接入到自由度較高的電子遊戲《我的世界》中。
AI 在遊戲中實現的各種操作
Voyager 被賦予的任務是完成遊戲中存在的各種目标,包括了生存、戰鬥以及建造,并且随着遊戲時間和經驗的積累逐步提高自己的技能。
在實驗中,Voyager 并不能像人類一樣正常地感知、操作遊戲,而是通過 API 直接讀取遊戲的各種信息。假設在《我的世界》地圖上存在一條小河和一根釣魚竿,當 Voyager 識别到這兩個信息後,GPT-4 便會建議釣一些魚來獲得經驗。
而當系統生成了這個目标後,GPT-4 就會自動生成實現目标所需要的代碼,以此讓角色完成相應的動作。
這個項目最創新的部分在于是用 GPT-4 來生成驅使遊戲人物行動的代碼,而 AI 的實現邏輯和人類一樣,第一次嘗試某個任務時難免會失敗,但它會收集錯誤信息和遊戲反饋,根據狀況調整代碼并最終完成任務。
随着遊戲時間變長,Voyager 建立了一個自己的代碼庫,以便更快速地建造遊戲裏種類繁多的道具,這種行爲也可以理解爲 AI 正在累計自己的遊戲經驗。研究人員将 Voyager 的遊戲進度與其他人工智能代理做對比,結果發現 Voyager 獲得的物品數量是其他 AI 的三倍,探索的距離、建造物品的速度也遠勝其他對照組。
相同時間下,Voyager 是最先做出鑽石劍的
之所以選擇《我的世界》作爲測試 GPT-4 的試驗場,是因爲這款遊戲自由度高且沒有過于明确的目标,AI 如果想做到 " 玩得好 ",那就需要進化出一些和人類玩家類似的能力,研究人員總結了幾個關鍵技能。
比如 " 根據其當前的技能水平和世界狀态提出适合的任務 " ——當身處沙漠時,AI 會考慮先收集仙人掌而不是鐵礦。再比如 " 根據環境反饋改進技能,并将掌握的技能保存在記憶中 " ——作爲敵人,僵屍與蜘蛛類似,那麽打僵屍總結的戰鬥經驗就可以用在蜘蛛上。
當然,教 AI 玩遊戲,最終試圖實現的目标還是在遊戲之外,研究人員表示通過這種方式訓練語言模型,将來或許可以使許多日常辦公任務自動化,或者根據使用者提出的需求來自動實現某些效果。
不過雖然前景美好,該項實驗依舊還停留在初期階段,想真正把讓你頭疼的工作交給 AI,或許還要等待一段時間。
參考資料:https://voyager.minedojo.org/