品玩 5 月 31 日訊,據 IT 之家消息,DeepMind、普林斯頓大學和斯坦福大學的研究人員近日提出了一項名爲 LATM(LLMs As Tool Makers)的創新框架,該框架可以将像 GPT-4 這樣的大型語言模型轉變爲工具制造者(注:即讓模型自己生成軟件工具來處理新任務)。
LATM 的創新之處在于它爲語言模型引入了工具制造和使用的概念,使得模型能夠自主創建适用于不同任務的工具。這一框架不僅能夠提高模型的靈活性和适應性,還能夠爲生成式 AI 提供更加高效和經濟的解決方案。該框架主要包含以下兩個關鍵部分:
工具制造:作爲工具制造者,LLM 專門爲特定任務設計軟件工具,這些工具以 Python 函數的形式實現。
工具使用:另一個 LLM 作爲工具使用者,可以調用這些軟件工具來處理新的請求。
這種設計可以讓 LATM 能夠将任務分配給最适合的 LLM,将需要具備高強度算力才能實現的工具制造過程可以分配給功能強大、資源密集型的模型,例如 GPT-4;而将相對簡單的使用工具過程分配給輕量級、經濟高效的模型,例如 GPT-3.5 Turbo。這種方法不僅增強了 LLM 解決問題的能力,而且可以顯著降低處理一系列任務的平均計算成本,以最大程度提升框架效率。