IT 之家 3 月 13 日消息,初創公司 Cognition 近日發布公告,宣布推出全球首個 AI 軟件工程師 Devin,并号稱會徹底改變人類構建軟件的方式。
Devin 在 SWE-bench 編碼基準測試中取得了突破性的成功,展示了其執行複雜任務的能力,甚至超越了頂尖的人類工程師。
*Devin 是在數據集 25% 的随機子集上進行評估的。Devin 是無輔助的,而所有其他模型都是有輔助的(這意味着模型被告知哪些文件需要編輯)。
Devin 擅長長期推理能力,可以自主規劃和完成軟件項目,并在此過程中做出數以千計的準确決策。IT 之家附上 Devin 所具備的技能如下:
快速掌握新技術:隻需閱讀文檔,Devin 就能快速掌握不熟悉的工具和框架。
開發端到端應用:構建并部署功能齊全的網絡應用程序,根據用戶反饋逐步增加功能。
自動化查找 BUG:Devin 擅長識别、調試和修複代碼問題,同時爲開源和生産級軟件倉庫作出貢獻。
AI 培訓:從研究資料庫中獲取指令,建立并微調大型語言模型。
官方對其的描述如下:
Devin 是一位不知疲倦、技術娴熟的隊友,随時準備與您并肩作戰,或獨立完成任務供您審查。
有了 Devin,工程師可以專注于更有趣的問題,工程團隊可以努力實現更遠大的目标。