本周 AI 圈 " 最紅炸子雞 " 誕生——AutoGPT。
不僅如此,這款軟件系統的橫空出世,一舉将 AI 進程推向了新高度——
自主人工智能。
顧名思義,它所具備的能力主打的就是一個 " 自主 ",完全不用人類插手的那種!
例如一位網友就要求 AutoGPT 開發一個網站,結果不到 3 分鍾,AI 自己就用 React 和 Tailwind CSS" 唰唰唰 " 地搞定了。
AI 自己上網、自己使用第三方工具、自己思考、自己操作你的電腦。
這一套打法,算得上是把" 行動→觀察結果→思考→決定下一步行動 "這條路子給打通并循環了起來。
就連前特斯拉 AI 總監 Andrej Karpathy 對此都評價道:
AutoGPT 是提示工程的下一個前沿。
而且不隻是 AutoGPT,最近還陸陸續續地衍生出了各種自主人工智能工具,例如AgentGPT、BabyAGI等等。
然後網友們對面此景也坐不住了,驚歎于 AI 發展的日新月異:
這倆月,一睜眼就出新東西,太累了。
無需人類插手的 AutoGPT 們
那麽這個當紅的 AutoGPT,和之前 ChatGPT 那波 AI 又有何區别?
微博博主" 木遙 "便下場親測了一下。
△圖源:微博博主 " 木遙 "
他測試所用的題目是 " 給我解釋 LangChain 怎麽用 "(LangChain 是大型語言模型的一種應用框架)。
這個問題若是交給傳統的 GPT,由于 LangChain 這個概念太新,AI 就會出現不知道怎麽回答的情況。
若是交給 "GPT+ 插件 " 這個組合來回答,那結果就會有點像 Bing 或者 Bard。
但 AutoGPT 上手就不一樣了,來欣賞一下它的執行過程:
首先試着直接去 LangChain 官網爬信息。
被官網拒絕了,可能因爲有屏蔽。
發現失敗了之後想了想,說要不 Google 一下?
Google 出了很多結果。
讀了半天這些結果,說「現在我們已經搜集了不少有用的信息了,接下來讓我們安裝它玩一下」
然後就開始動手在我的電腦上安裝 LangChain ……
而博主 " 木遙 " 在這整個過程中所做的事情就是 " 坐在屏幕前看着這一切自動在我眼前發生 " ……
△圖源:微博博主 " 木遙 "
然後這位博主不禁發出了感慨:
我要是有它這個行動力,三個 PhD 都念完了。
有類似自主能力的 AI,還有最近同樣火爆的AgentGPT。
也是隻需要給個任務,剩下的都交給它來完成:
用 100 美元的資金創建一個新的創業公司。
AgentGPT 在接到這項任務之後,便開始了他的展示:
思考中……
添加任務:研究需要最少資金的低成本商業模式。
添加任務:确定潛在的目标市場及其需求。
添加任務:開發一個精簡的 MVP(最小可行産品),并在目标市場進行測試以驗證需求。
然後 AgentGPT 先是輸出執行 " 研究需要最少資金的低成本商業模式 " 的結果:
根據我的研究,一些需要最少資金的低成本商業模式包括:
1、Dropshipping:通過 Dropshipping,你可以在網上銷售産品而無需持有庫存。您隻需通過第三方供應商完成訂單,第三方供應商将産品直接運送給您的客戶。你可以從 50 美元開始支付網站托管和域名注冊費。
2、 社交媒體營銷:如果你有社交媒體營銷的天賦,你可以通過幫助企業接觸他們的目标受衆來創辦自己的代理公司。你所需要的隻是一台電腦,互聯網連接,以及一些社交媒體營銷的經驗和技能,而你的起價隻有 50 美元或更少。
3、活動策劃:如果你對組織活動有熱情,你可以開始自己的活動策劃業務。你可以從策劃一些小活動開始,比如生日派對、婚禮等等。你可以從 100 美元開始,創建一個簡單的網站,名片,并通過社交媒體營銷自己。
4、自由寫作:如果你有寫作天賦,你可以開始自己的自由寫作事業。你可以通過在線平台,如 Upwork、Fiver 和其他求職網站找到客戶。隻需 50 美元,你就可以創建一個投資組合網站,并通過社交媒體營銷自己。
這些隻是一些低成本的商業模式,你隻需要 100 美元的資金就可以考慮。選擇一個符合你的技能和興趣的商業模式是很重要的。
到這還沒有完,AgentGPT 會繼續開始它的工作:
添加任務:針對每種已确定的低成本商業模式,對潛在的産品或服務想法進行頭腦風暴。
添加任務:評估每個想法的潛在盈利能力和可擴展性。
添加任務:選擇最有希望的想法,并開發精益 MVP,用于目标市場的測試。
而後便是繼續地再思考、執行。
再如BabyAGI,也隻需給個目标和任務叠代次數,AI" 唰唰唰 " 地便自己搞了起來:
而且已經有博主開始把 AutoGPT 當做自己的生産力工具了——做視頻!
不少網友在看到 AI 們的如此表現之後,表示整個人都通透了:
怎麽玩?
這麽強的工具,真的不想親自玩一下?
操作一點也不麻煩。
首先,準備好 OpenAI API 和 PINECONE API 的密鑰(後者是專爲 AI 長期内存開發的一個數據庫,使用前者則會消耗你 OpenAI 帳戶中的餘額,免費版本送 18 美元)。
Python 要求 3.8 版本及以上。
如果你需要語音輸出,你也可以準備一個 ElevenLabs API 的。
Ps. 獲取地址都放在文末鏈接中了。
git clone https://github.com/Torantulino/Auto-GPT.git
然後:
cd ‘ Auto-GPT ’
pip install -r requirements.txt
接着找到 AutoGPT 的根文件夾,将 ".env.template" 重命名爲 ".env" 并打開。
再将密鑰都替換爲你準備好的那些。
最後,在終端運行:
python scripts/main.py
如果要使用語音模式,運行:
python scripts/main.py — speak
如果不能訪問 GPT-4,開啓 "gpt3only" 模式:
python scripts/main.py — gpt3only
現在,你就可以開始搞你自己的 AutoGPT 項目了。
記住在 AuroGPT 的每個操作之後,輸入 "NEXT COMMAND" 授權程序繼續。
盡管項目也提供了不用這麽麻煩的" 連續模式 ",最開始運行時用這個命令:
python scripts/main.py — continuous
但作者強烈不推薦!!因爲它可能會導緻你的 AI 一直運行下去或執行你正常根本不會授權的操作。
如果你非要試試,風險自負……
以及默認情況下,AutoGPT 用 DALL-e 生成圖像,要換 Stable Diffusion 的話,需要一個 HuggingFace API 的令牌。
本質是 " 套娃 "
簡單介紹一下 AutoGPT 的原理。
AutoGPT 由于擴大了自己的應用範圍,包括執行文件操作、網頁浏覽和數據檢索等,有别于我們之前見過的所有 AI(GitHub 上已攬獲 3.6 萬 + 标星)。
如 Mila 研究所前 AI 研究員 @Lior 分析:
AutoGPT 相當于給了基于 GPT 的模型一個内存和一個主體(body)。
具體來說:
AutoGPT 的架構基于 GPT-4 和 GPT-3.5,靠 API 連接;
AutoGPT 可以進行自主叠代,即通過自我批判性審查來改進輸出、在先前工作的基礎上進行構建,并爲了獲得更準确的結果集成 prompt 曆史記錄;
AutoGPT 具有内存管理,集成了 Pinecone 數據庫,因此它可進行長期内存存儲,保存上下文并基于此進行決策改進。
而在推特博主 Jay Hack 看來,AutoGPT 等類似工具的出現,其實證明了智能的本質是 " 套娃 " 這件事兒。
因爲不論是 AutoGPT 還是 BabyAGI,它們都是用 LLM 來遞歸地調用自己。
這在 AI 領域最近可謂是個大趨勢:
專業一點的話來說,這叫模型堆疊,即模型 " 一路向下 ",去套用别的模型來拆解并解決任務。
用咱大白話來說,這就是 " 套娃 "。
除了 AutoGPT、BabyAGI 這些,還有 ViperGPT、SayCan 和 ToolKit 等最新工具,以及前面微軟發布的 VisualGPT 和 HugginGPT,都差不多是這個思想。
再往前一些,初代 DALL · E 其實就是 CLIP 套 VAE。
有意思的是,Jay Hack 指出,有着 " 人工智能元老 " 之稱的馬文 · 明斯基早在 1986 年就把人類智能描述成有許多相互作用子系統的組織。
最後,Jay Hack 也表示,正是因爲 " 套娃 " 這種操作,我們的 AI 現在才得以拿下更爲複雜的任務。而這,也就離通用人工智能更近一步。
确實,有不少網友都贊同:
AutoGPT 可能就是 AI 領域中的下一大趨勢。
面對如此強大的 " 套娃 " 工具們,一些人則開始哀嚎了:
參考鏈接:
[ 1 ] https://twitter.com/AlphaSignalAI/status/1645847165066006529
[ 2 ] https://twitter.com/karpathy/status/1642598890573819905
[ 3 ] https://weibo.com/1644684112/MBK3WCt8o
[ 4 ] https://twitter.com/DataChaz/status/1645152577258962944
密鑰獲取地址:
https: //platform.openai.com/account/api-keys
https://www.pinecone.io/
https://elevenlabs.io