家人們,OpenAI 前腳剛發布自定義 GPT,讓人人都能搞開發;後腳國内一家大模型初創公司也搞了個産品,堪稱重新定義開發——讓 AI 智能體們協作起來!
隻需一句話,最快3 分鍾不到,成本也隻要2 元多," 啪 ~",一個軟件就開發完了。
例如開發一個紅包雨的小軟件,現在隻需要說一句就好了:
" 紅包雨 " 是一個點擊小遊戲,紅包的外觀是紅色高瘦的圓角矩形,紅包緩慢地從上方掉落,每個紅包間距相等 ,沒有重疊,鼠标點擊任意一個紅包,紅包便随着互動點擊而消失,同時顯示一個吉利的數字,表示搶到這個紅包得到了多少錢。
更重要的一點是,在開發的整個流程中,從産品經理到程序員,再到設計和測試等等,統統都是 AI 智能體!
沒錯,全程你隻需要提需求,剩下的智能體們會自己讨論、交流,甚至還伴随着 battle,最終确定方案并執行。
要知道,常規軟件的開發周期是在 2-3 周,且成本在 10000-50000 美元之間(包括人力);如此對比起來,可真的是大寫的 " 降本增效 "!
這款神器便是ChatDev,是由面壁智能最新推出的 SaaS 級智能軟件開發平台。
其實早在兩個月前,"ChatDev 智能體協作開發框架 " 就已經在 GitHub 上開源,并多次霸榜 Trending 排行,目前已經攬獲近17000 顆 star。
而此次面壁智能之所以推出産品版,就是爲了把這種 " 一句話搞開發 " 的門檻再次 " 打下去 "。
現在有了它,搞開發可以說拼得不再是技術了,拼得更多的反倒成了創意。
宛如身邊有一隻哆啦 A 夢,隻要你敢想,它就敢給你 " 造 " 出來。
那麽産品版 ChatDev 正在帶來什麽樣的改變?又是如何做到的?
産品開發變了:可以把更多創意塞進去
在産品版 ChatDev 加持之下,開發的叠代,也變成了有想法就行的事。
例如你想把 " 紅包 " 替換成你想要的元素,同樣也是隻需要一句話的那種。
然後 AI 智能體們就又開始了新一輪工作流程,這次,我們來具體看看它們之間到底是怎麽展開工作的。
我們還是先以剛才紅包雨的 demo 爲例。
首先,就像剛才提到的,我們需要做的就隻有填寫好 " 項目名稱 " 和 "Prompt"。
而且即便 Prompt 寫得不好,在 ChatDev 旁邊也有一個" 一鍵潤色 "的功能,自動幫你把需求補充完整。
然後我們就能看到 AI 智能體們就開始 " 搓搓小手 " 準備幹活兒了。
CTO 先發話,大概意思就是:
來活兒喽!客戶要搞個 " 紅包雨 "~
緊接着
CTO 詳細地拆解了這個需求,把項目要做的每一步都羅列了出來:
任務下達之後,就輪到
程序員發力了。
隻見他不費吹灰之力,立即給出了一段 Python 代碼:
代碼完成之後,還有會有一位
AI Counselor,會對整個項目做個總結,并将邏輯、結果等等一并奉上:
整個對話過程可謂是非常絲滑,我們就像一位尊貴的客戶,靜靜地看着這些 "AI 員工 " 有條不紊地推進着項目。
不得不感慨,現在搞開發,真的成了有想法就行的事兒了。
例如網絡爬蟲、數據庫讀寫、文件批處理、網頁設計這樣的編程助手;像五子棋、貪吃蛇這樣的休閑小遊戲;再如數字時鍾、計算器、繪畫闆、圖片編輯器這樣的效率管理和創作輔助工具。
統統都能 hold 得住 ~
怎麽做到的?
從早期披露的消息和論文中可以看到,最初的 ChatDev,是團隊設計了一套由群體智能串聯起的ChatChain(交流鏈)。
可視爲由原子任務組成的 " 軟件生産線 ",通過專業角色的智能體進行對話式信息交互和決策,驅動其進行自動化全流程軟件工程。
然而,應用的創新離不開基礎模型能力的提升,随着面壁智能推出 SaaS 版 ChatDev,我們發現其自研的基座模型也有了新的版本——
面壁智能自研的新一代千億參數大模型——CPM-Cricket(CPM 全稱爲 Chinese Pretrained Model ) 。
據了解,CPM-Cricket 是面壁智能的第三代模型,前兩代分别爲 CPM-Ant、CPM-Bee。
(有意思的一點是,每一代模型的名字是按照英文字母的順序爲首字母,并取一個昆蟲的英文單詞來命名。)
至于 CPM-Cricket 的能力幾何,一言蔽之,是在邏輯、代碼、知識、指令理解等方面有了大幅提升,且全面超越 Llama 2 的那種。
在經典的 LLM 評測集(HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH 等)中,CPM-Cricket 表現如下:
或許這樣的一組數據并沒法帶來非常直觀的感受。
那麽同樣是基于 CPM-Cricket 的類 ChatGPT 産品——Luca 3.0,把它 " 丢 " 進公考場景之後的表現,便可以讓 CPM-Cricket 的能力變得更一目了然了。
題目是這樣的:
選取 2022-2023 年的公考試題,包括常識判斷、數量關系、資料分析、判斷推理、語言理解與表達等多種題型的 425 道試題。
例如面對下面這道單選題,Luca 3.0 不僅可以秒速作答,還能将每一步的解題步驟詳盡地列出來:
即使是面對話術彎彎繞繞、真人看了都需要反應一會兒的邏輯題目,Luca 3.0 的回答也是遊刃有餘:
可以說,Luca 3.0 在這套題上的表現是做到了 " 快 " 和 " 準 "。
而與之同台競技的選手,面壁智能所選取的也是業界相對标杆的大模型,GPT-4。
不難看出,在重要的常識判斷和判斷推理兩項能力中,Luca 3.0 相比 GPT-4 已經能夠保持相對的優勢了。
不僅如此,在英文測試環境中,Luca 3.0 在 GMAT 官方模拟考試題中的表現,同樣也是 GPT-4 整體相當(其中閱讀達到 GPT-4 的 97% 水位)。
而 Luca 3.0 之所以能夠取得這般成績,除了背後 CPM 大模型升級這個因素之外,面壁智能在微調方面也做了相應的策略:
一是課程學習(Curriculum learning,CL)的訓練策略,模仿人類的由易到難的學習過程,先在預訓練中讓模型學習底層推理規律,然後在對齊階段學習人類的逐步推理思維。
二是思維鏈(Chain-of-thought,CoT)策略,對推理過程分解,讓模型的推理更加具有可解釋性。
(PS:目前 Luca 已經正式面向公衆開放服務,是可以免費體驗的那種哦 ~)
在底層基礎設施的其他方面,例如訓練、壓縮和推理,面壁智能也自研了自己的一套打法:
BMTrain:大模型高效訓練框架
BMInf:大模型高效推理框架
BMCook:大模型高效壓縮框架
據說其大模型已集成超過 16000 多個真實 API,可實現一鍵接入,調用工具解決更多複雜任務。
此外,面壁智能還部署了 Int8 量化模型,讓模型推理成本降低 50%。
總結來說,面壁智能探索了出更爲低成本、高效率的模型訓練方法,讓大模型不僅能 " 訓出來 ",還能 " 訓得好 "、" 用得好 "。
這可能就是這家創業公司推動 " 大模型 +Agent" 應用落地的實力和底氣。
還有更大的一盤棋
不過除此之外,基于大模型底座的基礎能力,面壁智能還曾開源了兩項重磅的工作——AgentVerse和XAgent。
加上之前我們提到的 ChatDev,三者共同形成了面壁智能的" 三駕馬車 ",圍繞的核心便是 AI 智能體。
AgentVerse 是一個大模型驅動的智能體通用平台,它的作用就是打造各式各樣的 AI 智能體,讓它們具備感知、思考、推理、理解、協作和執行的能力,以便 " 組團打怪 "。
XAgent 是大模型驅動的 AI 智能體應用框架,它可以讓智能體們具備自主規劃和決策能力,能夠理解人類指令,制定複雜計劃并自主采取行動完成任務。
而 ChatDev 則更爲聚焦,是大模型驅動的多智能體協作開發框架,采用軟件工程瀑布模型的思想,将軟件開發分爲軟件設計、系統開發、集成測試、文檔編制四個主要環節。
但若是我們将此次發布的所有 " 單節點 " 聯系到一起,就能發現,面壁智能實則是在下一盤更大的棋——
左手大模型,右手 AI 智能體,要打造的是一個智能體網絡(Internet of Agents,IoA)。
因爲在面壁智能看來,我們已經經曆了從互聯網到物聯網的過渡,而接下來的駛向便是智聯網。
如果說互聯網是二維信息的聯通、物聯網是三維空間的聯結,那麽智聯網則是進入更高維度的智能體互聯。
而在智聯網中,AI 智能體應當是最爲關鍵的存在,它可以是拟人的原生智能體,也可以是現實中的人和物體的數字孿生智能體。
通過智能體的連接,可以讓 AI 真正爲人類服務,提供價值(生産力的提升、交互方式的改變)。
以一個大膽的想象來比喻,可能在智聯網的将來,家中的哪怕是一張桌子、一台冰箱,也會具備智能體的特性,可以與人和其它物體做智能交互。
而這,也正是面壁智能願景的由來——智周萬物:
" 智 " 即 AI Agent 智能體;" 萬物 " 可以是人,可以是物。
AI Agent 智能體網絡是連接現實世界與虛拟世界的橋梁,并使其真正交互和協作起來,創造價值。
不過有一說一,智聯網的理想雖好,但現實的情況是,即使是 ChatDev 和第三代大模型的發布,也隻能視爲邁向願景的一步。
那麽面壁智能是否有足夠的實力能夠在将來解鎖 " 智周萬物 " 呢?
關于面壁智能
對于這個問題,我們首先就要看一下面壁智能的團隊實力如何。
從官方披露的消息可知,面壁智能成立于 2022 年 8 月,CEO 爲李大海,首席科學家是劉知遠。
二人的學術、技術實力已然是不容小觑。
李大海畢業于北大數學系,後加入谷歌成爲 Google 中國創始員工之一;再後來也有在衆多知名企業擔任技術負責人、CTO 等職務的經曆,對技術體系的搭建和商業化落地有着豐富的經驗。
劉知遠是清華大學計算機系長聘副教授,主要研究方向爲自然語言處理、知識圖譜和社會計算。在人工智能領域著名國際期刊和會議發表相關論文 200 餘篇,Google Scholar 統計引用超過 3.7 萬次,學術造詣可謂是十分深厚。
不僅如此,官方展示的 " 顧問 " 成員也是非常重量級,包括兩位清華大學計算機系教授——孫茂松和劉洋。
不難看出,面壁智能是妥妥一家 " 清華味 " 十足的大模型初創企業。
除此之外,其在産學研生态道路上也有自己獨特的打法,即 " 一體兩翼 "。
" 一體 " 指的正是面壁智能,而 " 兩翼 " 則是OpenBMB和清華 NLP 實驗室。
據了解,OpenBMB 是面壁智能團隊在 2021 年與清華 NLP 實驗室共同成立的國内領先大模型研發與應用開源社區,社區宗旨爲 " 讓大模型飛入千家萬戶 "。
目前除了 Agent 技術框架,OpenBMB 還開源了 CPM-Ant、CPM-Bee 10B 基礎模型,BMTrain、BMCook、 BMInf 、OpenPrompt、OpenDelta 等大模型全流程加速工具包,爲中國大模型開源事業做出了獨樹一幟的貢獻。
清華 NLP 實驗室,則是國内最早系統開展深度學習與大模型研究的單位,團隊在國際頂級學術會議和國際權威期刊發表論文 200 餘篇,引用近 44000 次,并獲得多項最佳論文獎。
由此可見,無論是自身實力,亦或是 " 一體兩翼 " 式的強強聯手,面壁智能在技術這一塊可以說是妥妥拿捏住了。
這也就不難理解,爲何僅成立一年的面壁智能,便可将 CPM 大模型叠代三代,又能在國内率先亮出 " 大模型 +Agent" 群體智能模式的産品應用了。
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~