要說 AutoGPT 爲啥會迅速蹿紅?
還不是把人類對 AI 的想象力再次打開了。
使喚 AI 不用再一句句引導,更不用去研究提示工程了。
人人像鋼鐵俠那樣擁有超級 AI 賈維斯不是夢。
而就在現在,這種Auto AI Copilot已經有人批量生産了。
大概畫風 be like:
如果你正在浏覽旅行 APP 打算訂酒店,點一下 AI 助手,它就會根據自己掌握的信息貼心發出詢問:
我記得你說打算去新加坡旅遊來着,有什麽需要我幫忙的嗎?
然後對着手機說出自己的情況和需求,它立馬找出了13 個方案,并且給出自己最推薦的選擇。
不僅如此,它還會查詢當地天氣提醒你要準備什麽衣服,并能根據天氣情況來規劃路線。整個過程,完全就是和真人助理對話的感覺啊。
除了旅行 APP,如購物、家裝等各類軟件裏都能内置這樣一個 AI。而且官方還透露說,底層平台将會在近期開源。
這就讓人好奇了,到底這些 AI 從哪裏來?
生産有記憶會自學習的 AI Copilot
如上看到的 AI Copilot 來自名爲MindOS的 AGI 應用助手平台。
它主打的功能就是爲各類軟件打造一個超級 AI,不光能回答人類用戶提出的問題,還擁有記憶、自主學習能力,同時也能有個性。
比如當你打開家裝軟件準備再買點裝飾,但其實沒想好具體買什麽時,AI Copilot 就能根據它對你的了解,給出推薦的物品。
除了推薦好物,AI Copilot 還能基于人類的問題揣測意圖。
比如讓它查詢下買的桌子椅子發貨了沒有,AI 先是回答了物流的進度,然後感覺到人類可能希望桌椅能一起送過來,就馬上提出了自己的猜測。
人類:我的訂單到哪了?
AI Copilot:嗨,你的訂單已經由 DHL 快遞發出了,預計在今天下午 7 點送到。
人類:椅子和桌子是配套一起送過來的嗎?
AI Copilt:它們是分開賣的。你有 4 把椅子會在今天送到。你是想今天也收到桌子,這樣周六就能有一整套了是嗎?
人類:是的,我能取消訂單然後重新下單一整套嗎?
而且它還會智能地根據情況給出推薦的解決辦法。
比如告訴人類,已經發貨的椅子沒法取消訂單了。與其現在把椅子退貨再重新下單一整套桌椅,倒不如直接再買張桌子補齊吧。
據了解,MindOS 平台現在支持包括中英文在内的 30 種語言,提供超過 1000 個帶有性格、功能的預置 AI 角色,準确推斷意圖的準确率達到97%。
而定制這些 AI Copilot,其實并不難,不用懂算法和編程,也不用給數據打标,幾分鍾就能搞定。
平台上有多種類型的 AI 助手可以選擇,包括購物、金融、網站引導等。
選好類型後,就能開始個性化定制了。
平台支持接入 API、數據和文檔等,并爲 AI 助手提供了一些技能,可以按需選取使用。
然後隻用自然語言描述,就能完成對 AI 助手的初始設定。
可以控制的内容包括 AI 的形象、自我介紹、對話風格、要完成哪些任務、不能做哪些事等。
整個過程就和招來一個新員工一樣,告訴它工作守則即可。
設置完成後,将平台生成的代碼插入到網站或軟件中,即完成 AI Copilot 的接入。
據了解,MindOS 其背後原理是以大模型作爲底層基礎,在此之上背後開發團隊搭建了一套模仿人腦宏觀架構的自研框架 UMM(Unifined Mind Model),爲 AI 加入複雜思考、記憶、服務和更強的自主學習能力,讓大模型内容更可控、能力更自主、部署更靈活、整合更深度。
其中,大模型就好比通用計算平台,類似于人類大腦的前額葉,具備很強的理解能力和邏輯推理能力。但人想要在現實世界中完成各種任務,一定還需要視覺、執行、動機、記憶等區域的配合。
因此,UMM 框架就是給大模型接入了這些能力,比如可以感知和處理多模态信息、記住專業知識、曆史信息和數據、自主學習等。以此讓 AI 可以完成一個長鏈條任務,和 AutoGPT 非常相似。
而且相對于 AutoGPT,MindOS 背後框架的自主性更高。
舉例來說,AutoGPT 是在給定公開的技能下(如搜索),自主規劃出合适的執行計劃。
而 MindOS 中的 AI,會在發現自己技能不夠用時,主動去互聯網上搜索新技能,自主測試、連接,并利用新學會的技能進一步完成複雜任務。
比如當用戶提問 " 我想知道公司有哪些西雅圖的客戶?"
MindOS 的 AI 發現自己現有能力沒法解決這一問題,于是它就在公司網絡中找到了一個 CRM 接口(客戶信息系統),然後在用戶允許下自主學會如何使用,最後給出了公司的西雅圖頭部客戶和每個客戶的具體介紹。
去年 11 月初,MindOS 發布 1.0 版本,比 ChatGPT 還早了幾周。
在經過幾個月叠代後,在最近推出 2.0 版本,并将開放一輪封測,屆時可以搶先體驗。
而且幕後團隊透露,其底層框架 UMM 也會在後續開源。
這絕對算得上是一個重磅消息了,畢竟當下 ChatGPT、AutoGPT 熱度夠高,但是在使用和自主可控性上都還存在一些讓人有顧慮的方面。一個真正可商用的、成熟的 AI 框架,加上完整的配置平台,相信有很多人會躍躍欲試。
這不免讓人更加好奇,MindOS 的背後開發團隊到底是何人?
前臉書高級研究科學家帶隊打造
MindOS 來自心識宇宙,在 2022 年 1 月創立,定位是一家AGI 公司。
公司團隊成員來自 Meta、Google、TikTok、Alibaba 等,創立至今已獲得紅杉中國種子基金、線性資本、銀杏谷資本等頂級基金投資。
創始人兼 CEO陶芳波,是數據挖掘和 AI 領域的熟悉面孔了。
他本科畢業于清華大學,後赴伊利諾伊大學香槟分校獲得計算機科學博士學位,師從數據挖掘領域鼻祖韓家炜教授。
陶芳波博士先後在美國微軟研究院、Facebook Research、NASA 等從事研發工作,并是阿裏達摩院神經符号實驗室的創建人。其研發成果已應用到 NASA、波音公司等;搭建的 Facebook 大規模内容理解平台,日均服務超過 2 億用戶。
此外,他還擔任了 EMNLP、CIKM、ACL、SIGMOD、WWW 等領域頂會的評審專家。
心識宇宙的創立契機,主要有兩方面。
一方面是底層技術的驅動,另一方面是需求真實存在。
其中,從技術維度出發的思考和準備,要從 3 年前說起。
2020 年 GPT-3 震撼發布,讓陶芳波看到了 LLM 的無限潛力。
這是第一個模型,可以一個模型完成很多複雜任務,承載了人類幾乎所有知識。
當時,業内對 AGI 的讨論已經不絕于耳,陶芳波同樣認同 AGI 會給未來世界帶來變革。
怎麽通往這裏?大模型這條路已經逐漸清晰了起來。幾年前,當時還在研究實驗室的團隊就已經開始搭建一種 AGI 框架的雛形了。
他們提出的技術理解是:大模型是一種全新的計算革命,提供了一種新的通用算力資源,即可以通過自然語言來調取的數字腦力資源。
相比于提供 " 連接能力 " 的傳統算力,現在這種算力可以直接提供 " 理解和推理 " 能力。
但問題是,目前這種算力依然是無差别的,和場景、個人需求沒有深度整合(Grounding)。而這種整合需要非常複雜的場景理解、個人需求理解。
因此,需要在大模型之上構建一個有價值的調度框架,類似于新時代的操作系統,讓這種算力不僅有理解能力,還和場景深度整合,可以在目标的驅動下獨立成長和自我構建。
而技術創新,還隻是底層的支撐。更上一步,需要行業中有真實存在的需求。
實際上,近幾年不少軟件和應用都傾向于爲自己構建一個 AI 助手。一般是一些低頻剛需 APP,如銀行、政府類;以及一些信息整合、用戶決策路徑長的 APP,如電商、旅遊類。
對于低頻剛需類 APP,因爲打開頻率低,用戶對操作界面的熟悉程度不高。一旦有需求時,往往要先花費一段時間來摸索功能界面,有時甚至還得去網上搜教程,确實比較繁瑣。
因此,APP 會傾向于加一個 AI 助手,讓用戶通過自然語言交互,就像是問引導員一樣,快速完成操作。
而對于決策路徑比較長的 APP,一般有兩種情況。
第一,用戶還不知道自己明确需要什麽。
比如下周要去參加婚禮了,該準備什麽樣的禮物?很多人在打開購物軟件時是沒有想法的,這就需要自己來搜索找靈感,到最終确定商品下單,會是一個比較長的過程。
第二種情況,是用戶需要進行複雜的貨比三家,最後才能完成消費。
比如大到汽車、房産,小到球鞋、護膚,購買時不同人會優先比對不同的規格參數;或者是訂酒店,也要事先了解好多家的價格、環境、位置等信息。這類決策過程也都會比較複雜。
那麽,如果有 AI 能夠快速整合對比信息,或者給出明确的推薦,這會提升用戶的體驗感,也能提升平台商家的轉化率。
由此也就不難理解,爲什麽心識宇宙聯合創始人兼 COO 林宋琪在創業初期就反複表達:
所有分發都可以⽤ AI 再做⼀遍,所有 UI 都可以⽤⾃然語⾔再做⼀遍,所有軟件 ( Application ) 都值得⽤虛拟⻆⾊再做⼀遍。
不可否認,軟件 AI 化在最初也受到了不少來自市場的質疑。但随着 OpenAI 和微軟的一系列組合拳,這一趨勢開始逐漸被大家看到并相信。
ChatGPT 引爆趨勢後,微軟率先将 GPT-4 整合到 New bing,讓 AI 滲入到人們日常使用搜索引擎的全流程中。這一波操作,直接讓 New bing 日活用戶破 1 億,數百萬活躍用戶中,有三分之一都是新用戶。
緊接着,Office 全家桶也宣布接入 GPT-4,推出新功能 Microsoft 365 Copilot。微軟 CEO 納德拉在發布會上直接放話:今天,進入人機交互的新時代,重新發明生産力。
随後國内大廠也紛紛跟進,阿裏放話要在所有産品中接入通義千問。
但問題是,有能力自己推出大模型、自己完成 AI 化升級的,畢竟還是極少數科技巨頭的 " 特權 "。即便是直接接入 API,也需要企業本身具備一定的開發團隊。因此在新的趨勢下,很多軟件和應用服務方,都在急迫尋找一個效果好、門檻低的軟件應用 AI 化方案。
而作爲作爲微軟和 OpenAI 的企業級合作夥伴,擁有領先商業化成果的心識宇宙,這幾個月自然要被人 " 踏破門檻 " 了。
據心識宇宙透露,從 MindOS 發布以來,他們收到了數百家企業的試用申請,尤其是今年 1 月趨勢引爆以後,申請量更是空前暴增。
目前,他們已經和全球 Top 3 電商平台之一、亞太地區頭部金融券商、全球頂尖跨境電商平台、國内頭部虛拟人公司和頭部元宇宙平台達成合作。
人機交互變革的新起點
總之,心識宇宙的浮出水面,傳遞出了一個讓人頗爲興奮的信号:
更加自主的 AI Copilot,正在大踏步走進你我的生活。
加之最近 AutoGPT、AgentGPT 等自主人工智能工具爆火,再次驗證了更加靈活、可靠、易用的 AI 是新趨勢的方向。
作爲提前看到趨勢,并率先開啓技術研發、商業化落地的 AGI 領域創始人,陶芳波提出了自己的認知和判斷,即未來世界的發展将會分爲三個階段:
應用和服務的 AI 化:任何需要用戶來做決策的過程,都應該有 AI Copilot 的輔助,來更好提供深度需求理解和場景化推理。
個人爲中心的 AI 出現:每一個人,都可以在交互的過程中,逐漸培養一個和自己深度綁定、且可以幫助串聯任何事的 AI Copilot。
AI Copilot 串聯成網絡:應用和服務的 AI Copilot 和每個個人 AI Copilot,連接成一張全新的網絡,服務的分發會在這個 AI Network 上發生。不是傳統的基于連接的分發,而是基于理解和推理的分發,這些 AI Copilot 會相互合作、協同,幫助人類完成複雜任務。
目前心識宇宙正在快速推進的,就是第一階段。
第二階段也近在咫尺,在今年下半年,他們将會發布面向消費者的 MindOS,屆時所有人都有機會塑造一個專屬于自己的 AI Copilot。
在這些趨勢下,一個更加震撼的變革也在悄然推進,即人機交互方式正在被改寫。
過去一百多年來,人機交互的方式從最初的基于按鈕,發展到了通過命令行,再更進一步飛躍到通過圖形界面完成交互。
當下的計算機、智能手機等,人和軟件之間的信息交流,都是建立在 GUI 的基礎上,也讓人機交互從最初的僅限于專業人群,發展到了普通人範圍。
但對人機交互稍有了解的人都知道,人類最自然的交互方式,其實是語言。
比如想要查詢天氣,如果通過語言,隻需要說一句話 " 北京明天天氣怎麽樣?" 如果通過 GUI,則需要用戶找到軟件、選擇城市、再查看具體的日期。
過去,由于 AI 的能力有限,這種基于語言的交互也隻能做到淺嘗辄止。
AI 語音助手往往是通過識别固定的句式、關鍵字,來做出機械式的回複,給人帶來的體驗升級比較有限。
如今,在大模型能力飛升的背景下,新的可能出現了。
當 AI 可以充分理解人類語言、鏈接各方面能力,僅通過語言的人機交互就會成爲最方便的交互方式。傳統由産品經理定義 UI 界面的方式,都可能被改寫。
林宋琪表示:
未來用戶通過自然語言講解工作流程,AI 就可以連通各個軟件的 API,自主構建工作流和專屬用戶的 UI,這樣所有屏幕都可以變成 AI 的畫布,而每個 AI 助手都是用戶的 " 馬良神筆 "。
也就是說,AGI 之于軟件,正如 Made to order 之于制造,之前是供給到需求,之後是需求到供給,這是一種全新的生産方式。
由此産生的影響,或許都不局限于軟件領域,乃至硬件的生态都可能被改寫。
未來,AI 的載體可能是手機、電腦、頭顯,也可能像鋼鐵俠那樣——是機器人。
或許在以前,這種說法會被定義爲 " 美好的無限想象 ",但是在 ChatGPT 趨勢下,創新正在 " 以小時爲單位 " 發生。
兩個月前,學生們拿 ChatGPT 寫作業、考試,已經讓人咋舌;而如今,人們開始嘗試讓 ChatGPT 自己想辦法開發網站、讓 GPT-4 控制實驗室的機器人做化學實驗……
似乎已經沒什麽不可能發生了。
而人們的無限憧憬與期待,或許也是 AI 創造無限可能的必要因素之一。
那麽,你覺得人人一個 AI Copilot 會是人類的未來嗎?
P.S. 本周心識宇宙将召開 MindOS 内測發布會,感興趣的童鞋可戳下方鏈接報名:
Webinar 1: https://us02web.zoom.us/webinar/register/WN_mCV8jzA-S--4K5u9KssCug#/
Webinra 2: https://us02web.zoom.us/webinar/register/WN_Wpn01K2lTt2sbIw0M0e8IA#/registration
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~