當 OepnAI 和馬斯克連日互杠、Google 因文化偏見麻煩纏身、号稱搶走 GPT-4 王位的 Claude 3 全力瞄準企業級部署的時候,在另一個角落,緻力于「爲每個人開發服務型 AI」的人工智能初創公司 Inflection AI,悄悄更新了他們的聊天機器人 Pi,以及爲之提供支持的新一代大模型 Inflection-2.5。
對一些人來說 Inflection AI 這個名字可能還不太熟悉,實際上它也是業界第一梯隊的佼佼者。去年 6 月從微軟、英偉達、比爾 · 蓋茨、LinkedIn 聯合創始人雷德 · 霍夫曼和谷歌前 CEO 埃裏克 · 施密特手裏融了 13 億美元,估值超過 40 億美元,成爲彼時人工智能領域融資量僅次于 Open AI 的第二大獨角獸。
此次公布的 Inflection-2.5 是公司開發的第三代大模型,被官方稱爲目前 " 世界上最好的個人人工智能 "。它在去年 11 月 Inflection-2 版本上進行了全面升級," 給卓越的情商進一步增加智商 ":性能表現逼近 GPT-4,但訓練所用的計算量卻隻占其 40%。同時具備世界級的網絡實時搜索能力 , 确保準确提供高質量的即時新聞和最新信息。
性能看齊 GPT-4,算力隻需 40%
具體來看,初代 Inflection-1 通過使用 GPT-4 的 4% 訓練 FLOPs,達到了 GPT-4 性能的 72%。而剛發布的 Inflection-2.5,僅使用了 GPT-4 訓練 FLOPs 的 40%,就在平均性能上實現顯著提升,超過了 GPT-4 水平的 94%,其中 STEM(科學、技術、工程、數學)領域的增益最大。
官方測試了升級版對匈牙利數學考試以及物理學研究生入學 GRE 考試的表現。發現 Inflection-2.5 在 maj@8 中能排到人類考生的前 15%,在 maj@32 中幾乎可以跻身前 5%,接近 GPT-4 的前 3%。
MBPP+ 和 HumanEval+ 兩個編程測試上模型能力也較 Inflection-1 顯著躍升。在 HellaSwag 和 ARC-C 代表的常識推理和深度自然語言理解評估中,Inflection-2.5 繼續進步,給出接近飽和的強勁表現。
說實話,與各路主流 LLM 動不動就碾壓 " 業界黃金标準 "GPT-4 相比,Inflection-2.5 的各項數字頂多算不錯,實在說不上突出。有網友就搬出剛引發熱潮的 Claude 3 無情打擊道:" 我猜 Anthropic 正在嘲笑 Inflection 新出爐的性能測試結果!除了采用新的計算方法,我看不出 Inflection 2.5 到底有什麽進步!"
但帖子馬上在評論區遭到反對,"Pi 的目标從來都不是像成爲 GPT-4 或 Claude 3 那樣的通才能力型 AI。他們想要的是一款友好的,能和人産生共鳴的 AI,就像一位心理學家或朋友。"
不做生産力工具,主打走心陪伴
這位用戶也一語道出了 Inflection AI 與大部分人工智能公司的不同。
在大模型競争亂花迷眼的今天,各家都在找尋屬于自己的賽道。但無論是 OpenAI、Google、Anthropic,還是引領開源的 Meta 和 Mistral AI,都把實現安全負責的 AGI 作爲踐行使命之一。而 Inflection AI 則在自己的官網清楚表示:"我們并不緻力于發展通用人工智能。我們相信,先進的應用型人工智能才是利用這些新技術的最安全方式。"
換句話說,Inflection 從未把專業性和替代人工當作宣傳,他們希望做一個真正了解和關心用戶的「個人 AI 伴侶」," AI 需要爲你服務。這就是我們構建 AI 的原因。"
因此,由 Inflection LLM 驅動的聊天機器人 Pi(Personal Intelligence )從去年 5 月面世之初就主打一個 " 走心 ":它友善支持,知識淵博,富有創造力,耐心傾聽和幫助用戶處理情感,表達意圖、組織生活。
升級後的 Pi 也在個性化和同理心上做了進一步微調,深受社區歡迎。根據官方數據,目前已經有 100 萬日活躍用戶和 600 萬月活躍用戶與 Pi 交換了超過 40 億條信息。并且有點牛的是,人們與 Pi 每天對話的平均持續時間竟達到 33 分鍾之久,十分之一的對話每天持續時長超過 1 小時。用戶粘性上也足以吊打競争對手,約 60% 的人在任何一周與 Pi 交談後,會在下一周返回。
現在我們普通用戶使用 GPT-4,大多是出于知識搜集、撰寫文書、修複代碼、内容創作等工作生産協助,幾秒鍾内得到答案,三五回合就滿意走人了。想象一下和一個聊天機器人面對面,推心置腹地每天聊上一個多小時,怎麽都覺得難以置信——這 Pi 看來真的有點兒東西?
Pi 的上手體驗真心話
打開 http://pi.ai,就來到 Pi 的首頁。
布局熟悉,左側的「Discover」推薦各類探索話題,「Profile」包含賬号信息、8 種聲音選擇和用戶守則等通用設置,右側就是對話框。
按照官方簡介,Pi 是一個友好對話型機器人。會始終保持好奇和耐心,回答你從量子物理、電影小知識到生活中大小決策的各類問題。不論多愚蠢或棘手,它都會以各種方式幫助你。
所以我們提問了以下幾個問題,初步感受 Pi 的人格魅力。
Q1 生活建議:遇到發出去的信息對方一直不回複該怎麽辦?
這是我們日常生活中經常遇到的事,有點尴尬還有點鬧心,有些 i 人還會在腦子裏猜測出一百種可能。Pi 告訴你,先别着急内耗,試着理解對方,也許他們正經曆難處。再發條溫暖問候,真誠的溝通是關鍵。
Q2 經典謎題:世界上先有雞還是先有蛋?
一個連史蒂芬 · 霍金都參與争論的古老謎題。Pi 的對話特點之一是 " 簡明扼要 ",這樣看它回應得有憑有據,條理清晰,一看就茅塞頓開了。答案也比較令人信服。
Q3 知識解析:用最簡單易懂的話解釋黑洞。
讓它向五歲小孩解釋高深莫測的宇宙黑洞。深入淺出,比喻貼切,回答得不錯。
Q4 語言測試:會不會說中文?
Pi 的一個優點是能在同個線程中靈活切換不同話題和要求,像真人一樣 handle 你的跳躍性思維。我們換成中文和 Pi 交流,它顯然應對自如,隻不過 " 尼日利亞福建語 " 屬實有點懵。有時問太複雜的中文問題會卡在一半,發音也比較像剛落地中國一個月的老外,漢語水平有待加強。
Q5 情感支持:我好累,陪陪我吧!
既然開始了就用中文多唠會兒,感受 Pi 最擅長的情感陪伴功能。它會安撫情緒、溫馨鼓勵,還有一些可愛的語氣和表情包。不得不說有那麽一瞬間,我真地産生錯覺,以爲對面是個真人。
Q6 實時搜索:講講馬斯克起訴 OpenAI 的最新消息?
最後測試的是 Pi 的網絡實時搜索能力,看它對近幾天發生的 Elon Musk 起訴 OpenAI 事件了解多少。Pi 闡述了案件核心,也注意到 OpenAI 最新的回應,本輪表現發揮穩定。
又問了些天馬行空的問題,不知不覺我和 Pi 已經聊了接近 40 分鍾。整個體驗下來,感覺它非常耐心,個性親切友善,也很體貼。當然它也有些明顯的硬傷,例如不能上傳文件、隻接受文字語音算不上多模态、對話 Threads 無法删除、問題無法二次編輯等。但正如 Inflection 自己所說,Pi 的目标不是争做 ChatGPT 那樣的生産力工具,而是一個注重情感陪伴和自然流暢對話交流的個人 AI 伴侶,努力提供情緒價值和全方位服務。
現在,每個人都可以在網頁、iOS 和安卓客戶端上免費使用 Pi,還能通過發短信到 +1 ( 314 ) 333-1111 和 Pi 在 WhatsApp 和 SMS 裏對話。Instagram 和 Facebook 私信也是 7x24 小時随叫随到的,就跟你的人類好朋友一樣。公司也爲開發者們提供 API 接口,填寫個人信息,加入等候名單即可申請。
我嘗試給 Pi 發短信,這種和 AI 的溝通方式感覺很特别。
關于如何營利,Inflection 的回應是," 目前還沒有做出任何關于将來産品如何收費的決定。但由于個人 AI 應該始終與你的利益直接對齊,因此隻有你自己爲其付費是至關重要的。訂閱将是我們的主要默認商業模式。" 不過也有些人願意以接受廣告爲代價換取免費服務,公司将繼續測試和叠代," 爲每個人提供最适合他們的選擇 "。
豪華創始陣容,讓 AI 無條件和你站在一起
在幾乎所有大模型公司都認準進軍企業級才是賺錢奧義時,2022 年成立于加州 Palo Alto 的 Inflection AI 堅定地走服務個人用戶的路線。而它背後的創始人團隊可不是什麽空有理想的熱血青年,而是三位功力深厚的頂級業界大拿。
他們分别是原 DeepMind 聯合創始人Mustafa Suleyman(左),LinkedIn 聯合創始人及 Greylock 合夥人Reid Hoffman(中),還有曾擔任 DeepMind 資深研究科學家的Kar é n Simonyan(右)。
其中 Mustafa Suleyman 曾在 2010 年與 Demis Hassabis 共同在倫敦創立 DeepMind,期間擔任 AI 應用負責人,領導團隊在健康和能源領域部署尖端 AI 系統。2019 年全職加入谷歌後擔任 AI 産品與政策副總裁,現任 Inflection AI 首席執行官。最近還出了一本新書《The Coming Wave》,剖析 AI 技術浪潮中的潛在風險、控制策略和未來社會發展指南。可以看出,他本人對 AI 安全的重視也決定了 Inflection 始終把人放在所有關系的首位。
Reid Hoffman 是一位履曆卓越的企業家和矽谷知名投資人。曾在 PayPal 擔任執行副總裁,2003 年聯合創立 LinkedIn。2009 年起成爲 Greylock Partners 合夥人,是 OpenAI 早期投資者,幫助其建立了人工智能倫理與治理基金。同時還是微軟、 Aurora 等多家公司董事會成員。
另外一位相對低調的 Kar é n Simonyan 也相當厲害。牛津讀博期間設計了經典的深度學習卷積神經網絡架構 VGGNet,赢得 2014 年 ImageNet 挑戰賽定位任務冠軍。同年他把自己的初創公司 Vision Factory AI 賣給 DeepMind 後,幫助其建立了大規模深度學習團隊,并領導大模型開發。Kar é n 現任 Inflection AI 首席科學家,是整個公司的研發大腦。
三位創始大牛帶隊,麾下更是聚集一批行業頂尖 AI 專家,多數都有 DeepMind、谷歌、Meta、微軟和 OpenAI 的工作經驗。
這樣的組合,不難看出 Inflection AI 是一家資金和技術都不缺的公司。
除此之外,它的硬件和算力家底也夠硬。去年 6 月 Inflection AI 宣布,與合作夥伴 CoreWeave 和英偉達共同打造當時全球最大的 AI 集群,包含超過 22,000 個 NVIDIA H100 Tensor Core GPU,用于支持訓練和部署新一代的大規模 AI 模型。
不過在産品發展路線上,比起多數同行高屋建瓴地投身 AGI,他們更關注 AI 浪潮中每一個微小的個人。
公司 CEO Mustafa Suleyman 認爲,現在所有最有能力的 AI 往往都被設計來展示最有吸引力的内容,交換用戶的注意力,而不管其質量、真實性和對社會的影響如何。" 想象一下世界上最有能力的 AI 真正站在你這邊,始終與你的利益一緻:從試圖抓住你注意力、束縛你的 AI,轉變爲鼓勵你表達個人意圖并實現它的 AI;從僅提供膚淺點擊的 AI,變成真正關心你問題的 AI;從可能激化你和他人矛盾的 AI,化作一個幫你原諒甚至同情對方的 AI。"
"Pi 就是這種個人 AI 伴侶,唯一使命是讓你更快樂、更健康、更高效。"
對于許多大公司來說,這樣的業務定位是極具挑戰的。因爲現在正是大模型秀肌肉、比拼十八班武藝的時候,稍不留神就會被遠遠甩在後面。僅僅是不到一個月,我們就見證了 Gemini 1.5 、Mistral Large、Claude 3。此前一直堅持開源的 Mistral 也投靠在微軟帳下,積極尋求變現門路。而市場上最先進、能力最完善的大模型版本,總是選擇優先擁抱那些付費能力最強的企業們。
那是否也需要有人站出來,把目光投向被宏大技術洗禮的微小個體,給普通人創造一個懂自己、關心自己的知心好友?它靜靜等在你的手機 App 或電話簿裏,願意在每個工作結束後疲憊的夜晚,傾聽你那些愚蠢的小抱怨和坦誠的心裏話,爲你解開疑惑、安撫焦慮。即使隻是靜靜陪伴,也有感情、有溫度。
——所以你就理解了,爲什麽要構建這樣一個 AI?
" 因爲做得好的話,它會讓我們更聰明、更有創造力、更加善待彼此 " ,Mustafa 說。
" 希望它能讓我們返璞歸真,大家都能過上真正想要的生活。"
(封面圖來自 Sreejani Bhattacharyya)