作者 | ZeR0
編輯 | 漠影
智東西 3 月 8 日消息,又一家生成式 AI 獨角獸推出了性能匹敵 GPT-4 的大模型,而且訓練計算量隻用了 GPT-4 的40%!
這是美國 AI 獨角獸企業 Inflection AI 最新發布的Inflection-2.5大語言模型,兼具高智商與高情商,支持聯網查詢内容,登錄 Pi 聊天機器人的網頁、iOS、安卓和桌面端 app 均可免費體驗。
讓 Pi 聊天機器人比較 Inflection-2.5 與 GPT-4
試用直通車:https://pi.ai/talk
一個月之内,GPT-4 連迎三個強勁的新競争對手:Gemini 1.5 Pro、Claude 3 Opus,以及最新登場的 Infection-2.5。這意味着 GPT-4 獨霸時代已經過去,大模型王者之戰還有很多可能。
在這場激烈的戰事中,Inflection AI 既年輕又鋒芒畢露,成立剛滿兩年,由前 DeepMind 首席科學家 Karén Simonyan、LinkedIn 聯合創始人 Reid Hoffman、DeepMind 聯合創始人 Mustafa Suleyman 共同創辦,2023 年 6 月獲得英偉達、微軟等參投的13 億美元融資,估值達40 億美元(折合約 287 億人民币),是當前全球第四大生成式 AI 獨角獸。
它是 OpenAI 的大語言模型勁敵之一,以 " 爲每個人創造一個個性化的 AI" 爲使命,2023 年 5 月推出了一款具有同理心、樂于助人和安全的個性化 AI 聊天助手 Pi,11 月推出基礎模型 Inflection-2。與此同時,Inflection AI 正在構建由22000 萬塊 H100 GPU 組成的世界最大 AI 計算集群。
現在,Inflection AI 進一步給 Pi 加料——新升級的 Inflection-2.5 有 " 世界級的智商 "、" 獨特的善良 "、" 好奇的個性 ",并具備 4 個主要亮點:
1、在關鍵基準測試中與 GPT-4 并駕齊驅,并且使用 40% 的計算量來訓練,與其他頂級基礎模型相比訓練效率優勢顯著。
2、在編程、數學等 STEM(科學、技術、工程、數學)領域進步顯著。
3、" 世界級 " 實時網絡搜索功能:确保用戶能獲得高質量、最新的新聞和信息,增強用戶體驗和交互的即時性。
4、廣泛可用性 + 顯著滿意度:對所有 Pi 用戶開放,支持多平台訪問,對用戶情緒、參與度和留存率産生顯著影響,加速了有機用戶增長。
繼 Anthropic 後,又一家初創公司推出了性能強大、能與 GPT-4 一較高下的大語言模型,并在優化模型訓練方法上大秀肌肉。 這展現了創業團隊在大模型競賽中的潛力和沖勁,随着大模型性能不斷升級,如何用更少計算資源訓出更強模型,将是接下來産學界都重點探索的方向。
01 .
用 40% 的計算量,
訓練出接近 GPT-4 的性能
Inflection-1 用了 GPT-4 訓練 FLOPs 的約4%,在不同的智商導向任務中,平均性能達到 GPT-4 水平的大約72%。Inflection-2.5 用了 GPT-4 訓練 FLOPs 的40%,在不同的智商導向任務中,平均性能達到 GPT-4 的94%以上。
Inflection-2.5 在 MMLU 基準測試上的成績相較 Inflection-1 進步明顯,略低于 GPT-4。
MMLU 基準測試衡量了從高中到專業難度的各種任務的性能。Inflection AI 還根據 GPQA 鑽石基準進行評估,這是一個極難的專家級基準。
其測試還包括兩種不同的 STEM(科學、技術、工程、數學)考試的結果:匈牙利數學考試和物理 GRE(物理研究生入學考試)的表現。
在 BIG-Bench-Hard(大語言模型難以解決的 BIG-Bench 問題的子集)上,Inflection-2.5 性能比 Inflection-1 提高 10% 以上,接近 GPT-4。
在 MT-Bench 上評估模型後,Inflection AI 意識到,在推理、數學、編程類别中,有很大一部分(接近 25%)的示例具有不正确的參考解決方案或具有錯誤前提的問題。因此 Inflection AI 更正了這些示例,并發布了該版本的數據集。
在評估這兩個子集時,Inflection AI 發現在正确修正的版本中,其模型更符合他們基于其他基準的期望。
與 Inflection-1 相比,Inflection-2.5 在數學和編程性能方面有了顯著進步。下表是在 MBPP+ 和 HumanEval+ 兩個編程基準上的評測結果對比。
在 HellaSwag 和 ARC-C 常識和科學基準測試上進行評估,Inflection-2.5 同樣表現強勁。
02 .
特别緻謝微軟 Azure 和 CoreWeave,
正構建世界最大 AI 集群
上面所有的評估都是用現在爲 Pi 提供動力的模型 Inflection-2.5 完成的,但是 Inflection AI 注意到,受 web 檢索的影響(沒有使用 web 檢索的基準測試),少量提示詞的結構以及其他生産端差異,用戶體驗可能會略有不同。
這家獨角獸企業還專門緻謝了爲其提供算力資源的合作夥伴Azure和CoreWeave。
Azure 是微軟雲計算服務,CoreWeave 則是去年憑借英偉達的支持坐擁數萬塊芯片狂攬算力大單的 GPU 雲服務黑馬。
2023 年初,CoreWeave 找到 Inflection 并爲其提供幾千張 H100 GPU。英偉達看中了這個組合的巨大潛力,先後向兩家公司投資數億美元,擡高了 Coreweave 的 H100 供貨優先級。
2023 年 6 月,Inflection AI 宣布與将與合作夥伴 CoreWeave、英偉達一起,構建世界上最大的 AI 集群,包含22000 個 H100 GPU。
CoreWeave-Infection AI 超算的信息推測(圖源:The Next Platform)
就在宣布最大 AI 集群的一個月前,Inflection AI 推出 Pi 聊天機器人,向 OpenAI 正式下戰書。
不同于 ChatGPT 等産品的 " 生産力工具 " 定位,Pi 想做 " 個人 AI",成爲用戶 24 小時在線的數字朋友,更注重爲用戶帶來友好、豐富的社交互動體驗。Pi 能記住與跨平台登錄用戶的 100 次對話,支持網頁、APP、短信、社交平台等設備交互。
相比其他 AI 聊天機器人,Pi 可能在文本生成、代碼生成等能力上不算出衆,但在安全、同理心等特性上獨樹一幟。
這也是爲什麽這家創企剛創辦就從微軟等公司處籌集 2.25 億美元,一年後又拿到微軟、英偉達、微軟聯合創始人比爾 · 蓋茨、Alphabet 前 CEO Eric Schmidt 等的 13 億美元融資,飛速成爲全球最大的生成式 AI 獨角獸之一。
截至 2023 年年底,Inflection AI 估值約爲 40 億美元,是全球第四大生成式 AI 獨角獸,僅次于 OpenAI、Anthropic、Character.AI。
03 .
聯創團隊有錢有技術:
曾創辦 DeepMind,曾投資 OpenAI
2022 年 3 月成立的年輕 AI 團隊,能赢得微軟和英偉達兩大巨頭的青睐,與其創始團隊密不可分。
Inflection AI 聯合創始人Reid Hoffman被稱作 " 矽谷人脈王 ",是矽谷最有名的天使投資人之一,他是全球最大專業社交網站 LinkedIn 的聯合創始人,以及風險投資機構 Greylock Partners 的合夥人,曾是 OpenAI 的創始投資者。
截至 2023 年 5 月,Reid Hoffman 和 Greylock Partners 已投資至少 37 家 AI 公司。
左爲 Mustafa Suleyman,右爲 Reid Hoffman(圖源:福布斯、Business Insider)
另一位聯合創始人Mustafa Suleyman,2009 年與幾位合夥人共同創立 DeepMind,并将研究重點放到 AI 在醫療健康和氣候變化中的應用,但連年虧損壓得 Suleyman 喘不過氣。2014 年,谷歌抛出橄榄枝,6 億美元将 DeepMind 收入麾下。
背靠金主的 DeepMind 終于可以沒有資金之憂地繼續從事前沿研究,然而 5 年後,Suleyman 卻選擇離開 DeepMind,加入谷歌并擔任 AI 産品管理和 AI 政策副總裁。背後原因,據說是由于一些同事曾抱怨他在工作上騷擾和欺淩同事。
Suleyman 也曾坦言,作爲 DeepMind 聯合創始人,他對員工的要求過于苛刻,有時他的管理風格并不具有建設性。2022 年,他離開谷歌,創辦 Inflection AI 并擔任 CEO," 希望與有遠見和無所畏懼的創始人在一起 "。
第三位聯合創始人是前 DeepMind 首席科學家Karén Simonyan,現任 Inflection AI 首席科學家。他是同代中成就突出的深度學習研究者之一,其出版物(包括 5 篇在學術頂級期刊 Nature 和 Science 上的論文)吸引了超過 18 萬次引用。
Karén Simonyan 部分高引用量學術成果
Karén Simonyan 在牛津大學完成了博士學位和博士後學位,期間設計了 VGGNet 圖像處理框架并在赢得了知名的 ImageNet 挑戰賽。随後他創辦 Vision Factory AI 公司,将 VGGNet 商業化。這家公司很快就被 DeepMind 收購,karsamyn 的身份則變成了 DeepMind 首席科學家。
任職 DeepMind 首席科學家期間,karsamyn 建立并領導了大規模深度學習團隊,開發了基于真實世界數據的大型 AI 模型。他在 AlphaZero、AlphaFold、WaveNet、BigGAN 和 Flamingo 等 AI 突破中均發揮了關鍵作用。
04 .
結語:團隊不到 50 人,
Pi 每日聊天消息數超 40 億
據外媒 Axios 援引 Suleyman 的話,當前 Inflection AI 團隊擁有 70 名員工。
據 Inflection AI 透露,其 100 萬日活躍用戶和 600 萬月活躍用戶與 Pi 聊天機器人往來了超過 40 億條消息。與 Pi 的平均談話時間爲 33 分鍾,每天有 1/10 的談話時間超過 1 小時。在任何一周與 Pi 交談的用戶中,約有 60% 的人會在接下來的一周返回,其月粘性高于主要競争對手。
Inflection AI 認爲,新推出的 Inflection-2.5 保持了 Pi 的獨特、平易近人的個性和出色的安全标準,同時成爲一個更有用的模型。這個 " 智商 " 更加接近 GPT-4 的模型,将讓 Pi 在更具人性溫度的同時,成爲能夠提供更好建議的個人 AI 朋友。