技術與政治的混合優勢。
Mistral 目前法國科技界的驕傲和喜悅,也是開源力量的代表。它的初期成功要歸功于能巧妙地将 AI 技術與政治結合起來。問題是 Mistral 能否将這種誘人的技術與政治混合優勢轉化爲實實在在的利潤。
這家法國 AI 初創的崛起就像西北風一樣輕快,這也是它名字 Mistral 的由來。
Mistral 翻譯過來是密史脫拉風,法國南部羅納河谷一帶特有的強風,幹寒強烈,持續時間長。據說,梵高和高更的決裂也與普羅旺斯刮起的密史脫拉風有關。
Mistral 位于巴黎的辦公室,它們也是法國目前最有前途的大模型初創公司
本周一,這股 " 強風 " 發布了直接對标 GPT-4 的旗艦級大模型 Mistral Large。雖然參數數量不及對手,但性能幾乎可與 GPT-4 相媲美。随着 Mistral Large 上線,Mistral 還推出了名爲 Le Chat 的聊天助手,直接對标 ChatGPT。
Mistral 還宣布與微軟達成協議,成爲繼 OpenAI 之後第二家在微軟 Azure 雲計算平台上提供商業語言模型的公司。微軟也将持有 Mistral 一小部分股份。
有些比賽在真正開始之前就已經結束。在制作最強大型語言模型(LLM)的競賽裏,OpenAI 一直遙遙領先,不斷 " 吞噬 " 人才、數據和計算能力以構建更智能的模型,吸引更多用戶,再将更多的資金投入到更複雜的模型研發中。但是,Mistral 要給飛輪制造些麻煩。它想要證明,這個行業不應該是美國化的,而是可以變得更加開放。" 我們是一家獨立的歐洲公司,具有全球野心,這部分也沒有改變。" Mistral CEO Arthur Mensch 最近在社交平台上再次重申。
另外,如果它們确實對 OpenAI 構成了嚴峻挑戰,這也将證實一些業内人士的懷疑——即,在生成式 AI 中,規模并不是一切。" 這不再是一個(規模)做大的問題,而是事關創造力和速度。" Arthur Mensch 說。
31 歲的聯合創始人兼 CEO Arthur Mensch 曾在法國一些頂尖大學學習,也在 Google DeepMind 工作過。
這家法國公司成立還不到一年,目前僅有 34 名員工。盡管如此,聲稱堅定站在開源文化一邊(也就是 OpenAI 和谷歌對立面)讓它們成爲開源 LLM 技術的領頭羊之一,也獲得了相當可觀的融資—— 4.9 億歐元 ( 約合 5.31 億美元 ) ,估值超過 20 億美元。大腕兒投資人包括 Andreessen Horowitz 、General Catalyst 等矽谷領先風險投資家,還有谷歌前首席執行官 Eric Schmidt 等科技名人。
随着世界各國政府開始思考這種技術的潛力,政治在 AI 行業中扮演的角色也越來越有分量。Mistral 的初期成功要歸功于巧妙地将主要的 AI 技術成分(人才、數據和計算能力)和政治因素結合起來。
先來看看人才。法國工程教育和美國大型科技公司的融合可謂 " 天造地設 ",Mistral 就是它們的結晶。Mistral 六位創始人中的三位—— Arthur Mensch,Timothée Lacroix 和 Guillaume Lample ——加上一些核心技術人才,都是法國精英技術學校的高材生。和許多其他頂級 AI 科學家一樣,他們在谷歌、Meta 位于巴黎的研究機構從事 LLM 研究,這使他們成爲世界上爲數不多(據說隻有 100 來人)真正知道如何訓練尖端模型成員中的一員。
再來看數據。他們似乎特别擅 長治理數據來訓 練他們的模型——這也是 LLM 成功的第二個因素。Mensch 不願意談論公司如何管理模型的訓練集,畢竟這是它們的競争優勢來源。但業内人士證實,這家初創在保證數據質量( curation )方面 " 非常聰明 ",例如過濾掉重複或沒有意義的信息,Mistral 的模型也因此變得更小—— 模型 " 參數 " 量以數十億計,而 OpenAI GPT-4 的參數量估計爲 1.8 萬億 ( 兩家公司都對确切的規模保持沉默 ) 。如此一來,無需龐大的數據中心,客戶在自己電腦上就能運行他們的大模型。
Mensch 表示,Mistral 對數據管理的關注,使得它們能比競争對手更有效地使用算力,這也是 LLM 成功的第三個要素。訓練 Mistral 最新模型成本遠低于 OpenAI (GPT-4 大概花了 1 億美元),同時客戶用自己的數據微調、運行模型的成本大爲降低。
常言道,像 Mistral 這樣的初創公司往往在技術上享有 " 後發優勢 "(相對于 OpenAI ),但要像 Mistral 一樣取得目前的成績,除了技術過硬還需要政治智慧的加持,特别是許多政府認爲本土的 LLM 會給國家帶來經濟和戰略上的優勢。别忘了 Mistral 的另一位聯合創始人正是法國前數字經濟國務秘書(初級部長)Cédric O。
Cédric O 隻有 40 歲,但他已經在法國總統馬克龍政府高層工作了幾年,與馬克龍一直保持着直接聯系,後者對所有 AI 相關的事情都抱有濃厚興趣。
Mistral AI 的聯合創始人 Cédric O。除此之外,他還是 Wagon 編碼訓練營的學生以及政府 AI 委員會的成員。
Cédric O 過去曾支持激進的技術監管(想想谷歌、微軟、亞馬遜、臉書等巨頭在歐洲接到的巨額罰單和稅),但一直呼籲歐洲對基礎大模型的監管更爲寬松些,否則可能會 " 扼殺 " 大陸爲數不多的能夠挑戰美國科技巨頭的機會。 " 沒有任何迹象表明歐洲在未來幾十年裏不會被完全邊緣化," 他對歐洲大陸能否在與美國和中國的這場創新競賽中保持領先地位缺乏信心。
他被 Mistral 吸引,首先是因爲創始人 Arthur Mensch、Timothée Lacroix 和 Guillaume Lample、Meta 和 Deepmind 校友的雄心壯志。但很快發現,這家法國初創公司将面臨 Meta 或 Google 規模的科技公司所面臨的業務、監管和媒體障礙。這就是他的經驗可以發揮作用的地方。
" 我爲歐洲和法國的初創公司而奮鬥,因爲它們是我們的未來。" 他曾說。去年,當歐盟《人工智能法案》草案要求 Mistral 公開其數據配方時,在馬龍支持下,Cédric O 成功協調了法德兩國的努力抵制此類條款,并将它們适當地從法案中删除。
現在的問題是,尚未産生可觀收入的 Mistral 能否将這種誘人的技術與政治混合優勢轉化爲利潤。該公司的賭注是,許多企業,尤其是歐洲企業,希望對他們使用的 LLM 擁有更多的控制權(比 OpenAI 願意給予的要多),也不想被鎖定在另一個美國技術平台上。按照這種思路,這些客戶會願意付錢給它們維護和運行這些模型。這可能也是微軟選擇 Mistal 成爲第二位合作夥伴的重要原因。
不過,潛在客戶也可能會問一個問題:如何監管開源模型?有關這些開源模型是否會讓恐怖分子和其他不良分子制造生物和網絡武器的激烈辯論已經平息。政策制定者之間的讨論也沒有大談風險,而是轉向了潛在回報的問題,包括提高透明度,增加創新,減少對少數掌握技術的強大公司的依賴。 到目前爲止,大西洋兩岸的監管機構都對開源 LLM 持容忍态度。但是,如果這些模型繼續變得更強大,或者被發現被濫用,屆時 Cédric O 可能會再次感到忙不過來。
顯然,避免政治反彈符合 Mistral 的利益,但遊說的成功也有其反面——監管的寬容幾乎肯定會導緻更多的開源競争。2 月 20 日,芬蘭公司 Silo AI 推出了一種新 LLM,比 Mistral 更開放,提供了訓練它的數據和完成工作的軟件的信息。新版本将在幾個月後推出,在大多數歐洲語言版本上的表現将和其在芬蘭語、英語版本中的表現一樣好。
最重要的是,目前還不清楚規模是否對生成式 AI 很重要。當 OpenAI 最終發布它的下一個模型 GPT-5 時,對這一預測的檢驗将會到來。如果 GPT-5 讓 Mistral 等開源力量望塵莫及,那麽,Mistral CEO 關于創造力和速度的的言論将顯得空洞也沒有說服力。不過,在此之前,這家明星公司的故事将繼續引發世人的共鳴。