你見過比 Llama 2 參數小 10 倍、性能更好還支持開源的大語言模型嗎?
Mistral 7B 做到了。
根據媒體報道,Mistral 發布的 " 預告模型 " 顯示,在參數量爲 Llama 2 70B 的十分之一的基礎上,Mistral 7B 成功在 MT Bench 上擊敗了 Llama 2。
MT Bench 作爲一個測試降準,由 80 個高質量的多輪對話問題組成,旨在測試多輪對話和指令遵循能力。
這意味着大語言模型(LLM)終于在參數尺寸和性能平衡的問題上找到了一個解決方案。據官方介紹,Mistral 7B 在所有标準英語和代碼基準測試中的性能優于當前可用的高達 13B 參數的 LLM。
今年 9 月,剛剛成立 6 個月的法國 AI 公司 Mistral AI 正式發布 Mistral 7B;上周,作爲唯一一家歐洲公司,Mistral AI 參加了 10 月在英國舉辦的人工智能工程師峰會,與 OpenAI、谷歌、Meta 等科技巨頭同台。
" 技術先驅 "
專業度讓 Mistral 成爲 AI 投資界的新寵兒。
Mistral 的創始人 Arthur Mensch 在接受媒體采訪時表示,盡管作爲一家年輕的初創公司,但 Mistral 對标的是包括谷歌、OpenAI 在内的整個 AI 行業:
" 我們一直是這項技術的先驅。"
" 我們與所有人競争。"
Mistral 官方這樣形容 Mistral 7B 的成長速度:
" 兩年内,它從 Gopher 到 Chinchilla,再到 Llama 2,以及 Mistral 7B。"
其中:Gopher 由 DeepMind 于 2021 年推出,280B 參數量;Chinchilla 由 DeepMind 由于 2022 年推出,70B 參數量;Llama 2 由 Meta 于 2023 年 7 月推出,34B 參數量。
目前,有消息稱 a16z 考慮向 Mistral 投資 2.5 億美元。據直接了解談判情況的人士透露,包括 General Catalyst 和 Andreessen Horowitz 在内的矽谷重量級企業正在考慮出資 4 億歐元,這可能會推升 Mistral 的估值達到 15-20 億歐元。
Lightspeed Venture Partners 的合夥人安托萬 · 莫伊魯德 ( Antoine Moyroud ) 主導了 Mistral 的第一輪融資,他表示:" 他們的表現超出了我們的内部預期," 并補充道 " 對這項業務越來越感到興奮。"
和矽谷分庭抗禮?
目前,以谷歌、OpenAI 爲首的矽谷 AI 公司正處于金字塔頂端,并不斷向上謀求發展,這些矽谷公司也是大多數投資者重點關注的對象。
據悉,OpenAI 正在嘗試以 860 億美元的估值出售員工股票;Anthropic 最近收到了谷歌和亞馬遜的投資承諾,投資總額可能達到 60 億美元。
Mistral 的異軍突起點亮了歐洲在 AI 領域的一盞燈。
因爲市值超過 10 億歐元的公司在歐洲更爲稀缺,而此前法國總統馬克龍也多次暗示對 AI 領域的雄心勃勃,希望能夠培育歐洲本土的 AI 企業。
Mistral 的優勢不止于技術面,Mensch 曾表示,相對于規模更大、資金更充足的競争對手,Mistral 在效率上更有優勢。
他表示,該公司僅用 10 人的團隊就推出了第一個 LLM 模型,培訓成本不到 50 萬美元,而競争對手則花費了數千萬美元。他補充道:" 我們很高興成爲資本效率最高的 LLM 公司。"
另一個優勢在于開源。因 Mistral 公開發布其 AI 模型,支持 Apache 2.0 開源協議,這能夠使企業客戶更好地控制他們的數據,對其中的使用過程可見性更高,并且能夠吸引開發領域的專業人才。
不過,盡管 Mistral 在 6 月的種子輪融資中獲得了創紀錄的 1.05 億歐元,但其目前尚未盈利。Mensch 表示這種情況将在 " 年底前 " 發生改變,他預計将發布一個新平台供客戶訪問其 LLM 模型。
Mitral 投資方之一的 New Wave 的合夥人皮亞 · 德伊裏巴内 ( Pia d'Iribarne ) 表示,建立大型人工智能企業的 " 基本面已經具備 "。