不敢對比阿裏Qwen2.5，Mistral“最強小模型”陷争議，歐洲的OpenAI也不Open了

歐洲的 OpenAI，也不 Open 了。

Mistral AI發布自稱 " 世界上最好的邊緣模型 "，卻陷入質疑和争議。

不僅因爲這一次沒有磁力鏈接開放模型權重，也因爲聲稱 " 始終優于同行 "，但競品對比并不全面。

官方賬号和 CEO 的評論區中，有網友不留情面的指出問題：怎麽不和 Qwen2.5 對比呢？

Mistral AI 這次最新發布兩款模型，Ministral 3B/8B，用于端側和邊緣計算。

公告中聲稱，兩款模型在 10B 以下規模的知識、常識、推理、函數調用和效率方面推進了新的前沿。

展示的基準測試則使用内部框架重新評估所有模型，并聲稱在多項任務中 " 始終優于同行 "。

但在具體評測結果中，隻對比了自家初代 Mistral 模型、谷歌的 Gemma 和 Meta 的 Llama 系列。

缺失的 Qwen2.5 系列在 9 月 19 日發布，官方評測結果中對比對象同樣包含 Mistral 7B、Llama 3 和 Gemma 2。

盡管不是嚴格同樣條件下的對比，在很多開發者看來相對數據也有參考價值。

StabilityAI 前 CEO Emad Mostaque 初步體驗後也表示，認爲 Qwen2.5 感覺上更好，開源許可也更寬松，推薦更多人嘗試 Qwen2.5。

端側小模型競争激烈

Ministral 3B/8B 兩款模型都支持 128k 上下文長度，Ministral 8B 具有特殊的交錯滑動窗口注意力，可實現更快且節省内存的推理。

除此之外，目前沒有透露更多技術細節。

兩款模型從今天開始在官方平台提供 API 調用，需要聯系官方獲得商業許可。

另外8B 模型權重僅供研究使用，3B 模型權重目前并未開放。

對此，Django 框架創始人Simon Willison發文表示，在擁有更寬松開源許可且質量很高的 Llama 系列情況下，很難對 Mistral 新模型感到興奮。

值得注意的是，Qwen2.5-7B 雖然是寬松的 Apache 2.0 開源許可，但 3B 模型與 Mistral 一樣選擇了研究用許可。

從中也可以看出，能在手機等設備跑的端側小模型中，目前真正實用的 3B 規模商業化落地正在加速，AI 公司之間的競争也越來越激烈。

歐洲的 OpenAI 變味了

Mistral AI 發布端側小模型的這一天，也是他們首款模型 Mistral 7B 的一周年附近。

官方還制作了忍者神龜梗圖，展示其品線已經在一年之内迅速完善起來。

一年前，Mistral AI 以先丢出神秘磁力鏈接、開放模型權重，幾天後再發技術報告的獨特作風，成爲開源社區新寵。

但如今，這家 " 歐洲的 OpenAI" 也漸漸不 Open 了。

在 2024 年初，Mistral AI 宣布與微軟合作，同期推出的 Mistral Large 大模型不再開放權重，并悄悄撤回了官方網站上有關開源社區義務的内容。

這一舉動被視爲公司戰略的重大轉變，引起一波議論。

一些開源社區成員對此表示失望，認爲這種先通過免費或低成本的産品吸引用戶，然後通過高級功能收費的方式，是一種 " 背叛 "。

最近一次 Mistral AI 甩磁力鏈接開放權重的模型，是他們首款多模态大模型 Pixtral。

有觀點認爲這是由于他們剛進入多模态這一賽道，之後商業模式成熟了也會漸漸轉向非開源。

有網友表示，随着大模型商業競争加劇，未來 Mistral AI 走向開源的對立面是不可避免的，令人難過。

盡管如此，他們仍然赢得了許多善意，所以我還在爲他們加油。

參考鏈接：

[ 1 ] https://mistral.ai/news/ministraux/

[ 2 ] https://x.com/arthurmensch/status/1846565876046201289

[ 3 ] https://simonwillison.net/2024/Oct/16/un-ministral-des-ministraux/