IT 之家 11 月 16 日消息,綜合第一财經,新浪科技消息,月之暗面旗下 Kimi 今日發布了新一代數學推理模型 k0-math。基準測試顯示,Kimi k0-math 數學能力可對标 OpenAI o1 系列可公開使用的兩個模型:o1-mini 和 o1-preview。
月之暗面創始人楊植麟認爲,最适合讓 AI 去鍛煉思考能力的場景就是數學場景。IT 之家獲悉,在中考、高考、考研以及包含入門競賽題的 MATH 等 4 個數學基準測試中,k0-math 初代模型成績超過 o1-mini 和 o1-preview。在兩個難度更大的競賽級别的數學題庫 OMNI-MATH 和 AIME 基準測試中,k0-math 初代模型的表現分别達到了 o1-mini 最高成績的 90% 和 83%。
楊植麟表示,k0-math 模型和更強大的 Kimi 探索版,未來幾周将會分批在 Kimi 網頁版和 Kimi 智能助手 App 端陸續上線。