面向全球數學愛好者和科研機構,計劃于年内推出。
來源|多知網
作者 |王上
圖片來源 |Pexels
多知網 5 月 5 日消息,多知網獲悉,學而思正在進行自研數學大模型的研發,命名爲 MathGPT,面向全球數學愛好者和科研機構,以數學領域的解題和講題算法爲核心,目前已經取得階段性成果,并将于年内推出基于該自研大模型的産品級應用。
據悉,學而思已将 MathGPT 作爲公司核心項目,由 CTO 田密負責,今年春節前,該項目已經啓動相應的團隊建設、數據、算力準備和技術研發。此外,學而思已經啓動在美國矽谷的團隊建設,将成立一支海外算法和工程團隊,在全球範圍内招募優秀的人工智能專家加入。
01
MathGPT 與大語言模型(LLM)的差異
美國 OpenAI 公司在今年三月份發布了大語言模型 GPT-4,國内百度、阿裏也發布了各自的大模型産品,但通用語言模型更像一個 " 文科生 ",在語言翻譯、摘要、理解和生成等任務上有出色表現,在數學問題的解決、講解、問答和推薦方面則存在明顯不足:解答數學問題經常出錯,有些數學問題雖然能夠解決,但方法更偏成年人,無法針對适齡孩子的知識結構和認知水平做适配。
" 這種不足是由 LLM 模型的自身特點決定的。"學而思 AI 團隊負責人介紹,LLM 大模型來自對海量語言文本的訓練,因此最擅長語言處理。行業内偏向基于 LLM 大模型做閱讀、寫作類應用,但如果想要在數學能力上有突破,就需要研發新的大模型。因此,學而思決心組建團隊專研 MathGPT ——數學領域大模型,用自己在數學和 AI 上的多年積累,面向全球範圍内的數學愛好者和科研機構,做好 AI 大模型時代的數學基礎工作。
學而思希望通過 MathGPT 彌補和攻克大語言模型的三個問題:第一,題目要解對,現在 GPT 結果經常出現錯誤;第二,解題步驟要穩定、清晰,現在 GPT 的解題步驟每次都不一樣,而且生成内容經常很冗餘;第三,解題要講的有趣、個性化,現在 GPT 的解釋過于 " 學術 " 和機械,對孩子的學習體驗很不友好。
02
做 MathGPT,學而思的技術深耕
學而思作爲獲國家科技部批準的 " 智慧教育國家新一代人工智能開放創新平台 " 建設單位,也是教育行業唯一一家人工智能 " 國家隊 " 成員,在人工智能領域有着多年的深入研究,早在 2017 年,學而思便成立了 AI lab 人工智能實驗室。
據公開信息顯示,基于智慧教育人工智能開放創新平台助力,學而思 AI lab 獲得各類頂級學術會議比賽冠軍 16 項,亞軍 6 項;發表國際期刊和會議高水平學術論文 31 篇,包含光學字符識别、圖像、自然語言處理、語音以及多模态等多領域的學術研究,在計算機視覺頂會以及自然語言頂會中均有多篇論文發表;申請專利 220 餘項,授權專利 150 餘項,軟件著作權 60 餘項。
學而思 AI lab 在各類頂級學術會議比賽獲獎情況
" 以數學起家 " 的學而思至今已有 20 年的數學教學經驗,積累了龐大的數學相關數據,這些數據是進行 MathGPT 訓練的必備物料。另外,學而思的海外業務 Think Academy 在全球若幹國家和地區深受數學愛好者喜歡,學而思的學生在每年的 IMO 和 AMC 等國際數學競賽中表現優異,每年都有多位學生在國際奧林匹克數學競賽中拿到金牌。所以,學而思選擇在 MathGPT 方向發力也順理成章。
另據了解,學而思學習機近期将會上線一款 "AI 助手 ",涵蓋作文助手、口語助手、閱讀助手、數學助手等相關功能,該 AI 産品将于 5 月 11 日開啓内測。
03
MathGPT 的挑戰和技術難題
如何利用大語言模型服務各行各業是當下社會的焦點問題。比如在教育領域,Duolingo、Quizlet、可汗學院等産品主要和 OpenAI 合作,在 GPT 大模型上做微調和接口調用,增強原有的産品體驗。但也有一些領域如數學、醫學等,對 AI 的需求是準确、清晰、具備強大的邏輯推理能力,且容錯率低,通用 LLM 目前的性能表現還無法在上述領域取得突破,未來是否可能取得突破尚不清晰。
以數學領域爲例,目前市場上有幾個主要流派。比如 Google 收購的 Photomath、微軟數學、Mathway、專注數學計算的 WolframAlpha 等産品,主要利用非 LLM 的傳統 AI 技術加上數據庫的方式解決數學問題。走 AGI 路線的公司則嘗試讓通用 LLM" 更懂數學 ",比如 GPT4 在數學任務上比之前的 3.5 版本性能更好,谷歌旗下的 Minerva 模型也專門針對數學問題進行調優。學而思選擇了另一條少有人走的路,不基于現有 LLM 做微調和接口調用、不做通用 LLM,而是自研基于專業領域的 " 數學大模型 "MathGPT,緻力于打造自主、穩定、可持續、高質量的學習解決方案。
在大語言模型不斷進化的浪潮下,不同的技術路線選擇孰優孰劣,仍有待讨論和驗證。學而思自研獨立的 MathGPT 大模型是否成立,是否能夠超越通用模型在數學任務上的表現,是否更匹配不同人群的數學學習場景,這個問題還需要在創新實踐中尋找答案。随着整個行業的深化發展和越來越多人才參與到這個領域,相信不久的将來就能看到更爲成熟的解決方案。
相關閱讀: