大模型領域又來新玩家。
據了解,學而思正在進行自研數學大模型的研發,命名爲MathGPT。
面向全球數學愛好者和科研機構,以數學領域的解題和講題算法爲核心。
目前已經取得階段性成果,并将于年内推出基于該自研大模型的産品級應用。
據悉,學而思已将 MathGPT 作爲公司核心項目,由CTO 田密負責。
今年春節前,該項目已經啓動相應的團隊建設、數據、算力準備和技術研發。
此外,學而思已經啓動在美國矽谷的團隊建設,将成立一支海外算法和工程團隊,在全球範圍内招募優秀的人工智能專家加入。
MathGPT 與大語言模型(LLM)的差異
OpenAI 在今年三月份發布了大語言模型 GPT-4,國内百度、阿裏也發布了各自的大模型産品,但通用語言模型更像一個 " 文科生 ",在語言翻譯、摘要、理解和生成等任務上有出色表現,在數學問題的解決、講解、問答和推薦方面則存在明顯不足:
解答數學問題經常出錯,有些數學問題雖然能夠解決,但方法更偏成年人,無法針對适齡孩子的知識結構和認知水平做适配。
" 這種不足是由 LLM 模型的自身特點決定的。"
學而思 AI 團隊負責人介紹,LLM 大模型來自對海量語言文本的訓練,因此最擅長語言處理。
行業内偏向基于 LLM 大模型做閱讀、寫作類應用,但如果想要在數學能力上有突破,就需要研發新的大模型。
因此,學而思決心組建團隊專研 MathGPT ——數學領域大模型,用自己在數學和 AI 上的多年積累,面向全球範圍内的數學愛好者和科研機構,做好 AI 大模型時代的數學基礎工作。
學而思希望通過 MathGPT 彌補和攻克大語言模型的三個問題:
第一,題目要解對,現在 GPT 結果經常出現錯誤;
第二,解題步驟要穩定、清晰,現在 GPT 的解題步驟每次都不一樣,而且生成内容經常很冗餘;
第三,解題要講的有趣、個性化,現在 GPT 的解釋過于 " 學術 " 和機械,對孩子的學習體驗很不友好。
爲了實現這些目标,MathGPT 将結合大語言模型和計算引擎兩者的能力,大語言模型負責理解題目、分步解析,并在合适的步驟自行調用計算引擎,這樣能提高題目解答正确率。
基于海量名師解題過程的數據進行模型訓練,模型的解題步驟可以更加清晰。
再引入優秀老師的教學理念和方法,模型在解題趣味性上也能進一步提高。
據透露,MathGPT 将先從中小學數學做起,逐步覆蓋全年齡學段和解題種類。
做 MathGPT,學而思憑什麽
學而思作爲獲國家科技部批準的 " 智慧教育國家新一代人工智能開放創新平台 " 建設單位,也是教育行業唯一一家人工智能 " 國家隊 " 成員,在人工智能領域有着多年的深入研究。
早在 2017 年,學而思便成立了 AI lab 人工智能實驗室。
據公開信息顯示,基于智慧教育人工智能開放創新平台助力,學而思 AI lab 獲得各類頂級學術會議比賽冠軍 16 項,亞軍 6 項;
發表國際期刊和會議高水平學術論文 31 篇,包含光學字符識别、圖像、自然語言處理、語音以及多模态等多領域的學術研究,在計算機視覺頂會以及自然語言頂會中均有多篇論文發表;
申請專利 220 餘項,授權專利 150 餘項,軟件著作權 60 餘項。
△學而思 AI lab 在各類頂級學術會議比賽獲獎情況
" 以數學起家 " 的學而思至今已有 20 年的數學教學經驗,積累了龐大的數學相關數據,這些數據是進行 MathGPT 訓練的必備物料。
另外,學而思的海外業務 Think Academy 在全球若幹國家和地區深受數學愛好者喜歡,學而思的學生在每年的 IMO 和 AMC 等國際數學競賽中表現優異,每年都有多位學生在國際奧林匹克數學競賽中拿到金牌。
所以,學而思選擇在 MathGPT 方向發力也順理成章。
今年 2 月,學而思學習機上線 AI 講題機器人小 π。
據了解,小 π 研發已有數年積累,研發方向主要爲數學等領域的 AI 智能講題能力,核心優勢在于數理邏輯和運算。
在實測中,當學而思學習機用戶配套的 AR 鏡識别到一道手寫或者印刷的數學計算題時,小 π 機器人會對題目進行智能 AI 拆解分析,同時生成邏輯流暢、表達清晰的語言,将題目的解題方法講解出來。
該功能已覆蓋的題目包括分數、小數等複雜計算,甚至一些 " 湊數、組合 " 的巧妙算法,已十分接近真人老師的解題效果。
△同一道數學題目在 ChatGPT ( 上 ) 和小 π(下)的解答對比
小 π 相關技術于 2020 年啓動研發,以學而思超 3 億的專業題庫數據作爲基礎,經過了 3 年的數據訓練和打磨叠代。
另據了解,學而思學習機近期将會上線一款 "AI 助手 ",涵蓋作文助手、口語助手、閱讀助手、數學助手等相關功能,該 AI 産品将于 5 月 11 日開啓内測。
MathGPT 的挑戰和技術難題
如何利用大語言模型服務各行各業是當下社會的焦點問題。
大模型的出現是對生産力和生産關系的改變,各行各業都會受到影響,并會在大模型的助力下完成轉型升級。
教育行業和大模型有着天然的契合點。教育也是通過交流,把知識和信息傳遞給學生,大模型會讓教育行業的數字化、智能化速度更快。
比如在教育領域,Duolingo、Quizlet、可汗學院等産品主要和 OpenAI 合作,在 GPT 大模型上做微調和接口調用,增強原有的産品體驗。
但也有一些領域如數學、醫學等,對 AI 的需求是準确、清晰、具備強大的邏輯推理能力,且容錯率低,通用 LLM 目前的性能表現還無法在上述領域取得突破,未來是否可能取得突破尚不清晰。
以數學領域爲例,目前市場上有幾個主要流派。
比如 Google 收購的 Photomath、微軟數學、Mathway、專注數學計算的 WolframAlpha 等産品,主要利用非 LLM 的傳統 AI 技術加上數據庫的方式解決數學問題。
走 AGI 路線的公司則嘗試讓通用 LLM" 更懂數學 ",比如 GPT4 在數學任務上比之前的 3.5 版本性能更好,谷歌旗下的 Minerva 模型也專門針對數學問題進行調優。
學而思選擇了另一條少有人走的路,不基于現有 LLM 做微調和接口調用、不做通用 LLM,而是自研基于專業領域的 " 數學大模型 "MathGPT,緻力于打造自主、穩定、可持續、高質量的學習解決方案。
學而思表示,喬布斯對電腦的定義是 " 思維的自行車 ",MathGPT 面向全球的數學愛好者,希望能成爲學習數學、思考數學的 " 自行車 ",幫助人們更好的解決學習數學、思考數學的問題。
長遠看來,數學思維代表着理性邏輯,是 " 思維的體操 ",是一種基礎能力,能夠與很多行業産生關聯。
未來,也許每個人都是程序員,用自然語言就可以編程,創新想法,與人協作,創造新事物,但是用自然語言編程的好壞很大程度取決于是否經過數學思維的訓練。我們希望通過 MathGPT,幫助每個人更好地建立理性邏輯,從而終身成長,推動社會進步。
在大語言模型不斷進化的浪潮下,不同的技術路線選擇孰優孰劣,仍有待讨論和驗證。
學而思自研獨立的 MathGPT 大模型是否成立,是否能夠超越通用模型在數學任務上的表現,是否更匹配不同人群的數學學習場景,這個問題還需要在創新實踐中尋找答案。
随着整個行業的深化發展和越來越多人才參與到這個領域,相信不久的将來就能看到更爲成熟的解決方案。
* 本文系量子位獲授權刊載,觀點僅爲作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追蹤 AI 技術和産品新動态
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~