圖片來源:視覺中國
ChatGPT 的爆火已經 " 燒 " 到了國内的教育培訓領域。
5 月 5 日,钛媒體 APP 從學而思方面了解到,學而思正在進行自研數學大模型的研發,命名爲 MathGPT,面向全球數學愛好者和科研機構,以數學領域的解題和講題算法爲核心,目前已經取得階段性成果,并将于年内推出基于該自研大模型的産品級應用。
學而思已将 MathGPT 作爲公司核心項目,由 CTO 田密負責。今年春節前,該項目已經啓動相應的團隊建設、數據、算力準備和技術研發。
此外,學而思已經啓動在美國矽谷的團隊建設,将成立一支海外算法和工程團隊,在全球範圍内招募優秀的人工智能專家加入。
之所以決心組建自研大模型團隊,學而思 AI 團隊負責人認爲,美國 OpenAI 公司在今年三月份發布了大語言模型 GPT-4,國内百度、阿裏也發布了各自的大模型産品,但通用語言模型更像一個 " 文科生 ",在語言翻譯、摘要、理解和生成等任務上有出色表現,但在數學問題的解決、講解、問答和推薦方面則存在明顯不足。
他們發現,這些大模型解答數學問題經常出錯,有些數學問題雖然能夠解決,但方法更偏成年人,無法針對适齡孩子的知識結構和認知水平做适配。
" 這種不足是由 LLM 模型的自身特點決定的。" 學而思 AI 團隊負責人介紹,LLM 大模型來自對海量語言文本的訓練,因此最擅長語言處理。行業内偏向基于 LLM 大模型做閱讀、寫作類應用,但如果想要在數學能力上有突破,就需要研發新的大模型。
因此,學而思決定以組建團隊專研 MathGPT ——數學領域大模型的方式,用自己在數學和 AI 上的多年積累,面向全球範圍内的數學愛好者和科研機構,做好 AI 大模型時代的數學基礎工作。
學而思希望通過 MathGPT 彌補和攻克大語言模型的三個問題:第一,題目要解對,現在 GPT 結果經常出現錯誤;第二,解題步驟要穩定、清晰,現在 GPT 的解題步驟每次都不一樣,而且生成内容經常很冗餘;第三,解題要講的有趣、個性化,現在 GPT 的解釋過于 " 學術 " 和機械,對孩子的學習體驗很不友好。
作爲在 AI 領域布局較早的教育培訓公司,钛媒體 APP 了解到,在 2017 年,學而思成立了 AI lab 人工智能實驗室。
以數學課外輔導起家的學而思,已經積累了 20 年的數學教學經驗,積累了龐大的數學相關數據,這些數據是進行 MathGPT 訓練的必備物料。
此外,學而思方面認爲,海外業務 Think Academy 在全球若幹國家和地區受到數學愛好者喜歡,學而思的學生在每年的 IMO 和 AMC 等國際數學競賽中表現優異,每年都有多位學生在國際奧林匹克數學競賽中拿到金牌。
另據钛媒體 APP 了解,學而思學習機近期将會上線一款 "AI 助手 ",涵蓋作文助手、口語助手、閱讀助手、數學助手等相關功能,該 AI 産品将于 5 月 11 日開啓内測。
在教育領域,當前選擇擁抱大模型的主要有,Duolingo、Quizlet、可汗學院等平台,選擇了與 OpenAI 合作,在 GPT 大模型上做微調和接口調用,增強原有的産品體驗。
在數學領域,Google 收購的 Photomath、微軟數學、Mathway、專注數學計算的 WolframAlpha 等産品,主要利用非 LLM 的傳統 AI 技術加上數據庫的方式解決數學問題。走 AGI 路線的公司,則嘗試讓通用 LLM" 更懂數學 ",比如,GPT4 在數學任務上比之前的 3.5 版本性能更好,谷歌旗下的 Minerva 模型也專門針對數學問題進行調優。
事實上,在國内,不隻是學而思,網易有道也有計劃大模型落地至教育場景。其類 ChatGPT 模型也将于近期推出,模型名字确定爲 " 子曰 "。基于 " 子曰 " 研發的 AI 口語老師和中文作文批改 DEMO 已完成,近期開放内測。
就在今日晚間,在學而思發布消息的同時,易有道官方也發布了基于 " 子曰 " 大模型開發的 AI 口語老師劇透視頻。
(本文首發钛媒體 APP,作者|李程程)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App