221 世紀經濟報道記者王峰 北京報道 教育大模型時代徹底來臨了?
近日,新東方發布新東方在線 App 鴻蒙原生版,同時上線加載大模型技術的考研智能學習系統 " 慧學系統 "。至此,國内市值超百億的教育公司已悉數發布大模型産品。市值最大、目前已超 800 億元的新東方是最後發布的公司。
比新東方姗姗來遲更值得關注的是,其首發的大模型産品來自考研業務,而非行業應用更普遍的 K12 業務。新東方考研業務爲何成爲大模型應用的試水者?
對于行業來說,新東方的加入讓技術應用趨勢更加明顯。雖然教育大模型時代已然來臨,但仍處于起步階段,接下來如何發展還要邁過幾道坎。
上線自動批改和命題功能
新東方并不被認爲是一家技術引領型公司,如今擁抱大模型技術,其實已經落後于行業。
早在 2023 年 7 月,網易有道就發布了國内首個教育大模型 " 子曰 "。此後,作業幫、好未來、希沃、猿輔導都發布了自研大模型,有的還研發了不止一套模型。國内市值超百億的教育公司中,中公教育、豆神教育、華圖教育都發布了大模型産品。高途、粉筆、學大教育、松鼠 Ai 等市值不足百億的頭部公司都已應用了大模型。
新東方其實也已在業務中應用了大模型技術。在今年 4 月的阿裏雲 AI 智領者峰會上,新東方大學事業部 P 端産品負責人張辰介紹,新東方應用大模型技術分析學員與老師的溝通内容,進而提出溝通改進建議,提升學員滿意度;應用大模型技術分析課程和學習資料,進而拆解、分析知識結構,提升學員上課效率。
總體上,這一階段的探索是将大模型技術用于公司内部生産流程,以提高效率。現在,慧學系統則提供了面向學員的新功能。
首先是自動批改。據介紹,慧學系統的 AI 批改功能支持考研全部科目的客觀題以及英語的主觀題,特别是作文批改。
寫作是學生提升成績的重要單項,批改作文也就成了考生在備考時的集中需求。老師批改作文的速度與質量直接影響學生的滿意度。
新東方大學生學習與發展中心在線國内事業部總經理洪喆介紹,過去,老師批改完一張模考試卷大約需要 10 分鍾,現在人機協作僅需約 2 分鍾就能完成。
其次是自動命題。考研的真題數量較少,但考生又需要大量練習和模拟考試。大模型技術可以根據學科核心知識點和考察難度自動生成模拟題。
以題庫較少的西醫綜合必考科目爲例,新東方第一批次就直接生成 4000 道題,匹配到整個科目 6000 個核心知識點。
這項技術的挑戰在于如何平衡自動命題的準确性和适用性,即不能爲了追求題目的準确性而生成大量的 " 水題 "。
洪喆表示,這要求教師在系統中提前錄入經過标注和分層的知識點,從而讓系統在自動命題時能夠動态匹配不同方面、不同難度的知識點。
爲何首先落地考研業務
新東方爲何在考研業務中率先落地大模型産品?
首先,這與新東方的内部業務結構有關。新東方主要教育業務中,非學科類培訓業務學員人數衆多,截至今年 8 月 31 日的最新财季報名人數約 48.4 萬人。但非學科類培訓業務還處在發展早期,品類較多且差異較大,對于 AI 技術的規模化應用有一定障礙。出國考試準備業務也是一項重要業務,但托福、雅思等考試的練習、測試等資源已經較爲成熟和豐富。
考研業務同樣體量龐大,新東方大學生學習與發展中心考研項目總監李琳介紹,今年新東方考研業務學員人數超 40 萬人次,這幾乎接近 2025 年全國考研報名人數的十分之一。如此龐大的用戶規模,給大模型技術提供了應用場景。
其次,這與新東方考研用戶需求有關。李琳介紹,近年來新東方考研用戶多樣化特征明顯,除了應屆高校畢業生之外,往屆畢業生、在職人群顯著增加。" 在職人群已占新東方考研業務用戶的 20%。" 李琳告訴 21 世紀經濟報道記者。用戶畫像能繼續細分,比如在職人群中還可以細分出 " 寶媽 " 群體、多次考研群體等。
複雜的用戶群體帶來了複雜的用戶需求,學員的學業基礎、學習習慣、日程安排差異很大,勢必需要借助 AI 技術提供定制化、個性化服務。
第三,這與考研培訓行業的外部競争有關。近年來,考研培訓市場格局發生激烈變動。李琳認爲,以前的考研培訓市場呈倒三角形,全國性的大型機構所占市場份額較大,現在則呈現梯形,腰部機構增長勢頭良好。
所謂 " 腰部機構 ",是指在考研細分領域表現出色的中小型機構。比如,有的機構聚焦于藝術類、MBA 考研培訓,用戶人數不多,但年收入可達上億元。甚至有小型培訓機構專門針對報考某一所高校研究生的考生開展培訓。
這類機構在品牌影響力、抗風險能力等方面難以與大機構匹敵,但主打垂直領域的差異化優勢。大機構在垂直領域服務方面,也需要借助 AI 技術提供定制化、個性化服務。
新東方選擇從考研這個細分業務開始應用大模型技術,其實是行業趨勢。可資比較的是公考培訓行業,粉筆、華圖教育、中公教育三大巨頭都發布了大模型産品,但應用場景各不相同。粉筆側重于題目答疑和輔導、華圖教育專注于面試環節輔導、中公教育則将大模型與數字人技術結合用于教學輔助。
一位教育行業人士告訴 21 世紀經濟報道記者," 對于大模型的教育應用,越垂直可能越專業,效率就越高。"
" 模型即應用 " 是必然方向
對于教育行業來說,随着頭部公司悉數落地大模型産品,教育大模型的發展路線愈益清晰。
近日,在 2024 人工智能大模型産業大會上,中國企業評價協會與中關村數智人工智能産業聯盟聯合發布了《2024 中國大模型企業 TOP50 發展報告》。其中,希沃大模型和學而思九章大模型兩個教育大模型進入 TOP50。
該報告指出,大模型的技術水平正從千億參數向萬億參數邁進。目前,參數規模超過 1000 億的企業數量達到 25 家,超過萬億參數的企業有 7 家。
教育大模型的參數水平難以與已邁上萬億級别的通用大模型相比,這意味着 " 模型即應用 " 是教育大模型的必然方向。
" 大多數教育公司不需要去開發基座模型,就好像教育公司沒必要去自研雲服務一樣,這種标準化的基座服務未來隻需要向少數科技巨頭購買即可,教育公司要做的是在基座之上調适、應用自己的數據。" 上述教育行業人士說。
對于教育公司來說,未來 " 模型即應用 " 的發展仍要邁過幾道坎。
首先是選擇生态。" 英偉達在人工智能芯片市場的市場份額高達 80%,重要原因在于英偉達開發了基于 GPU 的通用并行計算平台和編程模型 CUDA,從而構建起英偉達軟件生态的基座。" 上述教育行業人士說。
值得注意的是,新東方考研大模型産品首先在鴻蒙系統中落地。原因是多方面的,包括新東方很早就開始在鴻蒙生态中投入研發,新東方旗下的智慧教育業務還基于開源鴻蒙開發了産品線,以及越來越多的新東方考研學員反饋已将手機遷移至鴻蒙系統等。
但目前,鴻蒙生态仍處于發展早期。新東方要想面向更大規模的用戶推廣大模型産品,還需要将産品覆蓋到體量更大的安卓等生态。
至于更直接相關的大模型生态,未來誰能勝出,成爲應用最廣泛的基座模型,還遠未見分曉。
其次是降低成本。" 模型即應用 " 的商業模式已經在教育領域跑通,比如開展會員制訂閱服務等,但投入産出之間的平衡仍需摸索。
以考研爲例,這是一個每年隻有約 300 億元規模的小市場。第三方調研顯示,願意承擔 5000 元以上客單價消費的用戶不足 20%。疊加消費能力下降、考研報名人數減少等因素,教育公司在大模型産品研發、上線時,需要慎重考慮成本與收益。
上述教育行業人士認爲,這在今後的發展中會形成越來越強的張力。一方面,出于成本和實際應用效果考慮,低成本、應用成熟技術路線的大模型産品能夠實現降本增效,輔助教學;但另一方面,大模型技術被認爲能帶來颠覆現行教育模式的重要變革,在這個過程中,可能要不斷用新技術取代現行技術,這不僅需要超前投入,還有可能産生浪費,但卻是發展過程中必經的階段。