圖片來源 @視覺中國
文 | 來咖智庫,作者 | 追辛,編輯 | G3007
從商業化的角度考量,由于訓練數據的不同、算法的不同、法律規範的不同等原因,國内再去做 ChatGPT 一樣的産品是比較難的,但垂直類的行業大模型方面,卻有着更多發散性的機會。此前,業内就曾預計,未來通用大模型最終隻會留存 2-3 家,但是垂類大模型會百花齊放,豐富的行業場景才是 ChatGPT 最大的看點。目前,多家教育公司紛紛發布了最新的教育類大模型産品,而教育成爲 AI 落地最快的場景之一。我們認爲,教育的行業大模型有三大看點:
1、 " 教育是 ChatGPT 最容易落地的領域 " 一語成谶。
2、 在教育行業搶跑大模型的同時,我們也發現了一個新問題:那就是企業涉足大模型業務,到底是采用自研先行一步,還是等成熟後打通接口進行外采?從這國内第一波 " 百模大戰 " 來看,大廠們基本上都選擇了自研的路徑。
3、 ChatGPT 風口之下,教育科技存在無限可能。
今天,2023 年全國高考正式拉開大幕。而國内大模型的這場 " 高考備戰 ",逐漸進入到了 " 垂類競逐 ",教育行業已然搶跑。
近一個月來,網易有道、學而思、科大訊飛先後發布了最新的教育類大模型産品。其中有道是基于 " 子曰 " 大模型開發的 AI 口語老師,學而思官宣數學大模型 MathGPT 的研發,而科大訊飛是基于星火認知大模型推出的 AI 學習機。最新的消息顯示,猿輔導以推出智能硬件——小猿學練機的方式涉足大模型,而作業幫也正在内測基于中國市場的教育大模型,涉及工具類 App、智能硬件、圖書等業務。
正如 OpenAI 聯合創始人山姆 · 阿爾特曼曾表示,在 ChatGPT 支持下,會誕生極好的文案業務、教育服務或者其它公司。今天高考命題作文發布之後,就有不少人嘗試用 AI 來寫高考作文。
那麽,在這場百模大戰的 " 高考沖刺 " 中,教育類企業率先交卷的背後,又有哪些看點?
看點一:" 教育是 ChatGPT 最容易落地的領域 "一語成谶
自 ChatGPT 發布以來,AI 大模型領域熱度持續。今年來,國内各大互聯網、人工智能公司甚至學界都接連宣布進軍大模型領域。目前,百度、阿裏巴巴、商湯科技等公司已相繼發布了自己的大模型以及應用場景,但不論是百度的 " 文心一言 "、阿裏的 " 通義千問 "、商湯的 " 商量 ",還是複旦大學研發的大模型 moss,這些都屬于對話式的通用大模型産品,截至目前都還未開放使用。
相比于通用大模型的高舉高打,一些垂類大模型則選擇小步快跑、加速落地,比如 " 教育是 ChatGPT 最容易落地的領域 " 就成爲年初以來熱議的話題。今年 2 月,網易有道、科大訊飛、學而思以及作業幫等一衆教育類公司均透露了 ChatGPT 相關的産品及技術布局,而最近,這些公司也公布了最新的研發進度和成果。
據媒體報道,5 月 5 日,網易有道展示了基于 " 子曰 " 大模型研發的 AI 口語老師視頻,AI 口語老師能提供多種練習場景,同時會根據用戶需求扮演多種角色,進而引導用戶進行多輪對話。随後的 5 月 6 日,科大訊飛發布訊飛星火大模型,并會落地在教育類智能硬件 AI 學習機等産品中。另外,學而思也宣布自研數學大模型名爲 MathGPT,作業幫則傳出正在内測基于中國市場的教育大模型,包含多學科解題、中英文作文批改、多語言對話方向等多個教育應用場景。
當前 " 百模大戰 " 激戰正酣,并且掀起新一輪創業融資熱潮的同時,爲什麽此次教育行業統一搶跑呢?來咖智庫認爲主要有三點:
其一、從教育的目的來看,教育本身是人類獲取和學習知識的重要方式,而技術的進步能夠大大提升這種學習的效率。教育領域需要大量的知識儲備和傳遞,而 ChatGPT 作爲一個人工智能模型,可以快速地處理和整合這些信息,同時通過大量數據的訓練和學習,積累大量的知識和語言表達能力,最終實現對外的輸出。
這就像我們獲取知識方式的升級叠代。早期 1.0 階段,我們主要是通過閱讀和教師的講授,而 2.0 的互聯網階段,帶我們進入了信息爆炸的時代,現在以 ChatGPT 爲代表的 3.0 橫空出世,讓信息和知識的獲取更高效。從被動灌輸到主動獲取,再到精準互動,ChatGPT 在教育領域的有着更實際的剛需。
其二、從教育的特點來看,教育本身具有很強的交互性,需要在這個過程中完成傳道、授業和解惑。ChatGPT 可以提供更加自然的交流體驗,例如語音交互、圖像識别等,可以幫助學生更好地理解和記憶知識。比如 AI 口語老師,ChatGPT 可以利用其自然語言處理能力和深度學習算法,分析學生的發音、語調、語速、語音流暢度等方面的問題,提供針對性的建議和訓練,幫助學生提高口語水平。而在中文作文批改上,ChatGPT 也可以分析學生的作文内容、語言表達、語法結構等方面的問題,并且提出針對性的建議和指導。
基于這樣的行業屬性,ChatGPT 與教育有着更強的匹配度。比如有道發布的 "AI 口語老師 ",從實際的發音體驗上,已經不是以往那種 AI 單調的機械發音,而更像是一位真實的 " 老師 " 在與學生對話,對話體驗真實有趣。當然,ChatGPT 在 AI 口語老師和中文作文批改的應用上,其準确性和可靠性仍然還需要不斷地提高和優化。
其三、從教育的發展階段來看,随着國内教育行業逐漸步入智能學習以及教育數字化的時代,教育類公司也需要找到新的奇點,而 ChatGPT 正是其中的突破口。尤其是以人工智能、大數據、5G 等新一代信息技術爲驅動力,推動關鍵技術和教育場景的不斷融合及智能教育的深化發展,在線教育、AI 教育、個性化教育進一步得到普及,這也是各大教育公司加大投入布局的重要原因。
值得注意的是,在國外,ChatGPT 已經開始重塑教育行業。根據國外 Study.com 的調查,國外已經有 21% 的老師開始用 ChatGPT 輔助教學工作了。最近美國教培上市公司 Chegg 也表示,在今年 4 月推出輔助學習平台 CheggMateAI 後,已經影響到其原有業務的用戶增長,因爲學生對 ChatGPT 興趣大增,不再需要通過 Chegg 獲取相關學習資料。
看點二:自研先行還是外采以待?大模型的新命題
在教育行業搶跑大模型的同時,我們也發現了一個新問題:那就是企業涉足大模型業務,到底是采用自研先行一步,還是等成熟後打通接口進行外采了?
此前,就有不少網友質疑,一些公司蹭着熱點率先上線的自有大模型,其實都是基于 OpenAI 發布的 GPT 的基礎上推出的,其自研程度存在很大的水分。有知乎網友直言:國内某團隊上線的服務似乎是直接大量使用了 ChatGPT 的問答數據來訓練自己的網絡,輸入問題和通過 ChatGPT 得到的回答高度相似。
而在外采模式上,國外的 ChatGPT 已經明确指向 API、訂閱制和戰略合作(嵌入微軟 Bing、Office 等軟件)三種方式。比如在教育領域,Duolingo、Quizlet、可汗學院等産品主要和 OpenAI 合作,在 GPT 大模型上做微調和接口調用,增強原有的産品體驗。
從這國内第一波 " 百模大戰 " 來看,大廠們基本上都選擇了自研的路徑。
對于中國公司都選擇自研類 ChatGPT 的産品和技術這個問題,星圖比特創始人張炯曾分析表示有三個方面的原因:第一是市場端,目前 ChatGPT 對國内用戶是不開放的,國内的用戶沒法像海外用戶一樣随心所欲的使用,而從市場層面必然會有一個中國的 ChatGPT 出現;第二是技術端,目前市場上可見的大模型,例如 ChatGPT 的基礎模型 GPT-3.5 基本都是英語爲母語訓練的,中文基準的自然語言處理的效果還是稍遜于英語基準的,所以有個中文基準的模型出現會進一步提升用戶效果;第三是數據安全,AI 的内容生成本身是基于大量數據訓練的結果,并 OpenAI 已經逐步從一個公益性的項目向市場化轉變,未來出于利益等因素可能存在不确定性,還有就是中國大陸要求所有的數據都是本地化保存,這點 OpenAI 在國内又沒有團隊,數據的本地化保存和維護就很難達到監管要求。
自研是好,但要做到卻并不容易。一般來說,通用人工智能的研發需要持續的資金與頂級人才投入,而且受限于算力、數據規格、曆史投入、頂尖人才、資金實力等方面的要求。據 Business Insider 估算,目前 ChatGPT 一個月的維護成本在 300 萬美元,考慮到人力成本,費用估計還要加倍。OpenAI 的産品用的是微軟的 Azure 企業雲服務器,有投行分析員估算,一年的成本可能從 2500 萬美元到 10 億美元。與此同時,人工智能還面臨着投入周期長、産出時間慢的問題,比如 OpenAI 從公司成立到推出 ChatGPT,其間整整花了 7 年時間。
而和通用型人工智能相比,基于自身在專業領域的積累,垂類人工智能或許可以跑得更快。此次的科大訊飛和有道,就在教育行業的 AIGC 技術自研路徑上率先落地,也印證了那句 " 沒有金鋼鑽,别攬瓷器活 " 的諺語。
比如,此前科大訊飛研究院院長劉聰就表示,訊飛基于多年來在深度學習算法、大模型技術、行業大數據、知識圖譜、多模态感知、系統工程等技術方面的深厚積累,同時依托于國家新一代人工智能開放創新平台、認知智能全國重點實驗室、語言及語音信息處理國家工程研究中心三大國家級平台,已具備認知智能大模型綜合研發和長期持續突破的底氣和能力。
對有道來說,同樣如此。一方面是有道已經覆蓋了從兒童到少年再到成人教育的終身學習内容,有足夠多的學習素材和用戶數據;另一方面在于有道本身在 AI 技術和應用的積累,比如擁有神經網絡翻譯引擎、計算機視覺、智能語音 AI 技術和高性能計算這四大核心技術,應用範圍覆蓋翻譯、教育、語音助理、寫作等多個領域,并且已搭載在有道詞典筆、學習機等明星産品上。
還有學而思,其是以數學課外輔導起家的,已經積累了 20 年的數學教學經驗,積累了龐大的數學相關數據,這些數據是進行 MathGPT 訓練的必備物料。還有猿輔導,早在 2014 年就成立了涵蓋視覺實驗室、自然語言理解實驗室、語音實驗室、音視頻實驗室和基礎支撐五個實驗室的 AI 研究院,這也爲其提供了足夠的技術支撐。
整體來看,自研和外采都各有優劣。對選擇自研路線的企業來說,其最大的優勢在于 " 量身定制 ",能夠最大程度滿足和匹配自身業務的需求,但也要求企業擁有足夠強的綜合實力和積累,同時還得承擔一定的試錯成本,這不是一般小企業能玩得起的。而選擇外采的企業,其優勢在于成本低、選擇多,但劣勢在于特殊性需求不夠靈活、不夠定制,可能等自己用上了,同行已經領先一大截了。
可以說,在大語言模型不斷進化的浪潮下,不同的技術路線、不同的的應用方式的選擇孰優孰劣,目前仍有待讨論和驗證,還需要在實踐中尋找答案。
看點三:ChatGPT 風口之下,教育科技的無限可能
目前來看,ChatGPT 等相關技術在教育領域的應用,主要集中在中英語口語和作文輔導上。這與 ChatGPT 背後基于海量數據生成的 AI 大模型息息相關,它把能獲取的人類書籍、學術論文、新聞、高質量的各種信息作爲學習内容,并根據人類反饋強化學習。該技術的突破也使得 ChatGPT 的對話更貼近人類,語段間邏輯關聯度顯著提升。
而且現階段的 ChatGPT,還是被限制了實時更新數據能力的,顯然還封印了很多可回答問題的領域和規模,随着技術的叠代更新,未來還有着更多的可能,這也給國内的 ChatGPT 提供了新的市場空間。
在教育領域,除了具體的學科練習和知識問答,ChatGPT 還可以幫助學生和教師實現更加個性化、高效和智能化的學習和教學模式,包括智能輔導、智能答題系統、語言學習、聊天機器人、智能導師等應用場景上。
比如,在教學過程中,老師往往會面臨跨學科教學,學生的一些問題也需要老師長時間思考才能解答,但如果使用 ChatGPT,它就可以第一時間爲學生提供快速簡便的問題答案,可以對學習成果進行互動式的 " 檢驗 ",在線提問,或是随堂小測之類的,通過用戶的反饋來評估學習效果,并進一步制定學習計劃;同時,一些重複性的問題,ChatGPT 就可以直接代替老師回答,節省了老師大量的時間,讓老師在思想創造力上發揮更大價值。
另外,ChatGPT 的應用還可以促進教育創新。傳統的教育模式往往是由教師單向傳授知識,而 ChatGPT 則可以與學生進行互動,激發學生的學習興趣,培養學生的自主學習能力。此外,ChatGPT 還可以利用數據分析和人工智能技術,爲教師提供更加全面、準确的學生評估服務。這樣一來,教育可以更加科學地進行,學生的學習效果也可以更加明顯地提高。
值得注意的是,通過這種持續的模型訓練,ChatGPT 還能和其他的教育培訓來整合在一起的,無論是學前教育、職業教育、考證還是培訓,這個模型都能夠幫助他們把培訓做得更好,把效率做的更高。
總之,以 ChatGPT 爲代表的教育科技應用,對于個性化教育、教育公平和教育創新都具有重要的意義。在未來,可以期待 ChatGPT 在教育領域的廣泛應用,爲學生提供更加智能化、便捷化、個性化的教育服務,同時也爲農村地區的學生帶來更加公平、便捷的學習機會,逐漸消除這種教育的 " 數字鴻溝 "。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App