對話好未來AI團隊負責人：刷屏全網的Chat GPT可以和教育擦出什麼火花？

ChatGPT 的迷人之處在于，它使得 OpenAI 變成消費 AI 産品的領銜者。

來源|多知網

作者 | 多知網

圖片來源 |Pexels

11 月 30 日， OpenAI 發布了 " 網紅 AI" 對話模型 ChatGPT。在過去的兩周，席卷了整個互聯網科技圈。

起因是美國人工智能公司 OpenAI 發布免費機器人對話模型 ChatGPT（GPT-3.5 系列），模型中首次采用 RLHF（從人類反饋中強化學習）方式。模型目前處于測試階段，用戶與 ChatGPT 之間的對話互動包括普通聊天、信息咨詢、撰寫詩詞作文、修改代碼等。

ChatGPT 功能看起來非常全面，被稱作 " 最強 AI（人工智能）"，面世 5 天已有超過 100 萬用戶注冊。

ChatGPT 到底是怎麼回事？ChatGPT 的很多功能看似可以跟教育領域結合，未來是否可以落地呢？對此，多知網對話了好未來 AI 團隊負責人。

以下為對話實錄：

多知網：ChatGPT 的出現是否是 AI 技術一個質的突破？

好未來 AI 團隊負責人：ChatGPT 主要有兩個亮點：

1）ChatGPT 跟它的諸多前輩相比，針對用戶的提問已經可以做出讓人眼前一亮的回答，其中的部分回答是能夠實質性地幫到用戶。

比如，為打工人生成一份體面的周報；為程序員的代碼定位 bug，并給出修複建議等。

2）ChatGPT 的另一個亮點是它可以和用戶進行多輪對話，對話過程非常絲滑，這也是現有的聊天機器人做不到的。

與其他的使用大數據量訓練出來的大語言模型一樣，ChatGPT 同樣也是經過先預訓練，後微調的過程訓練得到的對話模型。模型的訓練采用強化學習 RLHF（從人類反饋中強化學習）方式進行訓練，但是 OpenAI 這次在數據收集策略上與以往的大模型不同。RLHF 的學習方式類似于 Google search 的人工反饋叠代機制，但是顯然這種更新方式長遠看更加直接有效。

首先，采用有監督學習訓練得到一個初始模型。人類、AI 培訓員分别作為用戶和 AI，模拟人類和 AI 之間的對話。

此外，還創建了一個 reward 模型，将機器生成的回複由人類培訓員進行篩選，按照質量排序，挑出質量最優的那個。

多知網：如何看待有關 ChatGPT 的讨論？它目前有哪些想象空間和不足？

好未來 AI 團隊負責人： ChatGPT 的問世，讓 AIGC ( AI-generated content，即 AI 生産内容） ) 再次火爆。僅 5 天時間，ChatGPT 就有 100 多萬用戶注冊。這些用戶紛紛在社交網絡等媒體上曬出 " 調戲 " 聊天機器人的互動，這已經成為了互聯網日常更新的熱梗，他們用它來寫 " 小學生 " 風格的作文、問奇怪的問題，這是在瘋狂探索它的功能 " 邊界 "。

但作為底層模型的 GPT-3，其實已經誕生兩年了，基于 GPT-3 的初創公司 Jasper 新獲得 1.25 億美元的融資，估值達到 15 億美元。與之不同的是，ChatGPT 既免費，又好用。AIGC 的革命早已掀起，當 AI 生成的藝術變得簡單、免費時，人類對此的興趣和意識也就出現了爆炸式的增長。

ChatGPT 是免費的，這很關鍵。ChatGPT 的迷人之處在于，它使得 OpenAI 變成消費 AI 産品的領銜者。另外，英語學習平台「Speak」獲 OpenAI 領投 2700 萬美元 B 輪融資，為對話式口語練習提供了新的想象空間。

關于 ChatGPT 的一些想象空間：

ChatGPT 的出現，基本宣布了人工智能的對話模型開始在大範圍、細粒度問題上給出普遍穩妥的答案，簡單地說，人工智能的大對話模型可以達到基本不犯錯誤的水平了。

現在，研究人員每天都在以飛速的方式向全世界提供着大量新功能，而企業和産品人員才剛剛開始消化這些新功能。

再往前想一步，當 AI 在現實世界中不再匮乏的時候，人類是否會被 AI 取代？

就像馬斯克說的那樣，" 我們離強大到危險的 AI 不遠了 "。OpenAI 明年會推出更強大的 GPT-4 模型，據說可以通過圖靈測試。

多知網：ChatGPT 完美嗎？

好未來 AI 團隊負責人：答案當然是：不。

ChatGPT 有幾個緻命缺陷：

1）輸入不能有錯。

在使用 ChatGPT 時，必須要精确，哪怕是一個詞的改變，答案都會完全不同。當輸入問題，有時會得不到答案，修改輸入後，就會得到答案。

2）無法推理，也無法思考。

對此，OpenAI 坦承，由于 ChatGPT 學習到的知識隻來自訓練數據中的統計規律，而不是任何類似人類對世界複雜和抽象系統的理解，因此該系統可能偶爾會産生不正确或誤導性的信息，并可能産生攻擊性或有偏見的内容。

3）此外，該機器人對 2021 年之後的世界知識 " 有限 "，對于某些特定人群的問題也 " 知之甚少 "。（訓練數據截止到 2021 年）。

多知網：ChatGPT 未來有可能會開源使用嗎？中國大陸能夠使用嗎？

好未來 AI 團隊負責人：ChatGPT 的背後離不開大模型、大數據、大算力。ChatGPT 成為 AIGC 裡程碑的背後，是算力發展和數字時代形成的大數據所共同支持的大模型訓練，才能實現目前的效果。GPT 系列的大模型訓練基本已經形成了算力，數據，模型的壟斷趨勢。要知道，在 OpenAI 的 API 上，最大的限制因素就是成本。基于 OpenAI 的收費 API 構建的 GPT-3 系列應用在國外已經有 300+，國内無法訪問 OpenAI 的 GPT3 服務，目前中國大陸用戶無法注冊 ChatGPT 服務賬号，對于 OpenAI 将來的開源，持悲觀态度。

不過，Meta（原 Facebook）、Google 等将來是可能會開源同類型模型的。

多知網：如果能使用，ChatGPT 的一些技術是否可以應用在教育場景中？

好未來 AI 團隊負責人：個人認為，ChatGPT 可以應用在教育的一些場景。教育的場景是多元化的，有語文、曆史等文科，數理化等理科，編程、科學等素質教育學科。ChatGPT 在文科和素質學科場景下有着不錯的應用場景，例如語文中的作文素材生成、曆史事件的描述、編程的代碼示例等。然而，數理化這種需要嚴密的邏輯推理的學科，對對話的質量有着比較苛刻的要求，不然 ChatGPT 生成的内容會對學生的學習起到一定的反作用。近期，由于 ChatGPT 的低質量答案，已經遭 Stack Overflow 封禁。因此，在理科方面 ChatGPT 因為自身準确率的原因，發揮的空間不大。

目前，由于老師本身具體知識對錯的分辨能力，ChatGPT 可能對于老師的工作的效率有提升，特别在備課的素材整理環節，取其精華，去其糟粕。對于學生，個人能力的仍有限，ChatGPT 對其是把雙刃劍。

多知網：ChatGPT 是否有可能取代教育場景的某個場景？

好未來 AI 團隊負責人：以目前 ChatGPT 的能力，可以融入教育的一些場景，特别是學生的表達能力的鍛煉，例如低年級的寫作等。将 ChatGPT 與圖像、語音的能力結合，可以有更好的應用場景，例如口語表達能力練習，将 ChatGPT 于語音合成、語音評測結合，和學生展開多輪對話，并對發音和内容作出回饋和點評。

未來，随着技術的不斷突破，ChatGPT 的系列進階版本，完全可以進化成為一個學習中的助教角色，輔助學生方方面面的學習。

多知網：當前好未來 AI 技術的應用已經實現了哪些突破？

好未來 AI 團隊負責人：1）智慧教育 AI 開放平台已經形成，科技部 2030 重大專項中，智慧教育平台的建設已經形成。

2）在線虛拟助教樣例

體驗鍊接：https://ai.100tal.com/virtual-assistant

多知網：如果 AI 在教育領域要有質的突破需要邁過哪幾個檻？是數據？（有效、精準）還是其他？

好未來 AI 團隊負責人：AI 在教育領域要有質的突破，還需要邁過很多個門檻，算法、算力、數據都需要有若幹次突破才能達到所謂的質的突破。以算法為例，雖然目前 AI 算法在各個領域經常取得比較亮眼的結果，然而，更多的是大力出奇迹的結果，實質性的算法突破并未走向一條類似 " 摩爾定律 " 一樣的可預測持續提升軌道。像 ChatGPT 使用的 Transformer 是 2017 年提出的結構，經過了 5 年在各個領域遍地開花。單從序列長度視角來看，Transformer 擅長搞定 3 位數 token（0~999），至多 4 位數 token（0~9999），更高位數的顯然需要更多的技術突破。另外，目前 AI 算法僅僅是數據驅動的，是統計機器學習的分支，是歸納法的集大成者。内置演繹邏輯的 AI 模型，能夠進行類人推理的突破尚未出現。