ChatGPT 的迷人之處在于,它使得 OpenAI 變成消費 AI 産品的領銜者。
來源|多知網
作者 | 多知網
圖片來源 |Pexels
11 月 30 日, OpenAI 發布了 " 網紅 AI" 對話模型 ChatGPT。在過去的兩周,席卷了整個互聯網科技圈。
起因是美國人工智能公司 OpenAI 發布免費機器人對話模型 ChatGPT(GPT-3.5 系列),模型中首次采用 RLHF(從人類反饋中強化學習)方式。模型目前處于測試階段,用戶與 ChatGPT 之間的對話互動包括普通聊天、信息咨詢、撰寫詩詞作文、修改代碼等。
ChatGPT 功能看起來非常全面,被稱作 " 最強 AI(人工智能)",面世 5 天已有超過 100 萬用戶注冊。
ChatGPT 到底是怎麼回事?ChatGPT 的很多功能看似可以跟教育領域結合,未來是否可以落地呢?對此,多知網對話了好未來 AI 團隊負責人。
以下為對話實錄:
多知網:ChatGPT 的出現是否是 AI 技術一個質的突破?
好未來 AI 團隊負責人:ChatGPT 主要有兩個亮點:
1)ChatGPT 跟它的諸多前輩相比,針對用戶的提問已經可以做出讓人眼前一亮的回答,其中的部分回答是能夠實質性地幫到用戶。
比如,為打工人生成一份體面的周報;為程序員的代碼定位 bug,并給出修複建議等。
2)ChatGPT 的另一個亮點是它可以和用戶進行多輪對話,對話過程非常絲滑,這也是現有的聊天機器人做不到的。
與其他的使用大數據量訓練出來的大語言模型一樣,ChatGPT 同樣也是經過先預訓練,後微調的過程訓練得到的對話模型。模型的訓練采用強化學習 RLHF(從人類反饋中強化學習)方式進行訓練,但是 OpenAI 這次在數據收集策略上與以往的大模型不同。RLHF 的學習方式類似于 Google search 的人工反饋叠代機制,但是顯然這種更新方式長遠看更加直接有效。
首先,采用有監督學習訓練得到一個初始模型。人類、AI 培訓員分别作為用戶和 AI,模拟人類和 AI 之間的對話。
此外,還創建了一個 reward 模型,将機器生成的回複由人類培訓員進行篩選,按照質量排序,挑出質量最優的那個。
多知網:如何看待有關 ChatGPT 的讨論?它目前有哪些想象空間和不足?
好未來 AI 團隊負責人: ChatGPT 的問世,讓 AIGC ( AI-generated content,即 AI 生産内容) ) 再次火爆。僅 5 天時間,ChatGPT 就有 100 多萬用戶注冊。這些用戶紛紛在社交網絡等媒體上曬出 " 調戲 " 聊天機器人的互動,這已經成為了互聯網日常更新的熱梗,他們用它來寫 " 小學生 " 風格的作文、問奇怪的問題,這是在瘋狂探索它的功能 " 邊界 "。
但作為底層模型的 GPT-3,其實已經誕生兩年了,基于 GPT-3 的初創公司 Jasper 新獲得 1.25 億美元的融資,估值達到 15 億美元。與之不同的是,ChatGPT 既免費,又好用。AIGC 的革命早已掀起,當 AI 生成的藝術變得簡單、免費時,人類對此的興趣和意識也就出現了爆炸式的增長。
ChatGPT 是免費的,這很關鍵。ChatGPT 的迷人之處在于,它使得 OpenAI 變成消費 AI 産品的領銜者。另外,英語學習平台「Speak」獲 OpenAI 領投 2700 萬美元 B 輪融資,為對話式口語練習提供了新的想象空間。
關于 ChatGPT 的一些想象空間:
ChatGPT 的出現,基本宣布了人工智能的對話模型開始在大範圍、細粒度問題上給出普遍穩妥的答案,簡單地說,人工智能的大對話模型可以達到基本不犯錯誤的水平了。
現在,研究人員每天都在以飛速的方式向全世界提供着大量新功能,而企業和産品人員才剛剛開始消化這些新功能。
再往前想一步,當 AI 在現實世界中不再匮乏的時候,人類是否會被 AI 取代?
就像馬斯克說的那樣," 我們離強大到危險的 AI 不遠了 "。OpenAI 明年會推出更強大的 GPT-4 模型,據說可以通過圖靈測試。
多知網:ChatGPT 完美嗎?
好未來 AI 團隊負責人:答案當然是:不。
ChatGPT 有幾個緻命缺陷:
1)輸入不能有錯。
在使用 ChatGPT 時,必須要精确,哪怕是一個詞的改變,答案都會完全不同。當輸入問題,有時會得不到答案,修改輸入後,就會得到答案。
2)無法推理,也無法思考。
對此,OpenAI 坦承,由于 ChatGPT 學習到的知識隻來自訓練數據中的統計規律,而不是任何類似人類對世界複雜和抽象系統的理解,因此該系統可能偶爾會産生不正确或誤導性的信息,并可能産生攻擊性或有偏見的内容。
3)此外,該機器人對 2021 年之後的世界知識 " 有限 ",對于某些特定人群的問題也 " 知之甚少 "。(訓練數據截止到 2021 年)。
多知網:ChatGPT 未來有可能會開源使用嗎?中國大陸能夠使用嗎?
好未來 AI 團隊負責人:ChatGPT 的背後離不開大模型、大數據、大算力。ChatGPT 成為 AIGC 裡程碑的背後,是算力發展和數字時代形成的大數據所共同支持的大模型訓練,才能實現目前的效果。GPT 系列的大模型訓練基本已經形成了算力,數據,模型的壟斷趨勢。要知道,在 OpenAI 的 API 上,最大的限制因素就是成本。基于 OpenAI 的收費 API 構建的 GPT-3 系列應用在國外已經有 300+,國内無法訪問 OpenAI 的 GPT3 服務,目前中國大陸用戶無法注冊 ChatGPT 服務賬号,對于 OpenAI 将來的開源,持悲觀态度。
不過,Meta(原 Facebook)、Google 等将來是可能會開源同類型模型的。
多知網:如果能使用,ChatGPT 的一些技術是否可以應用在教育場景中?
好未來 AI 團隊負責人:個人認為,ChatGPT 可以應用在教育的一些場景。教育的場景是多元化的,有語文、曆史等文科,數理化等理科,編程、科學等素質教育學科。ChatGPT 在文科和素質學科場景下有着不錯的應用場景,例如語文中的作文素材生成、曆史事件的描述、編程的代碼示例等。然而,數理化這種需要嚴密的邏輯推理的學科,對對話的質量有着比較苛刻的要求,不然 ChatGPT 生成的内容會對學生的學習起到一定的反作用。近期,由于 ChatGPT 的低質量答案,已經遭 Stack Overflow 封禁。因此,在理科方面 ChatGPT 因為自身準确率的原因,發揮的空間不大。
目前,由于老師本身具體知識對錯的分辨能力,ChatGPT 可能對于老師的工作的效率有提升,特别在備課的素材整理環節,取其精華,去其糟粕。對于學生,個人能力的仍有限,ChatGPT 對其是把雙刃劍。
多知網:ChatGPT 是否有可能取代教育場景的某個場景?
好未來 AI 團隊負責人:以目前 ChatGPT 的能力,可以融入教育的一些場景,特别是學生的表達能力的鍛煉,例如低年級的寫作等。将 ChatGPT 與圖像、語音的能力結合,可以有更好的應用場景,例如口語表達能力練習,将 ChatGPT 于語音合成、語音評測結合,和學生展開多輪對話,并對發音和内容作出回饋和點評。
未來,随着技術的不斷突破,ChatGPT 的系列進階版本,完全可以進化成為一個學習中的助教角色,輔助學生方方面面的學習。
多知網:當前好未來 AI 技術的應用已經實現了哪些突破?
好未來 AI 團隊負責人:1)智慧教育 AI 開放平台已經形成,科技部 2030 重大專項中,智慧教育平台的建設已經形成。
2) 在線虛拟助教樣例
體驗鍊接:https://ai.100tal.com/virtual-assistant
多知網:如果 AI 在教育領域要有質的突破 需要邁過哪幾個檻?是數據?(有效、精準)還是其他?
好未來 AI 團隊負責人:AI 在教育領域要有質的突破,還需要邁過很多個門檻,算法、算力、數據都需要有若幹次突破才能達到所謂的質的突破。以算法為例,雖然目前 AI 算法在各個領域經常取得比較亮眼的結果,然而,更多的是大力出奇迹的結果,實質性的算法突破并未走向一條類似 " 摩爾定律 " 一樣的可預測持續提升軌道。像 ChatGPT 使用的 Transformer 是 2017 年提出的結構,經過了 5 年在各個領域遍地開花。單從序列長度視角來看,Transformer 擅長搞定 3 位數 token(0~999),至多 4 位數 token(0~9999),更高位數的顯然需要更多的技術突破。另外,目前 AI 算法僅僅是數據驅動的,是統計機器學習的分支,是歸納法的集大成者。内置演繹邏輯的 AI 模型,能夠進行類人推理的突破尚未出現。