ChatGPT 爆火,吹起了大模型、AIGC 的風口,但伴随着興奮而來的,還有普遍的焦慮:
大模型時代,我們究竟應該做些什麽?
我想現在,一是要看到未來 AGI 的絕對趨勢;二是要找到自己的長處,腳踏實地去做;三是要營造一個好的生态環境,大家多交流、互相成就。
這就是面對如此 " 焦慮 ",世界頂級 AI 科學家、曾任 ACL 主席的周明,在首屆中國 AIGC 産業峰會現場給出的最新觀點。
2021 年 6 月,周明成立瀾舟科技,這是一家以 NLP 技術爲基礎的認知智能公司。同年,瀾舟科技的 " 孟子 " 模型以 10 億參數 " 四兩撥千斤 ",登頂中文語言理解權威評測基準 CLUE。
當 ChatGPT 的大潮來襲,作爲國内最先一批有準備的人,周明認爲,與此前的大模型不同:
首先,ChatGPT 對用戶的意圖理解非常清晰,也更加準确。
其次,多輪對話的建模非常好,還有若幹解析能力。
但同時,站在工業界角度,很多需要解析能力的任務,用單獨的引擎能達到比 ChatGPT 更好的效果。
所以,找到 ChatGPT 的應用場景非常關鍵。
基于這樣的思考,周明博士站在 To B 角度,分享了對 AI 2.0 時代進行數智化轉型的看法,從自身角度解答了 " 怎麽用 ChatGPT"、" 我們應該做什麽 " 的問題。
爲了分享周明博士的更多精彩觀點,量子位在不改變原意的基礎上,對他的演講内容進行了編輯整理,以飨讀者。
演講要點
大模型時代,新的 AI 中台正在出現。
ChatGPT 對用戶的意圖理解更加清晰準确,多輪對話的建模顯現若幹解析能力。
對于企業而言,并不是必須用 AI 2.0、一定要抛棄 AI 1.0。
OpenAI 和微軟做對了什麽?一是看到未來,二是發揮所長,三是互相成就。
(以下爲周明演講全文)
AI 2.0 時代,不一定要抛棄 AI 1.0
過去 N 多年,企業在完成信息化之後,期待的是智能化。但其實,這個智能化過去沒有很好地發展起來。
很多企業做所謂 AI 中台,用 AI 中台支持各項業務,效果不是很理想。現在有了大模型,大家都在考慮我能不能搞一個新的 AI 中台來支持所有業務。
認知智能涵蓋很多方面的因素:第一是語言理解,第二用推理、預測、決策去解決問題。這在很多方面都有用處,包括翻譯、客服、知識圖譜、推薦問答,都是企業智能引擎的一部分。
所以如何搞一個大模型,作爲某種意義上的 AI 中台來支持企業各項業務,就是我們現在要考慮的一個問題。
回到大模型,支持下遊任務無非有兩種做法:GPT-3 之前,是做模型的微調,去修改模型參數;而 GPT-3 之後,像 ChatGPT,它就是用 prompt(提示詞),不需要對大模型進行修改,通過提示就能把大模型的很多能力牽引出來解決問題。
這樣一來下遊任務的開發就變得非常簡單了,做 prompt 就可以了。
現在大家都去追 ChatGPT,其實大模型是多種多樣的,包括一開始 BERT、T5 到 GPT-1、GPT-2 等等。那麽ChatGPT 跟以前的大模型有什麽區别?
我的理解是:第一,它對用戶的意圖理解更加清晰準确;第二,多輪對話的建模非常好,有若幹解析能力。
不過,站在工業界角度,很多解析能力其實不用 ChatGPT 也能做得很好,比如翻譯。用單獨的引擎跟 ChatGPT 比,可能還比 ChatGPT 厲害。
在這種情況下,到底要用 ChatGPT 來幹什麽?
兩種考慮:一個是在 ToC 層面上,AGI 能力越多越好,用戶在一個簡單界面中,就可以想幹什麽幹什麽,不用來回來去翻。
另一個是在 ToB 環境下,把問題理解、多輪對話的能力,接上企業自己的核心引擎,好好結合起來。因爲對于企業來說,很多 AGI 功能是基本不用的,甚至還有可能搗亂。
現在都在讨論 AI 2.0,AI 2.0 對應的是 AI 1.0。
1.0 是什麽?一個模型一個引擎,一個模型一個任務。而 AI 2.0,就是一個模型 N 個任務,甚至可以想象未來一個模型解決無窮個任務。現在當然達不到這個狀态,但是有這樣的趨勢。
好處是,一個模型 N 個任務,可以提高開發效率。另外大模型到一定程度有湧現能力,讓人産生了一些對未來人工智能深深的遐想,這是以前單模型、單任務永遠出不來的。
但對于企業而言,并不是必須用 AI 2.0、一定要抛棄 AI 1.0。
企業應該把 AI 1.0 功能引擎和 AI 2.0 的部分能力(如問題理解和多輪對話的能力)無縫對接起來,形成一縱一橫的合力。
大模型來了,能有效改進企業的智能化研發環境。過去任務太碎片化,一個任務一個模型,研發人員準備各種 feature 的代價太大,維護成本也比較高。現在有了大模型,代價就減少了很多,通過本地部署或者雲,整體開發效率提高了很多,維護也容易了。
我們就在想,有這樣的開發新範式,在企業經營場景中會有哪些新發現?
舉一個例子,金融行業用大模型,你得拿金融數據做 continue training 才會更準。再拿金融領域常見的任務、長期積累的一些标注數據做監督學習,才能讓模型适用于真實場景。這時候再拿模型去完成一些已有任務或新任務,效率才會提高。
類似于 ChatGPT,具體怎麽用呢?一個是用 ChatGPT 做底座,做 foundation model 訓練金融大模型,另一個是用 ChatGPT,在人機交互環境下對企業的各個引擎進行調度。這樣一來,就能讓原來的智能客服具有多輪對話、意圖理解能力,推動新一代智能客服的出現。
瀾舟在做大模型的時候,尤其考慮了企業落地的問題。
第一,是大模型企業數智化應用的邊界。是把大模型當作一種分發機制,還是當成基礎模型支持下遊訓練?
第二,是大模型結果的可控性和安全性,不能一會兒對,一會兒錯。
還有,企業以前的功能引擎如何無縫地接入大模型。
最後,企業數據要如何巧妙地用起來,如何把模型做得更輕。
爲此,我們訓練了孟子的一系列模型,并進行了開源。結合用戶的需求,我們不追求非得是千億模型,十億、百億、千億我們都可以提供,然後基于用戶的數據快速做 continue training。
基于互聯網中文數據,以及來自企業、客戶的中文數據,孟子模型很懂中文。
另外,我們也做了很多 AIGC 的工作,包括小說的續寫,關鍵詞生成,實體渲染等等。
基于這些工作,我們跟中文在線合作了一個網文版類 ChatGPT 引擎。
瀾舟在做企業落地的時候,以孟子大模型爲底座,拿用戶行業數據和用戶任務數據做 continue training 的例子,還包括和同花順一起做的金融大模型,和傳神合作的翻譯大模型,和華夏金融合作的輿情分析大模型,以及跟數說故事公司一起做的 AIGC 大模型,這些大模型都已經落地了。
多說一句,行業搜索引擎也會被重新定義。第一是從關鍵詞匹配到語言理解,第二是從數據到深度理解,第三是從簡單信息獲取到内容生産。
OpenAI 和微軟做對了什麽?
最後說一點感想。這張圖這兩天很火,是黃仁勳當時把 DGX-1 的第一台機器贈送給了 OpenAI。
現在,OpenAI 已經是 AI 領域的翹楚,英偉達是全球科技領域市值第五的公司,還有微軟,也堅持投入 AI,跟 OpenAI 長期合作,三家公司現在發展非常好。
他們做對了什麽?
第一,是擁抱未來。他們看到 AI 的主旋律是一定要抓住的,并且持續爲之努力。
第二,是腳踏實地。每個企業都有自己的特點,OpenAI、微軟和英偉達,都是在把自己的長處發揮出來。
第三,是互相成就,而不是互相拆台。比如說微軟突然把 OpenAI 做的事都給做了,或者 OpenAI 往下遊走,去跟英偉達形成競争關系。
我想說這句話的意思是,現在咱們中國 AIGC 開始火了,大家蜂擁而上,大廠、小廠、研究機構、學生、老師都有小小的焦慮。
這時候,一是要看到未來 AGI 的絕對趨勢;二是要找到自己的長處,腳踏實地去做;三是要營造一個好的生态環境,大家多交流、互相成就,才能促進整個 AIGC 的發展。
謝謝大家!