谷歌硬剛 ChatGPT 消息一出,科技圈全坐不住了。
就在昨晚,阿裡百度網易京東一衆公司全宣布要推出類 ChatGPT 新産品,戰況那叫一個激烈。
阿裡内測中的達摩院版 ChatGPT,也被提前曝光。
竟然連畫畫技能都具備了?!
ChatGPT 類型的對話功能,同樣不在話下。先來個 NBA 話題鋪墊:
當被問到 " 喬丹和科比誰更偉大 " 時,開始暴露籃球迷身份,連 " 毋庸置疑 "、" 奉為神迹 " 這種話都出來了:
還是個喬丹死忠粉,能對你老婆的觀點提出異議(手動狗頭)
看起來這個達摩院版 ChatGPT,不僅有純文本任務能力,還融合了多模态任務能力。
這究竟采用了什麼樣的技術?阿裡這次内測中的類 ChatGPT 産品,能力如何?
基于通義融合升級
據透露,新産品可實現的功能包括知識問答、AI 繪畫、代碼生成、小說續寫、文案撰寫、寫詩作詞等。
一言以蔽之,不僅 ChatGPT 具備的能力它都能實現,而且多了 "AI 繪畫" 這項功能。
能取得這樣的多任務、跨模态效果,背後本質上離不開阿裡通義大模型的能力。
新達摩院版 ChatGPT,正是基于通義大模型體系進行融合升級。
據報道,推出的通義大模型底座基于統一學習範式 OFA 等底層技術打造,具備了能搞定多種任務的 " 大一統 " 能力:
不引入新增結構,單一模型即可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等 10 餘項單模态和跨模态任務。
升級後,更是可以處理超過包括語音和動作在内的 30 多種跨模态任務。
這裡 " 大一統 " 技術的關鍵,在于提出并實現了三個 " 統一 ":
架構統一。使用 Transformer(encoder-decoder,編解碼器)架構,統一進行預訓練和微調,無需在應對不同任務時,增加任何特定的模型層。
模态統一。不管是 NLP、CV 這種單模态,還是圖文等多模态任務,全都采用同一個框架和訓練思路。
任務統一。将所有單模态、多模态任務統一表達成序列到序列(Seq2seq)生成的形式,同類任務的輸入幾乎就是 " 一個模子裡刻出來的 "。
目前推出的通義大模型,在電商跨模态搜索、AI 輔助設計、法律文書學習、醫療文本理解、開放域人機對話等 200 多個場景中應用落地時,均能達到 2%~10% 的效果提升。
從阿裡的研發來看,他們實際上于 2020 年左右已經開始布局此類技術研究。
2021 年推出 " 中文版 GPT-3"PLUG,參數量 270 億,但跟 GPT-3 一樣是 " 萬能寫作神器 "。
例如這是小說續寫的效果:
去年,阿裡 AliceMind 模型更是在 CLUE 榜單的AI 中文語言理解任務上得分首超人類,獲得了 86.685 高分。
CLUE 榜單會從文本分類、閱讀理解、自然語言推理等 9 項任務中全面考核 AI 模型的語言理解能力,但參評 AI 模型一直未能超越人類成績,AliceMind 則一舉在 4 項任務中超過了人類水平。
國内廠商紛紛追逐 ChatGPT
所以,此次推出類 ChatGPT 産品,阿裡究竟是怎麼想的?
其實阿裡通義大模型體系中,有不少模型都已經在魔搭社區開源。
魔搭社區由阿裡達摩院與 CCF 開源發展委員會共同發起,目前社區内有 300+ 模型上線,其中包括 10 多個大模型和 150+ SOTA 模型,其中三分之一都支持中文。
但據知情人士透露,阿裡長期以來的目标依舊沒變:
打造中文 ChatGPT 的生态,這個定義對于阿裡來說可能窄了一點。相比之下,阿裡更希望能引領中文大模型的發展趨勢。
不止阿裡,包括百度、網易、京東等各科技大廠也都已經坐不住了。
百度正在對類 ChatGPT 産品 " 文心一言 " 進行内部測試,官方宣布測試完成時間在 3 月左右,但是否會因為這波熱度提前還不好說。
網易也劇透,未來網易有道可能會推出 ChatGPT 同源技術産品,主要在在線教育一塊實現應用。
京東集團副總裁何曉冬則表示,京東是加速 AIGC 和 ChatGPT 規模化落地的最佳場景,未來借助這一系列成果,将加速 AI 在國内的應用落地。
這波國内外廠商的 ChatGPT 熱潮,很快就要起來了。