科大訊飛劉慶峰：訊飛星火的語言理解能力離ChatGPT僅一步之遙

5 月 18 日，第七屆世界智能大會在天津開幕。會議中，生成式 AI 再一次成爲焦點。36 氪獲悉，在大會開幕式暨創新發展高峰會上，科大訊飛董事長劉慶峰分享了科大訊飛對當下人工智能的思考和實踐，并展示訊飛星火認知大模型的能力及行業應用落地情況。

在劉慶峰眼中，抓住通用人工智能的曆史機遇有三個關鍵點。" 首先，必須要在自主可控的平台上，第二，必須要同時做中文和英文，不能隻學習中國的智慧，還要向世界學習。第三，在‘硬碰硬’的科技對比上，不僅要學習，還要想辦法趕超。" 他總結。

本月初，科大訊飛發布了訊飛星火認知大模型。會議中，劉慶峰同樣介紹了這一大模型的研發契機。他表示，OpenAI 發布的 ChatGPT 給了團隊很大觸動，經快速驗證後發現，科大訊飛有成建制的力量和完整的算法儲備，于是在去年 12 月 15 日正式啓動了 "1+N" 認知智能大模型的專項攻關。

"1 就是通用的認知大模型，直接對标 ChatGPT， N 就是各個專用系統，比如教育、醫療、汽車等領域。" 劉慶峰解釋。

而面對如今生成式 AI、大模型的問題，他也直言，目前純大模型技術還可能出現新知識難以及時更新，事實類問答容易 " 張冠李戴 "，史實、傳統典籍等容易 " 編造情節 " 等錯誤。但劉慶峰預計，這些問題在今年會有明顯的改進。在具體實踐方式上，他認爲 " 大模型本身通過參數記憶和訓練，不能從根本上解決，隻能用一個辦法，調用各種插件來解決可靠性問題。"

整體來看，劉慶峰認爲目前訊飛星火認知大模型在文本生成、語言理解和數學能力方面已處于國内領先水平，尤其是數學能力方面已超過 ChatGPT。語言理解能力方面，不僅在國内遙遙領先，和 ChatGPT 也僅有一步之遙，"100 分相比，我們隻差兩分，而且我們在今年 10 月份之前就會超過。"

以下是劉慶峰演講全文，供讀者參考：

各位領導，各位來賓，非常高興能夠有機會在這裏跟大家分享，我們對于如何搶抓通用人工智能曆史機遇的一些思考和實踐。

認知大模型正成爲通用人工智能全新的曙光。通過對海量的數據進行高質量的清洗，再通過統一的神經網絡的大模型進行記憶和訓練（這個模型通常是上千億的浮點參數的），再經過人機協作的強化學習等一系列創新方法，就可以實現在通用領域的智慧湧現，可以在一定意義上實現像人類一樣的觸類旁通的能力。因此，它可以帶來不僅僅是内容的生産和分發方式的全新變化、人機交互的根本性變革，也會對我們的科研、辦公、工業、互聯網帶來全新的颠覆和全新的機遇。傳統意義上靠堆時長和人力的商業模式，在未來的兩三年之内将被徹底的改變。所以有人說它在曆史上的戰略意義相當于 PC 和互聯網的誕生，我覺得這樣的論斷是毫不誇張的。

剛剛主持人也說了，4 月 28 日中央政治局專門提出我們要重視通用人工智能的發展，這次通用人工智能從 ChatGPT 發布的時候給大家分享了 48 個最主要的任務，科大訊飛對我們人工智能開放平台上 400 多萬開發者團隊在通用人工智能相關能力的分析，我們給出了當前通用人工智能的 7 個底層維度的能力，包括文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力以及多模态的七大能力。

科大訊飛在 2011 年就承建了語音及語言信息處理國家工程研究中心的這樣一個任務，其實這一次的認知大模型一定意義上也是對話式通用人工智能，在這方面的語言理解能力、文本生成能力等等，都是跟語音和語言直接相關的，包括大家在兩側看到的語音的轉寫和翻譯能力，現在都已經超過了專業人士。

除了這些進展之外，我們還承擔了科技部的認知智能國家重點實驗室的重任，所以在此基礎上，我們讓機器在醫療考試——國家執業醫師資格考試筆試中超過了 96.3% 的參加考試的人類醫生，已經可以看 1300 多種病。在高考和語文作文、四六級英語作文、雅思英語作文中，機器改作文已經比一般老師還要更準。在國際上權威的自然語言理解的比賽——斯坦福大學牽頭的 SQuAD 的比賽（是英文的閱讀理解），我們在全球首次超過了人類平均水平。去年又在艾倫研究院組織的 Open Book QA 的科學常識推理挑戰賽上，超過了人類水平。在此基礎上，我們看到 Open AI 發布的 ChatGPT 給了我們很大的觸動和驚喜。經過快速驗證之後，我們覺得科大訊飛有成建制的力量、有完整的算法儲備，所以去年的 12 月 15 号就正式啓動了 1+N 的認知智能大模型的專項攻關。

1 就是通用的認知大模型，直接對标 ChatGPT， N 就是剛才萬鋼主席專門說到的，在教育、在醫療、在汽車等等方面的各個專用系統。

那麽當我們啓動研究的時候，我們就想，通用的人工認知智能它涉及到衆多的領域，我們要向 open AI 緻敬和學習，同時要快速趕超并努力追趕超越，要有一套科學的成體系的評測方法。所以我們以認知智能全國重點實驗室，根據這七大維度提出來了一系列的分解方法，又跟中科院人工智能産學研創新聯盟和長三角人工智能産業鏈聯盟共同探讨，形成了七大類 481 個細分任務的關鍵的測試方法。有這個方法，既可以評測我們自己技術的進步，也可以看到下一步科研的方向，同時可以對各個應用在各個領域裏形成指導。

在今年的 5 月 6 日，我們就按照這 7 個維度進行了發布。我們從第一天做就是中英文同步進行的，将來還要做更多的多語種，這個是一個深層次。當然大家可以看到更多的例子，包括比如說對語言理解能力，像這樣一個很有意思的男子漢大丈夫，既要甯死不屈，常言又說還需要能屈能伸，在各種場景下它怎麽理解？這種理解當然不是一個單點理解，同類的深度理解它全部都具備了這樣的能力。這個理解在底層方面來說，對于句法和字詞的理解也可以摳到非常精細的維度。

大家今天說深層次 AI 或者通用人工智能要具備可解釋性的底層邏輯，再包括像醫療，剛才萬鋼主席已經說到了，我們現在機器已經看了 5 億多人次的病人，所以可以具備很多的通用的知識。這次通用人工智能，我們沒有做專門的醫療方向，因爲它要更嚴肅的才能推給每個家庭。在今年之内，10 月份之前我們就會推出醫療專用的認知模型，成爲每個人的健康助手和每個醫生的診療助理。

另外像數學能力、編程能力等等，還有一些當時我們發布會現場大家腦洞大概提的問題，比如怎麽把 40 平米的房間裝修成 70 平米的感覺、到天津三天的旅遊怎麽制定一個計劃等等，那麽這些其實都需要這七個維度能力的貫穿。

另外還有多模态，它不光能夠生成相關的文字，還可以用語音合成朗讀，可以有人物形象。我們現在看到它七個維度的各種能力，除了多模态我們在 8 月份之前提供，其他六個能力全部都能掃碼體驗了。

我還想說的是，我們經常會說大模型帶來的優勢、很多令人驚喜的表現，但是它也有待攻克的缺陷，比如說因爲它都是用曆史數據訓練的，你要問它今年五一情況它就不知道了，對于這些實時的新聞信息它回答不了。可以看到不光訊飛星火，ChatGPT 也回答不了，包括對一些事實類問題的張冠李戴，傳統典籍的編造情節等等，這個怎麽解決？大模型本身通過參數記憶和訓練，不能從根本上解決，隻能用一個辦法，調用各種插件來解決這些可靠性，就必須要有機器，我們的大模型具有超強的語言理解能力。

我很高興的告訴大家，現在訊飛星火的語言理解能力不僅在國内是遙遙領先的，我們跟 ChatGPT 僅僅一步之遙，100 分相比，我們隻差兩分，我們在今年 10 月份之前就會超過。

搶抓認知通用人工智能的機遇，我覺得有幾個基本要素。

第一個必須要在自主可控的平台上，我們在天津有非常多的合作夥伴，還有像曙光、華爲、寒武紀都在科大訊飛有特戰隊。第二，必須是第一天就要同時做英文和中文，我們不可能隻學習中國的智慧，要向全世界學習，所以中英文同步。我們 5 月 6 日這個版本中，不僅數學能力已經超過 ChatGPT 了，在文本生成中中文超過他，英文以 5 分爲滿分，ChatGPT 是 4.48 分，我們已經 4.29 分。那麽還有第三，大家在硬碰硬的科技對比上，不僅要學習，還要想辦法趕超。數學能力，編程能力，都屬于硬碰硬的能力。現在數學我們已經超過了，還在不斷進步，編程現在數據比較少，正在學習，8 月份就會對标 ChatGPT，所以我們定了目标，10 月 24 日跟 ChatGPT 相比要在中文中超越，英文中相當。

所以今天在這樣一個通用人工智能上，我們也在我們的聯合實驗室（包括在科大在清華在很多學校），共同在做更前沿的源頭技術創新（就像懷部長當年在 863 專家組一樣），一定是要有追趕到超越、再有自己原創的系統性的推動計劃。星火也在本次 WIC 展館中展出，希望大家有時間去看。

另外關于大模型在各行業落地，我也有一個有趣的例子，大家可以掃碼自己去試，比如說英語的全自由的開放式對話，可以選擇任何主題。它的對話是完全開放的，每句話都是自動生成的，用語音合成讀出來的。

它最大好處就是，任意一個主題選擇，就像人一樣随機的跟你開放式對答，根據你的回答它随時調整，用語音合成、語音識别和翻譯形成了前所未有的虛拟的對話環境，就跟雅思考官跟你對話一樣。

當然我們其實在一系列産品中已經有落地了，無論從學習機、辦公本，還是我們的訊飛聽見網站等等，現在有 5000 多萬人用訊飛聽見網站把錄音丢過去以後轉成文字，有了認知大模型的專業版，它不僅可以轉成文字，我們直接告訴它要生成一個宣傳文稿、還是廣告文案，還是會議紀要、還是代辦文件，一鍵自動生成，極大提升了我們現在的生産和生活效率。包括在汽車，在工業流程跟工業互聯網的結合已經有很多場景了。

今天我們對 400 多萬的訊飛開放平台開發者團隊，有 500 多項人工智能能力都在賦能，這次星火大模型的通用人工智能會進一步既爲這些開發者賦能，也會讓創業者的門檻極大降低。他隻要會寫 prompt，有創意和靈感，很多事情通用人工智能來幫他做了。

我們在天津正在打造北方聲谷，現在也已經有了 6 萬多的開發者團隊，去年一年新增了 35% 以上，我們在濱海新區這個樓也有幸成了第一個稅收億元樓，稅收過億，現在整個産值也有 100 多億，總共 30 畝的場地蓋了樓，整個産值已經有 170 多億了，所以應該說畝均産出也不錯。

今天是第七屆的世界智能大會，其實從第一屆我們就參加對大會充滿感情，期待在天津這一塊熱土之上，相信今天的星火一定可以在天津、在中國形成燎原之勢，期待着跟大家精誠合作，人工智能也将因解決人類剛需而被更深刻地載入史冊，謝謝大家。