燃爆！科大訊飛類ChatGPT應用解析

自現象級 AI 應用 ChatGPT 落地至今，作爲應用技術商業化大國的中國，在短短半年内，對于這項能照耀未來的技術的商業化探索，堪稱氣象萬千。

對于中國技術公司而言，若無一個類似 ChatGPT 應用的對标産品，可能難以顯示其技術色彩。因此，但凡能數得上号的中國技術公司，截至目前，基本上都發布了各自的類 ChatGPT 應用。

5 月 6 日，中國式 ChatGPT 再添新成員：科大訊飛發布星火認知大模型和多行業場景商業應用的 AI 能力。5 月 8 日，科大訊飛股價漲停，爲 3 月 23 日以來首次。

推動中國經濟繁榮的改革開放，秉持的實用主義原則，其影響也波及了中國科技公司對于新技術的主流态度：新技術能否創造出确定的應用商業價值。有此指導思想，故其對底層技術的熱情很少像對新技術的商業應用那樣高漲。

但這不等于，中國技術公司缺乏底層技術探索和積累。他們隻是需要有人給出這些底層技術極具商業價值想象空間的路徑，然後，其應用這種底層創新技術的商業探索落地速度之快，舉世無雙。

科大訊飛作爲一家以 NLP 語音技術立足的技術公司，自然也不例外——任何技術公司或文化現象，無不受宏觀行業環境和曆史傳統影響。

那麽，訊飛星火認知大模型的技術探索是什麽？AI 商業價值怎樣落地？訊飛 GPT 技術能力如何與之業務匹配？強弱如何？未來這種能力怎樣演進？

開放平台：如虎添翼？

5 月 6 日，科大訊飛董事長劉慶峰發布星火認知大模型，并同步發布訊飛 AI 學習機、訊飛聽見、訊飛智能辦公本、訊飛智慧駕艙、訊飛開放平台等 5 項應用成果。其中，訊飛開放平台是構成科大訊飛商業（技術和産業）護城河的關鍵要件。

科大訊飛 2022 年财報顯示，訊飛開放平台的毛利率爲 28.23%，同比提升 7.02 個百分點。在科大訊飛四大業務闆塊中毛利提升速度最快、升幅最大。

以 AI 技術爲基石，通過 " 平台 + 賽道 " 市場戰略，憑借 " 算法和數據 " 核心技術優勢，科大訊飛在 C 端、B 端和 G 端的 AI 領域攻城略地。

據科大訊飛聯合創始人、高級副總裁江濤解釋，" 平台 + 賽道 "，這個 " 平台 "，即訊飛開放平台：" 星火認知大模型對訊飛開放平台極具意義。"

2021 年 10 月 25 日，劉慶峰在合肥發布 " 科大訊飛開放平台 2.0 戰略 "。

與 1.0 相比，訊飛平台 2.0 戰略新增 " 行業龍頭 "，構成新的 " 訊飛 + 行業龍頭 + 開發者 " 三維結構，目的是通過訊飛開放技術平台和工具，結合行業特性和數據，形成數字底座，再通過開發者将數字底座與特定的軟硬件環境做匹配，最終形成完整的行業 AI 數字解決方案。

在這個過程中，開發者數量決定整個開放平台的垂類應用豐富性，開放平台的底層技術能力，決定開發者能用具備怎樣強悍能力的技術工具，去開發垂類應用；而行業龍頭帶動的行業合作夥伴，用 RPA（機器人流程自動化：Robotic Process Automation）等工具開發行業應用的易用性和有效性，也與開放平台的工具能力密切相關。

若對 " 訊飛 + 行業龍頭 + 開發者 " 三維結構做個解構，即由科大訊飛提供 AI 技術、大數據平台和相關深度學習訓練算法工具，行業龍頭在此基礎上提供場景、專家知識和各類業務模型。之後，由雙方通過貫穿 AI 算法的業務模型形成數字基線底座。

有了基線底座，訊飛開放平台行業開發夥伴，可以做具體場景匹配軟硬件環境的技術應用工具，完善和做各種流程開發，最終形成具體的可應用的行業解決方案。

因此，一旦訊飛星火認知大模型集成到開放平台，則平台工具能力之提升幅度，将難以想象。江濤說，" 大模型進一步集成到開放平台後會帶來整個開放平台能力的躍升，我們會進一步地賦能這些開放平台的合作夥伴。"

劉慶峰在 5 月 6 日披露，訊飛開放平台實名認證的開發者數量，已經突破 400 萬，行業合作夥伴突破 500 萬大關。2021 年 10 月 25 日，實名注冊開發者數量是 265 萬。

訊飛星火認知大模型的底層能力，怎樣賦能訊飛開放平台的行業夥伴？劉慶峰說，訊飛将開放插件。" 合作夥伴、開發者可分享這些插件，以深入至大模型。這樣用星火大模型就可以直接用到這些插件能力。"

随着應用的深入，可集成越來越多的專業插件：對行業插件安全性有要求的 B 端用戶，可用星火認知大模型做富有針對功能的插件，以供其内部使用或做平台共享。這是科大訊飛 To B 策略的體現：建立行業生态圈，共同繁榮整體行業。

劉慶峰透露，" 已有 36 個行業、超 3000 家企業跟我們達成了合作的明确意向。"

解構 "1+N" 的 AI 應用

美國 OpenAI 公司推出的 ChatGPT 應用，AI 技術名稱是 GPT，而 "Chat" 則是應用手段或形式。通過 Transformer 架構做 AI 技術開發，應用終端的 AI 能力源自底層 AI 技術對語義大模型（LLM）的訓練。

概括而言，OpenAI 的 ChatGPT-3.5（2022 年 12 月推出的初代版），就是用 Problem Models（問題模型）加上 1750 億個參數 / 節點，以之爲基礎提供巨量、有監督的學習數據，借助 Transformer 架構，" 投喂 " 給 AI 語義訓練大模型（LLM），做出的 AI 應用效果。

科大訊飛星火認知大模型，作用相當于 OpenAI 訓練語義大模型（LLM）做出的 AI 應用效果集成和問題模型的集合。這在 2022 年 12 月 15 日啓動的科大訊飛認知大模型專項攻關中，屬于 "1"，而這個 "1" 落地的行業垂直領域或場景，被概括爲 "N"。

因此，科大訊飛的類 ChatGPT 應用，結構就是 "1+N"。"1" 是指星火認知大模型（可認爲是通用 AI 技術底座），"N" 即落地多場景。若将之從商業角度做個命名，則可稱爲 "1+N" 認知智能大模型技術及應用戰略。

其中，通用認知 AI 技術底座包括七項能力：多層次跨語種語義理解、多風格多任務長文本生成、多模态輸入和表達能力、多功能多語言代碼能力、多題型可解析數學能力、情境式思維鏈邏輯推理和泛領域開放式知識問答。

從商業價值角度，通過通過 AI 技術底座，科大訊飛爲各個行業設計行業技術工具，并且以之構建 AI 應用樣闆間，最終 1 和 N 形成飛輪效應，實現商業價值的正向循環。

科大訊飛主要業務分産品有四個類型：即教育産品和服務、開放平台、信息工程和運營商相關業務。

星火認知大模型除了集成至訊飛開放平台，另外重要的一極是使能訊飛軟件和硬件産品，以提升或重構訊飛的業務競争力。

這些軟硬件産品所屬場景即處于 "1+N" 中的 "N"。5 月 6 日，科大訊飛推出星火認知大模型的四大行業應用成果：教育、辦公、汽車和數字員工。

其中，教育和辦公方面，屬于人機交互。訊飛主要落地形式是軟硬件，如學習機、辦公本或語音遙控器，以及訊飛聽見（專業級語音轉文字效率工具）。江濤說，" 我們相信大模型的智慧湧現一定會帶來下一代人機交互的新的入口。"

科大訊飛 2022 年财報顯示，教育産品毛利率是 49.39%，在科大訊飛營收中的占比 32.74%，均爲最高。

與 To C 相比，市場更關注訊飛醫療中的 AI 輔助診療，這塊屬于 To B 場景。據江濤透露，科大訊飛的智醫助理迄今爲止已做了 5.8 億人次的 AI 輔診，中國 300 多個區縣的基層醫療機構的醫生正在使用。

一旦訊飛醫療大模型推出，将更好地幫助醫生提高病曆質檢、輔助診斷、方案推薦和用藥管理等方面的水平。這屬于 B 端中的 C 端應用，比如也能做個人保健咨詢、健康管理和疾病管理。

但在 5 月 6 日，訊飛醫療大模型沒有推出。對此，劉慶峰表示，" 因爲需要相關法規，所以我們應對醫療專業領域模型更加謹慎。下一步我們會跟醫療機構合作，通用大模型也會集成醫療專業知識。"

劉慶峰透露，科大訊飛将會在今年訊飛 1024 開發者大會上正式對外發布醫療大模型。

曆史積累和未來目标

雖然科大訊飛的 "1+N" 認知大模型專項攻關于 2022 年 12 月 25 日啓動，但訊飛在 AI 技術領域的技術積累已有十多年曆史。

從 AI 技術發展路徑看，ChatGPT 也不是最新的技術成果。在理論上，ChatGPT 沒有更多創建——核心技術在 2017 年就已出現：由谷歌創建的 Transformer 神經網絡架構，其革命性在于能讓 AI" 聽懂人話 "。

科大訊飛星火認知大模型的底層 AI 技術起始源點，始于 2011 年成立的語音及語言信息處理國家工程實驗室。這比 ChatGPT 應用的底層 AI 核心技術 "Transformer 神經網絡架構 " 早了整整 6 年。

語音及語言信息處理在大模型中的作用是什麽？劉慶峰說，" 訊飛星火認知大模型本質上是一次對話式通用智慧的湧現，語音和語言的核心能力是基礎條件，科大訊飛是中國（該領域）的國家隊。"

訊飛取得和谷歌一樣的認識，也就是讓 AI" 聽懂 " 人話的時間節點是 2014 年，也比谷歌早 3 年。

那年，科大訊飛推出訊飛超腦計劃，明确提出要讓機器像人一樣，具備能理解會思考的能力。2022 年 1 月，劉慶峰在科大訊飛年度總結計劃大會上，宣布訊飛超腦 2030 計劃：要讓懂知識、會學習、能進化的通用人工智能技術，以機器人的實體形态或虛拟形态，進入每個家庭。

坦率地說，在 OpenAI 推出 ChatGPT 應用前，科大訊飛在 AI 領域的技術探索和落地成果相對 " 碎片 " ——這也是中國技術公司的 " 共性 " ——缺乏像 ChatGPT 這樣的 AI 能力驗證應用體系。ChatGPT 不僅僅是個 AI 應用，也是一個商業化體系應用的象征性标杆。

因此，OpenAI 實際上起的是驗證 AI 技術商業價值的作用，以及引領 AI 應用方向。一旦方向确立，大模型的海量場景應用驗證得以點亮，素有積累但找不到大規模有效價值應用明确方向的中國技術公司，其類 ChatGPT 技術開發和場景應用激情，就如脫缰野馬，不可遏制。

在 2017 年這個關鍵節點，科大訊飛的 AI 技術積累到什麽程度？他們讓機器在全球首次通過國家執業醫師資格考試綜合筆試測試，測試成績超過 96.3% 參加考試的醫生。

兩年後 2019 年，在斯坦福大學發起的國際著名的 SQUAD 機器閱讀理解比賽中，科大訊飛讓機器在英文閱讀理解中首次超過人類平均水平；2022 年，在艾倫研究院組織的 Open Book QA 知識推理比賽中，訊飛機器單模型首次超過人類平均水平。

或許意識到體系對于 AI" 聽懂人話 " 技術目标達成的重要性，科大訊飛在 5 月 6 日也推出了 AI 應用體系，主要用于評測 AI 技術能力。目前，這項體系已覆蓋 7 大類、481 個細分任務類型的通用認知大模型評測。

比如，AI 技術到底發展到什麽程度？下一個發展應該往哪裏走？技術距離實用是不是已經達标？還有哪些工作要做？

據劉慶峰介紹，目前訊飛星火大模型在文本生成、知識問答、數學能力三項能力已超越 ChatGPT，" 英文如果滿分以 5 分計算，Chat GPT 現在是 4.48 分，我們已達到 4.29 分。" 據劉慶峰透露，" 當前訊飛星火認知大模型的文本生成、知識問答和數學能力，已超過 ChatGPT。"

根據既定計劃，到今年 10 月底，訊飛星火認知大模型目标中文能力超過 Chat GPT 的水平，英文能力相當。