自現象級 AI 應用 ChatGPT 落地至今,作爲應用技術商業化大國的中國,在短短半年内,對于這項能照耀未來的技術的商業化探索,堪稱氣象萬千。
對于中國技術公司而言,若無一個類似 ChatGPT 應用的對标産品,可能難以顯示其技術色彩。因此,但凡能數得上号的中國技術公司,截至目前,基本上都發布了各自的類 ChatGPT 應用。
5 月 6 日,中國式 ChatGPT 再添新成員:科大訊飛發布星火認知大模型和多行業場景商業應用的 AI 能力。5 月 8 日,科大訊飛股價漲停,爲 3 月 23 日以來首次。
推動中國經濟繁榮的改革開放,秉持的實用主義原則,其影響也波及了中國科技公司對于新技術的主流态度:新技術能否創造出确定的應用商業價值。有此指導思想,故其對底層技術的熱情很少像對新技術的商業應用那樣高漲。
但這不等于,中國技術公司缺乏底層技術探索和積累。他們隻是需要有人給出這些底層技術極具商業價值想象空間的路徑,然後,其應用這種底層創新技術的商業探索落地速度之快,舉世無雙。
科大訊飛作爲一家以 NLP 語音技術立足的技術公司,自然也不例外——任何技術公司或文化現象,無不受宏觀行業環境和曆史傳統影響。
那麽,訊飛星火認知大模型的技術探索是什麽?AI 商業價值怎樣落地?訊飛 GPT 技術能力如何與之業務匹配?強弱如何?未來這種能力怎樣演進?
開放平台:如虎添翼?
5 月 6 日,科大訊飛董事長劉慶峰發布星火認知大模型,并同步發布訊飛 AI 學習機、訊飛聽見、訊飛智能辦公本、訊飛智慧駕艙、訊飛開放平台等 5 項應用成果。其中,訊飛開放平台是構成科大訊飛商業(技術和産業)護城河的關鍵要件。
科大訊飛 2022 年财報顯示,訊飛開放平台的毛利率爲 28.23%,同比提升 7.02 個百分點。在科大訊飛四大業務闆塊中毛利提升速度最快、升幅最大。
以 AI 技術爲基石,通過 " 平台 + 賽道 " 市場戰略,憑借 " 算法和數據 " 核心技術優勢,科大訊飛在 C 端、B 端和 G 端的 AI 領域攻城略地。
據科大訊飛聯合創始人、高級副總裁江濤解釋," 平台 + 賽道 ",這個 " 平台 ",即訊飛開放平台:" 星火認知大模型對訊飛開放平台極具意義。"
2021 年 10 月 25 日,劉慶峰在合肥發布 " 科大訊飛開放平台 2.0 戰略 "。
與 1.0 相比,訊飛平台 2.0 戰略新增 " 行業龍頭 ",構成新的 " 訊飛 + 行業龍頭 + 開發者 " 三維結構,目的是通過訊飛開放技術平台和工具,結合行業特性和數據,形成數字底座,再通過開發者将數字底座與特定的軟硬件環境做匹配,最終形成完整的行業 AI 數字解決方案。
在這個過程中,開發者數量決定整個開放平台的垂類應用豐富性,開放平台的底層技術能力,決定開發者能用具備怎樣強悍能力的技術工具,去開發垂類應用;而行業龍頭帶動的行業合作夥伴,用 RPA(機器人流程自動化:Robotic Process Automation)等工具開發行業應用的易用性和有效性,也與開放平台的工具能力密切相關。
若對 " 訊飛 + 行業龍頭 + 開發者 " 三維結構做個解構,即由科大訊飛提供 AI 技術、大數據平台和相關深度學習訓練算法工具,行業龍頭在此基礎上提供場景、專家知識和各類業務模型。之後,由雙方通過貫穿 AI 算法的業務模型形成數字基線底座。
有了基線底座,訊飛開放平台行業開發夥伴,可以做具體場景匹配軟硬件環境的技術應用工具,完善和做各種流程開發,最終形成具體的可應用的行業解決方案。
因此,一旦訊飛星火認知大模型集成到開放平台,則平台工具能力之提升幅度,将難以想象。江濤說," 大模型進一步集成到開放平台後會帶來整個開放平台能力的躍升,我們會進一步地賦能這些開放平台的合作夥伴。"
劉慶峰在 5 月 6 日披露,訊飛開放平台實名認證的開發者數量,已經突破 400 萬,行業合作夥伴突破 500 萬大關。2021 年 10 月 25 日,實名注冊開發者數量是 265 萬。
訊飛星火認知大模型的底層能力,怎樣賦能訊飛開放平台的行業夥伴?劉慶峰說,訊飛将開放插件。" 合作夥伴、開發者可分享這些插件,以深入至大模型。這樣用星火大模型就可以直接用到這些插件能力。"
随着應用的深入,可集成越來越多的專業插件:對行業插件安全性有要求的 B 端用戶,可用星火認知大模型做富有針對功能的插件,以供其内部使用或做平台共享。這是科大訊飛 To B 策略的體現:建立行業生态圈,共同繁榮整體行業。
劉慶峰透露," 已有 36 個行業、超 3000 家企業跟我們達成了合作的明确意向。"
解構 "1+N" 的 AI 應用
美國 OpenAI 公司推出的 ChatGPT 應用,AI 技術名稱是 GPT,而 "Chat" 則是應用手段或形式。通過 Transformer 架構做 AI 技術開發,應用終端的 AI 能力源自底層 AI 技術對語義大模型(LLM)的訓練。
概括而言,OpenAI 的 ChatGPT-3.5(2022 年 12 月推出的初代版),就是用 Problem Models(問題模型)加上 1750 億個參數 / 節點,以之爲基礎提供巨量、有監督的學習數據,借助 Transformer 架構," 投喂 " 給 AI 語義訓練大模型(LLM),做出的 AI 應用效果。
科大訊飛星火認知大模型,作用相當于 OpenAI 訓練語義大模型(LLM)做出的 AI 應用效果集成和問題模型的集合。這在 2022 年 12 月 15 日啓動的科大訊飛認知大模型專項攻關中,屬于 "1",而這個 "1" 落地的行業垂直領域或場景,被概括爲 "N"。
因此,科大訊飛的類 ChatGPT 應用,結構就是 "1+N"。"1" 是指星火認知大模型(可認爲是通用 AI 技術底座),"N" 即落地多場景。若将之從商業角度做個命名,則可稱爲 "1+N" 認知智能大模型技術及應用戰略。
其中,通用認知 AI 技術底座包括七項能力:多層次跨語種語義理解、多風格多任務長文本生成、多模态輸入和表達能力、多功能多語言代碼能力、多題型可解析數學能力、情境式思維鏈邏輯推理和泛領域開放式知識問答。
從商業價值角度,通過通過 AI 技術底座,科大訊飛爲各個行業設計行業技術工具,并且以之構建 AI 應用樣闆間,最終 1 和 N 形成飛輪效應,實現商業價值的正向循環。
科大訊飛主要業務分産品有四個類型:即教育産品和服務、開放平台、信息工程和運營商相關業務。
星火認知大模型除了集成至訊飛開放平台,另外重要的一極是使能訊飛軟件和硬件産品,以提升或重構訊飛的業務競争力。
這些軟硬件産品所屬場景即處于 "1+N" 中的 "N"。5 月 6 日,科大訊飛推出星火認知大模型的四大行業應用成果:教育、辦公、汽車和數字員工。
其中,教育和辦公方面,屬于人機交互。訊飛主要落地形式是軟硬件,如學習機、辦公本或語音遙控器,以及訊飛聽見(專業級語音轉文字效率工具)。江濤說," 我們相信大模型的智慧湧現一定會帶來下一代人機交互的新的入口。"
科大訊飛 2022 年财報顯示,教育産品毛利率是 49.39%,在科大訊飛營收中的占比 32.74%,均爲最高。
與 To C 相比,市場更關注訊飛醫療中的 AI 輔助診療,這塊屬于 To B 場景。據江濤透露,科大訊飛的智醫助理迄今爲止已做了 5.8 億人次的 AI 輔診,中國 300 多個區縣的基層醫療機構的醫生正在使用。
一旦訊飛醫療大模型推出,将更好地幫助醫生提高病曆質檢、輔助診斷、方案推薦和用藥管理等方面的水平。這屬于 B 端中的 C 端應用,比如也能做個人保健咨詢、健康管理和疾病管理。
但在 5 月 6 日,訊飛醫療大模型沒有推出。對此,劉慶峰表示," 因爲需要相關法規,所以我們應對醫療專業領域模型更加謹慎。下一步我們會跟醫療機構合作,通用大模型也會集成醫療專業知識。"
劉慶峰透露,科大訊飛将會在今年訊飛 1024 開發者大會上正式對外發布醫療大模型。
曆史積累和未來目标
雖然科大訊飛的 "1+N" 認知大模型專項攻關于 2022 年 12 月 25 日啓動,但訊飛在 AI 技術領域的技術積累已有十多年曆史。
從 AI 技術發展路徑看,ChatGPT 也不是最新的技術成果。在理論上,ChatGPT 沒有更多創建——核心技術在 2017 年就已出現:由谷歌創建的 Transformer 神經網絡架構,其革命性在于能讓 AI" 聽懂人話 "。
科大訊飛星火認知大模型的底層 AI 技術起始源點,始于 2011 年成立的語音及語言信息處理國家工程實驗室。這比 ChatGPT 應用的底層 AI 核心技術 "Transformer 神經網絡架構 " 早了整整 6 年。
語音及語言信息處理在大模型中的作用是什麽?劉慶峰說," 訊飛星火認知大模型本質上是一次對話式通用智慧的湧現,語音和語言的核心能力是基礎條件,科大訊飛是中國(該領域)的國家隊。"
訊飛取得和谷歌一樣的認識,也就是讓 AI" 聽懂 " 人話的時間節點是 2014 年,也比谷歌早 3 年。
那年,科大訊飛推出訊飛超腦計劃,明确提出要讓機器像人一樣,具備能理解會思考的能力。2022 年 1 月,劉慶峰在科大訊飛年度總結計劃大會上,宣布訊飛超腦 2030 計劃:要讓懂知識、會學習、能進化的通用人工智能技術,以機器人的實體形态或虛拟形态,進入每個家庭。
坦率地說,在 OpenAI 推出 ChatGPT 應用前,科大訊飛在 AI 領域的技術探索和落地成果相對 " 碎片 " ——這也是中國技術公司的 " 共性 " ——缺乏像 ChatGPT 這樣的 AI 能力驗證應用體系。ChatGPT 不僅僅是個 AI 應用,也是一個商業化體系應用的象征性标杆。
因此,OpenAI 實際上起的是驗證 AI 技術商業價值的作用,以及引領 AI 應用方向。一旦方向确立,大模型的海量場景應用驗證得以點亮,素有積累但找不到大規模有效價值應用明确方向的中國技術公司,其類 ChatGPT 技術開發和場景應用激情,就如脫缰野馬,不可遏制。
在 2017 年這個關鍵節點,科大訊飛的 AI 技術積累到什麽程度?他們讓機器在全球首次通過國家執業醫師資格考試綜合筆試測試,測試成績超過 96.3% 參加考試的醫生。
兩年後 2019 年,在斯坦福大學發起的國際著名的 SQUAD 機器閱讀理解比賽中,科大訊飛讓機器在英文閱讀理解中首次超過人類平均水平;2022 年,在艾倫研究院組織的 Open Book QA 知識推理比賽中,訊飛機器單模型首次超過人類平均水平。
或許意識到體系對于 AI" 聽懂人話 " 技術目标達成的重要性,科大訊飛在 5 月 6 日也推出了 AI 應用體系,主要用于評測 AI 技術能力。目前,這項體系已覆蓋 7 大類、481 個細分任務類型的通用認知大模型評測。
比如,AI 技術到底發展到什麽程度?下一個發展應該往哪裏走?技術距離實用是不是已經達标?還有哪些工作要做?
據劉慶峰介紹,目前訊飛星火大模型在文本生成、知識問答、數學能力三項能力已超越 ChatGPT," 英文如果滿分以 5 分計算,Chat GPT 現在是 4.48 分,我們已達到 4.29 分。" 據劉慶峰透露," 當前訊飛星火認知大模型的文本生成、知識問答和數學能力,已超過 ChatGPT。"
根據既定計劃,到今年 10 月底,訊飛星火認知大模型目标中文能力超過 Chat GPT 的水平,英文能力相當。