本文系基于公開資料撰寫,僅作爲信息交流之用,不構成任何投資建議。
當 AI 以一個特定的主題,在 30 秒内完成一篇文章的寫作,并在高中甚至大學某個年級的課堂裏獲得第一名的最終評價時,我們知道,對于我們的下一代來說,這個世界已經永遠改變了。
不止是寫作。當時當下,在全球各地各個産業領域内,一場以生成式 AI 爲内核的人工智能革命,正在以不可逆的态勢深入蔓延。ChatGPT 爲代表的生成式 AI,已成爲全球科技競争的制高點。
随之而來的是關鍵命題是:中國 AI 科技領域,誰将是這場全球性科技競賽的中堅破局力量?
這個問題的答案,出離不了算力、算法以及數據三個維度構成的産業規律。那些在人工智能領域持續耕耘的中國科技公司們,凜冬之後,終于捱到了自己的黃金時代。
比如科大訊飛 ( SZ:002230 ) 。
作爲 ChatGPT 主題研究的第二篇,本文将以訊飛爲樣本,透視中國生成式 AI 産業的當下與未來。
01
中國 AI 進入無人區
" 在做通用 AI 範式的時候可以想象站在一個沼澤地上,四面沒有光,也沒有手電,這時候咱都不說走多遠,往哪邊走都是個問題。這種情況下大家都選擇了相對光明的道路,就是專用 AI 範式。不得不佩服美國人,他把這個事情(AGI,通用人工智能)從 0 到 1 的道路硬生生的走出來了。" 這是日前一場專家電話會中,一位産業人士對于 ChatGPT 及其背後的 OpenAI 團隊的感慨。
從專用 AI 到通用 AI,即使 OpenAI 已成功闖關,但對中國的 AI 公司來說挑戰仍然巨大,說是走入無人區毫不爲過。
不信你瞧谷歌:
ChatGPT 火爆之後,被觸及商業模式核心利益的谷歌最爲着急。單純從理論上來看,它做這個事情好像不難。畢竟就連 ChatGPT 的底層架構 Transformer 模型,都是來自谷歌。
但現實很殘酷。谷歌的類 ChatGPT 項目 Bard 出師不利,員工通過内部論壇 Memegen 批評管理層最近推出的 Bard:倉促、拙劣、毫無谷歌風範(un-Googley)。
ChatGPT 的通關之路難度可見一斑。
但即使如此國内參與者也不得不跟。因爲 ChatGPT 會對衆多産業帶來颠覆性變革,包括且不限于:
1)改變現有人機交互模式。
2)改變現有信息分發獲取模式。
3)改變内容生産模式。
4)加速 "AI for Science" 的發展。
直觀一點來說,互聯網的核心價值是連接,ChatGPT 代表的生成式 AI 的核心價值則是嵌入。如果嵌入至制造業,生成式 AI 的強大遠景——存、算、編碼生成一體化所帶來的 " 随心所欲 " 效應,無疑意味着人類生産力能力文明級的跨越。
但在這個質變發生
(在以制造業爲核心的工業領域,質變發生仍受制于材料與能源)過程中,生成式 AI 作爲機器智能超算,最大化價值的用途還是嵌入到科研領域,将在基礎學科研究、新材料、新能源、新藥物的研發過程中扮演關鍵角色。
02
科大訊飛的比較優勢
目前諸多中國科技公司都在加緊布局類 ChatGPT 項目。所有謀局者之中,科大訊飛是比較優勢較爲突出的一個。主要體現在以下幾個方面:
【1】數據卡位
前文我們提到,谷歌 Bard 背靠海量數據出師不利,反觀 ChatGPT 當前最具産業價值的編程能力,很大功勞來自于 GitHub。OpenAI 在 ChatGPT 中引入了它 830G 代碼文本,那是一億程序員的智慧湧現,編程能力不強才怪。
圖:GitHub 的用戶增長曲線,來源:網絡
科大訊飛憑什麽布局 ChatGPT?OpenAI 上述産業實踐,以及在醫療領域的突破,也許能得出一些啓示,那就是數據質量的重要性。
目前國内參與者在算法、算力上跟 ChatGPT 是有差距,但優質數據在一定程度上彌補了這個差距。比如 ChatGPT 最近通過美國執業醫師資格考試,它在考試三個部分得分在 52.4%-75% 之間。而與醫療機構緊密合作的科大訊飛,其 " 智醫助理 " 系統 2017 年就通過國家執業醫師資格考試綜合筆試測試,答對 76% 的題目(滿分 600 分,考了 456 分)。目前 " 智醫助理 " 作爲全科醫生助手已可以診斷 1200 多種常見病,累計提供 5.5 億次 AI 輔診建議。
放眼整個行業,長期布局 AI 技術的同時,又掌握醫療、教育等專業數據端口的公司是稀缺的,這是科大訊飛布局類 ChatGPT 項目的底氣之一。
【2】算法與成本曲線
大模型的訓練是一件燒錢的事。ChatGPT 的誕生與用戶廣泛應用,離不開它對成本曲線改造:過去兩年半時間,GPT-3 模型的訓練成本下降了 80% 以上,目前僅需要 140 萬美元(首次訓練約 1200 億美元)。而成本曲線的降低離不開算法進步。道理很簡單:同樣是訓練一次大模型,算法能力提升意味着成本曲線的降低。
OpenAI 的成功在于算法叠代,GPT3 比之 GPT2 在算法層面有本質提升(于是它不開源了)。所以創立 8 年燒錢不斷的它還能獲得資金支持,并終于等到 ChatGPT 橫空出世。
回頭看國内玩家,雖然公司間橫向的算法直接對比沒法做,這是商業秘密,但從側面還是能看到一些端倪:
科大訊飛在 GitHub 上開源模型比較受追捧。具體而言,其開源了 6 個大類、超過 40 個通用領域的系列中文預訓練語言模型,相關模型庫月均調用量超 1000 萬,在 Github 平台獲得星标數(相當于點贊)位列同類中文預訓練語言模型第一并遠超第二名。
與此同時,科大訊飛承建了認知智能國家重點實驗室。AI 技術可簡單分爲識别(圖像識别、語音合成與識别等)和認知(語義理解、常識推理、知識圖譜、閱讀理解等)兩大類,承建認知智能國家重點實驗室是官方對科大訊飛算法技術實力的背書。
圖:科大訊飛 AI 裏程碑,來源:國信證券
【3】算力戰争
據最新的投資者關系交流會議顯示,科大訊飛 2009 年至今,已建成 4 城 7 中心深度學習計算平台,自建業界一流的 AI 數據中心奠定大模型訓練的硬件基石。在技術層面實現百億參數大模型推理效率近千倍加速,爲認知智能大模型經濟實惠的規模化提供可能性。目前來看,基本滿足類 ChatGPT 項目的布局。
但從長期看,科大訊飛乃至整個中國布局類 ChatGPT 項目的玩家,還是得大力加強算力的提升。從産業的發展趨勢看,算力是企業乃至當前世界最關鍵的競争資源。殘酷的事實是,超級算力中心建設資金門檻已經在 ChatGPT 出現後,已經推向百億之上(在微軟的支持下),而運營與維護成本更是天文數字。
基于優質數據卡位,算法能力和商業化策略(下文詳述),科大訊飛在算力維度至少有一點可以抓緊做:推動企業間的分布式計算協作。強如 OpenAI 亦綁定微軟這個算力巨頭,2 月 8 日微軟更是宣布将 ChatGPT 整合進其搜索引擎,未來随着類 ChatGPT 玩家的布局行至中場,合作的機會少不了。
03
AI 界的一股清流
在真實的商業世界,技術的硬實力永遠不是全部,它無法具現一個組織看不到的軟實力。事實上,對比絕大多數的 AI 公司,科大訊飛的軟實力更爲突出。
過去很長時間,科大訊飛一直是 A 股市場上的 AI 獨苗。圍繞其業績的質疑聲音一直沒斷過。直到背負巨額虧損的 AI 新勢力們上市,外界方看到了其自力更生的難能可貴。
圖:科大訊飛的淨利潤,來源:choice
與後進的 AI 新銳們不同,科大訊飛以語音識别起家,這條路線對于早期 AI 公司可能比較友好。衆所衆知,2006 年 Hinton 利用預訓練方法得出神經網絡局部最優解,将隐含層推到了 7 層,神經網絡真正上有了 " 深度 ",由此揭開深度學習熱潮。
所謂 " 深度 " 并沒有固定數值,在語音識别中 4 層網絡就能被認爲是較深的(例如谷歌産品 voice search)。在效果一定的同時,層數越小,難度越低,計算量越少,它有利于打通技術與商業化的雙輪驅動,這對于 AI 從實驗室走向産業的起步階段非常重要。
AI 的科技含量再高,它也是一門生意,先把商業的帳算清楚。任何商業的基本規律就是創造現金流、創造真金白銀的産業附加值才能持續發展。組織能自負盈虧,才能穩健的進入其它技術分支——科大訊飛先是擁有我國唯一的 " 語音及語言國家工程實驗室 ",後來國家唯一的 " 認知智能國家重點實驗室 " 也設在科大訊飛——一步步擴大公司的護城河。
之所以說科大訊飛更契合商業基本規律,因爲這是一目了然的事情:你看所有布局類 ChatGPT 的玩家,隻有它比較明确的開始講應用講商業,"1+N" 架構的行業應用已經規劃好了。
"1" 是通用認知智能大模型算法研發及高效訓練底座平台,"N" 是應用于教育、醫療、人機交互、辦公、翻譯、工業、汽車等多個行業領域的專用大模型版本。例如,通過學習海量醫學教材、論文和病例,實現專業的醫療領域對話式 AI 系統,打造 " 每個醫生的 AI 診療助理,每個人的 AI 健康助手 "。
運營節奏之外,科大訊飛是少數能做到既懂 B 端又懂 C 端的科技公司。
在中國既能服務企業、又能服務用戶的科技公司屈指可數。科大訊飛服務 C 端,不僅指智能硬件銷售,還有教育領域學生以年費形式訂閱個性化學習手冊和英語聽說業務等。目前 " 個冊 " 覆蓋 1400 多所學校,口語業務 2022 年新增 12 個地市的中考和 2 個地市的高考。
科大訊飛有可能在醫療等闆塊打造 C 端應用的标杆,恰如 ChatGPT 的編程。當然,這是比較樂觀的預期,C 端能力的潛在可能性。關于可能性我們不再多談,因爲目前還爲時尚早,期待科大訊飛的産品上線。
以上,成立于 1999 年的科大訊飛,23 年風雨兼程之後,終于進入了自己的黃金時代,正成爲布局 ChatGPT 玩家裏的中堅力量。ChatGPT 作爲第四次工業革命開始的标志,世界商業秩序正面臨劇變,沒有人可以置身事外——如果改變世界的那個人 / 組織不是你,至少要和科大訊飛們站在一起。
往 期 推 薦