最近結束的聯合國大會上,馬斯克與近期熱點人物、以色列總理内塔尼亞胡談笑風生時,再度盛贊了中國的 AI 實力:
" 至于你說的哪些國家将在人工智能領域處于領先地位?中國肯定是其中之一,是頂尖國家之一,并且有潛力成爲第一。"
雖然馬斯克出名是因爲搞制造業,但作爲 OpenAI 的早期牽頭人、也是給 Google 和 DeepMind 牽過線的内行,馬斯克對 AI 的理解和參與比一般人想象中深的多。對于中國 AI 産業," 馬建國 " 自然洞察敏銳。
馬建國出席上海的世界人工智能大會
距離 ChatGPT 誕生不過一年不到的時間,僅 1-7 月,中國就誕生了 64 個大模型,累計大模型數量達到 130 個,超過美國的 114 個 [ 1 ] 。
不過,馬斯克認爲中國有潛力成爲第一,原因一定不隻是中國的大模型數量。在轟轟烈烈的百模大戰後,應用層面的建設已經徐徐鋪開,在這關鍵的第二槍上,中國企業其實已經率先站上了起跑線。
誰來打響第二槍?
2022 年 11 月,ChatGPT 的問世讓生成式 AI 在短短一個月裏,成爲了科技圈一整年甚至今後幾年的頭号關鍵詞。
這樣的情形一度讓人回憶起 2016 年,AlphaGo 以碾壓之勢戰勝人類圍棋冠軍李世石,給普羅大衆帶來的震撼和随之而來的資本狂歡。
AlphaGo 3:0 戰勝李世石
有了基于 transformer 的大模型開道,AI 以更符合人類想象的方式到來:可以對話,可以思考,可以像朋友、師長、同事、助手。人們會對 AlphaGo 的智能産生天然的敬畏,對 ChatGPT 卻更多的是好奇、興奮,确信 AI 将會改變我們的生産和生活。
更清晰的藍圖,給了人們前所未有的憧憬,帶來的是紮堆開發大模型的熱鬧場面,連坐擁石油的沙特阿拉伯都坐不住了,意圖要用 " 鈔能力 " 堆出一個生成式 AI 的未來。
在這樣的背景裏,中國不出意外的成爲了大模型開發的主力軍。除了數量上的領先,國内大模型的質量參數也保持了高水準:年初至今,不斷有機構以不同的指标對 ChatGPT 和國産大模型做測試,一個可觀的趨勢已經出現:
年初還與ChatGPT 有較大差距的國産大模型,正在以驚人的速度縮小差距。
在今年 5 月發布的中文通用大模型綜合性評測基準 SuperCLUE 中,科大訊飛推出的星火認知大模型排名全球第三,僅次于 GPT-4 以及 ChatGPT 采用的 GPT-3.5 [ 2 ] 。
而在 10 月 24 日的發布會上,科大訊飛進一步叠代推出了星火認知大模型 V3.0,根據國務院發展研究中心的國研經濟研究院的橫評報告,星火認知大模型 V3.0 綜合能力超越 ChatGPT,國内領先、國際一流。科大訊飛年初時定下的計劃——全面對标 ChatGPT,得到兌現。
而相比大模型本身在理論性能與技術路線上的差距,當下産業界最關心的問題,其實是困擾 AI 産業十幾年,如今再度被搬上台面的 " 緊箍咒 "。
9 月,知名投資機構紅杉資本的 David Cahn 發布文章稱,如今的 AI 産業還需 1250 億美元的營收,才能掙回爲了大模型在 GPU、數據中心、能源等成本上的投入。但目前 AI 在應用層面上的創新與商業化前景,與 1250 億美元的阈值還有巨大的分歧。
雖然文章發出馬上就引來了 a16z 的反駁,但雙方争議的核心在于計算方式,對 "AI 應用的創新還不夠 " 這一點卻達成了共識:大模型是生成式 AI的基建,但做好了基建,如何在此基礎上建設應用的高樓大廈實現變現,是這場競賽的第二槍。
如何讓更多 " 高樓大廈 " 在大模型的地基上拔地而起,正是中國在生成式 AI 的賽道上,實現反超的最大機會。
主流觀點認爲,生成式 AI 應用中存在幾個問題:一是生成能力的可信可靠問題,二是信息的動态集成問題,三是數據耗盡帶來的數據獲取問題 [ 3 ] 。生成能力的可信可靠,需要技術端長時間的叠代和優化,無論什麽國籍的大模型都有很長的路要走。
而後兩個問題的核心矛盾,其實在于數據資源。在這一點上,中國的優勢其實更加明顯:
互聯網被視作數據的蓄水池,而中國擁有全球最大的網民規模,英特爾此前估算,中國産生的數據量大約占據全球總數據量的五分之一 [ 4 ] 。同時,中國社會的 " 數字化程度 " 相比其他主要經濟體要高得多,得益于繁榮的通信基建和各類互聯網應用。在小模型時代,中國就在 AI 應用落地上領先全球。
另一個優勢則常常不被普通人注意。加州大學伯克利分校的教授 Mark Nitzberg 曾在一次訪談中,對比了中美在 AI 應用落地投資上的差異 [ 5 ] :
在美國,一家 AI 初創公司需要在營銷上投入巨資,期待産品 " 一炮而紅 " 然後回本,非常像一種賭博。但在中國,政府層面的産業政策非常成熟,地方政府也會通過基金等更現代化方式入場投資。同時,大量政府訂單爲 AI 應用落地提供了緩沖空間。
在紅杉的報告裏,他們将生成式 AI 的發展劃分爲兩個章節,第一章是 " 人們發現了生成式 AI" 這個工具,第二章是 " 客戶支持 " ——即應用落地。如今的市場,正是兩個章節切換的窗口期。
而打響第二章節的第一槍的,很可能是中國面孔。
前浪、轉機、開幕
既然聊到 AI 的應用革命,很難讓人不聯想到上一輪 AI 熱潮。ChatGPT 之前,最符合人類對 AI 想象的應用是語音助手,也是死在 AI 應用沙灘上的第一批前浪。
2018 年,還未改名爲 Meta 的 Facebook 宣布,下線其 AI 語音助手 Facebook M 的人工輔助版,最終享年不到 3 歲。雖然增強版仍可通過别的方式使用,但僅向居住在加州的大約 2000 人開放。但在上線之初,紮克伯格曾對 Facebook M 視作公司的給予厚望,視作公司未來增長的另一支柱。
然而事與願違,Facebook M 最終成爲了教科書中的反面案例。事實上,谷歌、微軟以及亞馬遜的語音助手都曾經遇到過類似的困境。
曾經意氣風發的紮克伯格
問題出在哪?簡單來說,就是智能了,但還不夠智能。而根本上,是小模型在應用層面的尴尬。
在大模型誕生前,業内的 AI 應用大多是基于小模型,隻能處理單一任務。面對複雜任務,往往需要拆分成小任務,針對每個小任務去訓練模型。傳統的語音助手通常都是多個小模型的疊加,隻能回答預設領域的問題。比如,傳統語音助手可以告訴你 " 明天是什麽天氣 ",卻很難回答 "C 羅梅西誰的統治力更強 " 之類從未學習過的問題。
因此,Facebook M 時常被诟病,使用說明極其冗長複雜,任務執行範圍卻極其有限。
這還隻是産品體驗層面的尴尬。在真正落實到提高人類生産力方面,尤其是遇到生産流程繁瑣的情況,十個步驟需要訓練十個模型,又涉及到成本和效率的拉扯。因此在 2019 年,AI 行業凜冬到來,融資金額像氣球漏了氣,縮爲前一年的 1/10。無法創收的初創企業,存活下來僅有巅峰時期的 1/20,其中九成處于巨虧狀态 [ 6 ] 。
但随着 Transformer 推開了大模型時代的大門,AI 應用的轉機出現了。
transformer 模型
相較于小模型,大模型更大規模的神經網絡,換來了極強的通用能力,開發者沒必要再一一找對應的數據做訓練。比如基于 ChatGPT 的語音助手,不僅可以回答 " 明天的天氣是否适合出行 " 的問題,還可以幫忙搜集資料、規劃項目流程、做會議紀要,還可以像個導師一樣給出學習、工作的意見指導,甚至是做心理輔導等。
這便是大模型帶來的改變,即提供完整、可靠的問題解決方案,真正意義上具備了一定的智能,而不隻是更有效率的方案執行者。
更重要的是,大模型突破性地發展出了啓發式對話和長期記憶的能力——它不再隻是預設好的機械,而是真正意義上具備了一定的智能。因此,大模型将有機會發展出更深層次的應用,進一步重塑人類社會的科技樹。
科大訊飛在 AI 健康助手這一應用上的突破就是個典型案例。
2015 年底,科大訊飛依靠小模型打造出了訊飛智醫助理,試圖讓人工智能技術與醫療行業相結合。從今天的視角來看,訊飛智醫助理的能力邊界、應用場景主要在 B 端,爲基層醫生提供輔助診斷。
但随着大模型時代到來,人工智能顯然可以做得更多、更好。
10 月 24 日發布會上,科大訊飛推出的新版訊飛曉醫。除原有能力之外,訊飛曉醫還能提供看病前問診功能,幫助有效提升問診效率,健康自查有效度提升 40%。還能解答病人的用藥疑問,高風險用藥召回率提升 90%,幫助病人更合理地用藥。在此基礎上,訊飛曉醫也支持體檢報告快速生成重點及健康提醒,使得病人可以有針對性地問診。
小模型時代的訊飛智醫助理,主要在 B 端,是一個基層醫生的助理;相比之下,新版的訊飛曉醫可以将能力邊界延伸到 C 端,成爲一個私人的健康助手——這一變化,正是大模型所實現的。
值得一提的是,從發布星火大模型 V1.0 到現在,科大訊飛實現上述應用的落地,隻用了不到半年的時間。這些成果背後,其實是科大訊飛企業價值觀的一種體現:根據地業務的核心滿足社會剛需,以價值創造推動社會進步。這在全球科技公司盲目擴張大模型的當下,有着不小的意義。
有大模型加持的 AI,顯然比過去更加符合人類對 AI 的想象了,大概率不會重走上一輪 AI 熱潮的老路。大模型革命的第二章節,很可能會比想象中更加波瀾壯闊。
中國企業的十年
人們感歎中國技術進步之快,卻很少有人意識到,在此之前,中國科企已經伴随着 AI 産業走過漫長而曲折的道路。
世界經濟論壇創始人施瓦布教授将工業革命劃分爲四個節點:第一次是蒸汽機的發明,第二次是電氣化革命,第三次是計算機革命,第四次是現在的人工智能革命。
前兩個節點,中國直接沒趕上,第三個節點趕上了,卻隻趕上了後半截。
在計算機底層的技術上,先是錯過芯片産業技術轉移黃金期、又是錯過 "Win-Tel" 聯盟引領的 PC 浪潮。雖然後來居上,總算坐上了互聯網時代的雲霄飛車;但由于過去缺少對底層技術的投入,因此仍有許多受制于人的地方。
值得慶幸的是,在人工智能的技術革命中,中國公司早早入了場。實際上,論底層技術的積累和前期的投入,中國公司并不比西方落後。
人工智能的上一次裏程碑事件是 2012 年的 ImageNet 圖像識别大賽:多倫多大學的 Geoffrey Hinton 團隊拿下冠軍,也爲深度學習的産業化撕開了一道口子。此後,谷歌等極少數美國科技公司加入到了對人工智能的追逐當中,最終開創了一個時代。
但很多人不知道的是,同一年的全球語音合成大賽中,來自中國的科大訊飛團隊也達成了一項成就:它的漢語語音合成超過了普通人水平。從一開始,中國就不乏科大訊飛這樣的 "AI 原生 " 公司。
科大訊飛對大模型及其背後深度學習理論的啓蒙,可以追溯到 2010 年:
當時,微軟 AI 首席科學家鄧力回母校中科大做了場演講,分享了将深度學習應用于語音識别的最新成果。當時,幾乎沒有什麽人相信深度學習的潛力——連鄧力自己,都是 2009 年和 Hinton 合作過一次之後,才變成了 " 信徒 "。然而,這場演講卻給台下坐着的胡郁、王智國、劉聰心中,種下了一顆種子。
鄧力
彼時胡郁是訊飛研究院院長,而王智國、劉聰爲研究院核心成員。
這次講座,成爲了科大訊飛踏足大模型和深度學習的開端。很快在 2011 年,科大訊飛上線了中文語音識别深度神經網絡系統,是早期中國企業探索 AI 的經典案例。
此後幾年,越來越多中國的創業者也都意識到了人工智能的價值。語音技術、翻譯、推薦算法等應用陸續湧現,各大廠商基于自身業務和優勢開始擴張。科大訊飛便是 AI 語音賽道上的重要力量。以 2014 年啓動 " 訊飛超腦計劃 " 爲起點,研發基于類人神經網絡的認知智能系統,正式跨入認知智能時代。
更早涉足大模型和深度學習,帶來的不僅僅是更長久的技術積累,也夯實了中國企業 AI 人才的建設。AI 是個典型的強人才導向型行業,100 個大學生未必比得上 1 個經驗豐富的工程師。
因此,科大訊飛等中國企業很早便開始了這方面的投入。
作爲 " 大學生創業 " 的一面旗幟,科大訊飛一直高度重視人才,從最初以同樣位于合肥的中科大爲重心,到一步步與更多院校展開合作,與高校的緊密聯系,爲科大訊飛源源不斷地輸送着 AI 人才。
2005 年,科大訊飛成立訊飛研究院,但與其他大廠設立的研究院有很大不同:
一方面,整個研究院保留着高校實驗室氛圍,所有人卸下職級,可以就學術問題與董事長劉慶峰 " 吵架 ",總裁吳曉如在重要時刻也得來做後勤。
另一方面,研究院聚集了公司技術研發的所有力量,也就是說,不存在每個業務線養自己技術團隊的現象,也杜絕了所謂 " 部門牆 " 帶來的内耗。
而過去十年的無數場硬仗,又進一步加速了這支隊伍的成長與積澱。
例如 2013 年的 " 語音識别衛冕之戰 "。當時面對來勢洶洶競争對手,訊飛研究院立下軍令狀,在公司上下的全力支持下,經過三個月的加班加點,成功上線了全新升級的語音識别系統,自此将競争對手甩在了身後。
也正是有了類似 " 衛冕之戰 " 的經驗積累,才有了如今的星火大模型。
去年年底,科大訊飛迅速組建完了團隊并迅速進入攻堅狀态:沒有内部行政級别,上下一條心,所有人扁平化工作,公司高管成了 " 後勤 ",研究院需要什麽就給什麽。最終,從成立專項組、人員調動,到發布星火大模型,科大訊飛隻用了半年的時間。
一方面,這是研究院十幾年文化的延續:看到新技術,立刻撲上去,深度學習如是,大模型如是。而由于是成建制的團隊,可以非常有效地調動資源,可以很快作出成果。另一方面,也是科大訊飛從 2010 年涉足深度學習至今,十幾年來的持續投資以及最核心的技術積累的結果。
以科大訊飛爲代表,中國企業過往積累的一系列 " 跬步 ",最終換來了今日的 " 至千裏 "。
因此,當大模型浪潮的第二幕真的來臨,最終如果真由中國企業打響了第二槍,那也沒什麽好奇怪的了。
尾聲
當 2012 年 Hinton 團隊赢下 ImageNet 圖像識别大賽時,全世界隻有很少的商業機構能夠意識到深度學習的價值與産業化空間,即便是學術界,對 " 深度學習有沒有研究價值 " 的争論依然沒有消失。在中國,對人工智能開始大規模投資的公司更是寥寥無幾。
黃仁勳說自己從來不關注市場份額,這是有一定道理的。資本市場和公衆審視科技公司的核心并非銷售額或市占率,而是他們依然在引領技術的進步,還是開始變得平庸。
在所有以技術和創新作爲關鍵詞的叙事裏,我們都能看見對研發義無反顧的投入、對人才毫無保留的尊重以及對長遠目标十年如一日的堅守。從方方面面看,科大訊飛都在扮演着這個角色。
假使中國公司能夠站在通用人工智能浪潮的前線,科大訊飛沒有理由不成爲主角。
參考資料
[ 1 ] IT 2023,賽迪顧問
[ 2 ] SuperCLUE: A Comprehensive Chinese Large Language Model Benchmark
[ 3 ] 大模型發展與落地思考,中國宏觀經濟論壇 CMF
[ 4 ] 2019 英特爾中國:公有雲和互聯網創新實踐
[ 5 ] 中國在人工智能産業發展中有哪些優勢?投中網
[ 6 ] 2021 年人工智能行業發展白皮書
[ 7 ] AIGC 正向醫院滲透,大模型下的 AI 醫療能否打破僵局?第一财經
[ 8 ] AI 十年浮沉,與改變命運的大模型,遠川研究所
[ 9 ] 爲什麽全球 AI 應用領軍有望産生在中國?求是驿站
作者:何律衡
編輯:陳彬
視覺設計:疏睿
責任編輯:陳彬