過去 300 多天的時間裏,我們已經見到了數百個大模型的發布。在 ChatGPT 之後,OpenAI 推出升級的 GPT-4,谷歌、百度、華爲、阿裏等大大小小的科技互聯網公司也陸續亮相出新的大模型,這自然也包括了成立之初就 All in AI 的科大訊飛,他們在 5 月初發布了第一版星火認知大模型。
無數的迹象表明,大模型的繁榮時代已經到來。但另一方面,大模型還處在一個快速發展的階段,一切乾坤未定。
10 月 24 日,在第六屆世界聲博會暨 2023 科大訊飛全球 1024 開發者節(以下簡稱「1024 開發者節」)上,科大訊飛董事長劉慶峰發布星火認知大模型 V3.0 版本,文本生成、語言理解和多模态等七大維度能力全面提升,重點還升級了大模型的代碼能力。
與此同時,劉慶峰還宣布,不管是外部對通用認知大模型的評測中,還是根據 OpenAI 構建的測試集,星火大模型 V3.0 在綜合能力上都超越了 ChatGPT(GPT-3.5)。
有些意料之外,卻又在情理之中。
不久前《麻省理工科技評論》中國進行了國内主流大模型能力深度評測,想要找出「最聰明」的國産大模型,結果顯示在 8 個一級大類的 600 道題目的測試和盲評中,科大訊飛的星火大模型 V2.0 在 6 個大類中得分率排名第一,以 81.5 分(百分制)的成績登頂,成爲「最聰明」的國産大模型。
而從 V2.0 到 V3.0,科大訊飛實現了對自己的超越,更實現了對 ChatGPT 的超越。盡管劉慶峰也指出,國産大模型必須正視和 GPT-4 的差距,「國産大模型在複雜知識推理、小樣本快速學習、超長文本處理、跨模态統一理解上距離 GPT-4 還有差距。」但也實在難掩好奇:
從去年底開始攻關,到現在也僅僅過去 10 個月,「星火」到底是怎樣煉成的?
先回到今年 5 月,科大訊飛才剛剛發布星火認知大模型 V1.0,現場展示了文本生成、知識問答、語言理解,以及不同場景中的邏輯推理能力等。特别之處在于,此前不少國産大模型公司在發布會上都是采用錄屏演示,而科大訊飛是少有采用全程實機演示的一家,也可見其自信。
很快,科大訊飛就在次月舉辦了星火大模型 V1.5 的發布會,宣布突破開放式問答,還有多輪對話能力和數學能力的升級;之後就是 8 月份的星火大模型 V2.0,重點升級代碼能力以及多模态交互能力;然後就到了今天星火大模型 V3.0 的全面提升。
劉慶峰表示,星火大模型 V3.0 已經在整體上超越了 ChatGPT,并且在醫療領域也更勝 GPT-4 一籌,是可測系統中「最聰明」的國産大模型。在 1 個多小時的發布過程中,我們也看到了星火大模型在各個維度的領先表現,小到繪本創作,大到新發布的醫療大模型,每個人在星火裏都可以擁有 AI 助手。
科大訊飛創始人兼董事長劉慶峰
滴水石穿,非一日之功。
科大訊飛作爲一家人工智能公司,從 1999 年成立以來一直在開發人工智能技術,确立的公司使命就是「讓機器能聽會說,能理解會思考;用人工智能建設美好世界」。
早在 2011 年,科大訊飛承建語音及語言信息處理國家工程研究中心,「我們提出讓機器像人一樣能聽會說,這一次認知大模型本質上是一次對話式的通用智慧的湧現,語音和語言的核心能力是一個基礎條件。」劉慶峰說。
2017 年,科大訊飛又承建了認知智能全國重點實驗室,也是從這一年起,科大訊飛第一次讓機器通過了國家執業醫師資格考試筆試、超過了 96.3% 參加考試的醫生,還在 SQuAD 機器閱讀理解中全球首次超過人類平均成績。
如果說這些在語音、語言和認知智能領域的豐富儲備和積累構建了科大訊飛在人工智能領域的基石,那接下來的四年可以說在前者的基礎上,提前開始爲星火大模型搭建底座。
2018-2022 年,星火大模型開啓攻關之前的四年間,科大訊飛積累了豐富的 Transformer 算法經驗,這些核心算法上的積累事實上也有序複用到後面大模型的研發之中。另外值得關注的是,科大訊飛擁有成建制團隊的優勢。
訊飛研究院最核心的研究團隊超過了 200 人,其中還有兩位是《麻省理工科技評論》「35 歲以下科技創新 35 人」榜單中頂尖的青年科學家,這也是科大訊飛敢于在星火大模型第一版就進行實機演示以及後續快速叠代的關鍵因素之一。
再然後,這才有了星火認知大模型的誕生與燎原。
你當然可以說科大訊飛是在去年底才開始嘗試「點燃」星火——開發大模型,但在此之前,科大訊飛早在 2018 年或者更早的 2011 年,甚至是 1999 年成立之初就開始在人工智能領域積蓄能量、培養能力。
一言以蔽之,今天我們看到星火大模型的超越和領先,事實上離不開過去 24 年,科大訊飛在人工智能領域的持續投入所充分積累的技術和人才。用比較通俗的說法就是:台上十分鍾,台下十年功。
就像之前一樣,劉慶峰在 1024 開發者節上再一次強調,今天要看一個大模型系統到底好不好,首先還是要看它是不是能解決剛需、是不是真的有用。
技術當然是根本,但技術從來也不是全部。大模型帶來了無限的可能,可這些「可能」都要面對一個核心的問題:如何落地。
科大訊飛可能是少數真正意識到并重視這個問題的大模型公司。
科大訊飛研究院院長劉聰透露,科大訊飛早在啓動大模型技術攻關的時候就确立了「1+N」的大模型體系。「1」代表了星火認知大模型本身,具備自己的商業價值,「N」是針對教育、辦公、汽車、醫療、數字員工等不同領域進行「預訓練」+「精調」的行業大模型,可以讓産品更快落地,快速形成商業模式。
同時,他們很早就開始了準備大模型的落地應用。5 月,科大訊飛就确立了教育、辦公、汽車、數字員工等大模型的應用場景。緊跟着,奇瑞宣布星紀元 ES 将搭載星火大模型,科大訊飛推出搭載星火大模型的智能辦公本,AI 學習機以及學習應用「星火語伴」等。
今天,科大訊飛還發布了早前就預告的星火醫療大模型,在醫療領域的海量知識問答、複雜語言理解和醫療專業文書生成等六大核心能力超越 GPT-4。而按照此前媒體報道,GPT-4 已經能夠通過美國執業醫師資格考試(如前文所提,訊飛「智醫助理」早在 2017 年就通過了中國的執業醫師資格考試)。
此外圍繞打造「每個人的 AI 健康助手」的使命,科大訊飛還依托星火醫療大模型推出訊飛曉醫 APP,在看病前、用藥時以及體檢後提供個性化的醫療咨詢服務,使用過程基本就像是咨詢一位知識極其廣博的醫生。
科大訊飛還與中國科學院文獻情報中心聯合發布了科技文獻大模型,以及相關應用級産品星火科研助手。科技文獻大模型基于專業語料庫構建,能對科技文獻進行高效地信息提取和智能化處理技術,保障文獻處理的深度和廣度,提升知識獲取效率。
依托科技文獻大模型打造的星火科研助手,将提供成果調研、論文研讀、科研寫作三大核心功能,包括論文總結、論文知識問答、論文寫作潤色等,目标是爲科研工作者打造精準高效的科技文獻助手,助力科研工作順利開展。
而除了醫療大模型和科技文獻大模型之外,科大訊飛這次還宣布聯合行業龍頭合作夥伴發布十二大行業模型,覆蓋金融、汽車、法律、工業、傳媒等十二個重要領域。
科大訊飛沒有選擇僅僅研發一個通用大模型(星火大模型),而是通過「1+N」體系基于星火大模型不斷推出覆蓋各類場景的行業大模型,其實并不難理解。
通用大模型的「大」和「通用」意味更強的泛化能力,但對于垂直領域的行業客戶,他們更需要的并不是通用大模型的「全能」、綜合技術上的碾壓,反而對模型的精度和質量有更高的要求,在具體需求上實現功能的最大化。在這個角度上,行業大模型是更好的選擇,不僅是更精準地滿足行業客戶的需求,還有更低的推理成本。
與此同時,行業大模型也能在數據、行業理解等不同維度上反哺到通用大模型,然後通過通用大模型叠代再傳導到行業大模型,實現大模型生态的正向循環。
劉聰就曾指出,「(科大訊飛)不僅要做基礎通用大模型,還要同步做落地教育、醫療、辦公場景的産品應用。『N』 的數據和場景可以更新到 『1』 裏、促進通用大模型能力叠代;『1』 的能力也能融入到 『N』 的産品應用中,實現更快地落地。」
科大訊飛研究院院長劉聰
這意味着在「1+N」的大模型體系下,科大訊飛能夠觸達更多的行業場景,獲取高質量的行業數據,由此更深入地強化星火大模型的能力,同時也會帶來更快的技術叠代速度,使得行業大模型可以更好地滿足不同領域的需求和挑戰。
幾天前,美國商務部再度收緊了高端 AI 芯片的對華出口,就算是已經削弱帶寬的英偉達 A800、H800,現在也要獲取出口許可證才能在國内銷售。早些時候的亞布力論壇夏季高峰會上,劉慶峰就指出,中國在人工智能算法方面都沒有問題,但算力似乎始終被英偉達按住。
作爲本次全球 1024 開發者節開幕式的重磅環節,科大訊飛聯合華爲發布了基于昇騰的大模型底座「飛星一号」平台。說到底,中國大模型隻有建立在中國算力底座之上,才有生生不息的大未來。
事實上,科大訊飛在星火大模型最早發布的同時就聯合華爲啓動「星火昇騰」算力生态,當時劉慶峰表示,星火大模型的升級計劃不會受到算力限制,還列出了一份叠代升級的時間表:
6 月 9 日:突破開放式問答、多輪對話能力再升級、數學能力再升級
8 月 15 日:突破代碼能力、多模态交互再升級
10 月 24 日:通用模型對标 ChatGPT(中文超越,英文相當)
星火大模型 V3.0 的發布,标志着科大訊飛完全兌現了 5 月那場發布會上給出的承諾,而這份精确到日期的時間表,一定程度上也證明了科大訊飛從研發第一天就想清楚了星火大模型的發展路徑和未來,就是在自主創新的算力底座上,通過領先的算法和數據構建世界一流的大模型。
接下來,訊飛科技将在「飛星一号」平台的基礎上,啓動對标 GPT-4 的更大參數規模的星火大模型 4.0 的訓練。正如劉慶峰所言,這并不僅僅是一個簡單的技術對标問題,而是中國大模型要走出自己的技術路線,走出自己的産業方向,形成自己的完整的生态。
作爲中國大模型的「頭雁」,科大訊飛有意願也有責任走出這麽一條大模型之路。·