科大訊飛董事長劉慶峰
钛媒體 App 獲悉,2024 年 1 月 30 日下午,人工智能(AI)上市公司科大訊飛(SHE: 002230)董事長劉慶峰正式發布首個基于全國産算力訓練的全民開放大模型——訊飛星火認知大模型 V3.5(以下簡稱 " 訊飛星火 V3.5")版本。
劉慶峰表示,相比 3.0 版本。此次發布的訊飛星火 V3.5 在文本生成、語言理解、知識回答、邏輯推理、數學能力、代碼能力、多模态能力這七大能力上均全面提升,分别提高 7.3%、7.6%、4.7%、9.5%、9.8%、8%、6.6%。
" 今天我們正式發布的訊飛星火 3.5,既是對科大訊飛在通用 AI 領域核心技術和創新能力的一次展示,同時也是對我們國産算力平台能否支撐起未來大模型研發的一次非常重要的檢驗。" 劉慶峰表示,訊飛星火 V3.5 不僅在各項能力中越來越逼近全球最好的 GPT-4 Turbo 水平,而且在語言理解、語言理解、數學能力上超過了 GPT-4 Turbo,代碼達到 GPT-4 Turbo 的 96%。
劉慶峰強調,中國發展通用 AI 是 " 勢在必幹 " 的事情,絕不能隻用開源模型做應用落地,将來随時随地會被别人 " 死死的給你掐住 "。
值得注意的是,劉慶峰在會上反駁了 360 董事長周鴻祎的看法,他直言中國需要建立創新生态,絕不是說 " 今天的大模型像‘茶葉蛋’一樣,已經成了一個不值錢的東西 "。
" 能夠真正對标美國最先進的 AI 大模型,全中國将來沒有幾個,我希望訊飛星火一定是其中之一,而且我們希望能夠自我期許也好,我們的目标也好,一定要走在前列、走在最前面。" 劉慶峰稱。
據悉,随着基于 AI 大模型(LLMs)的聊天機器人産品 ChatGPT 風靡全球,2023 年 5 月,科大訊飛公司正式發布訊飛星火大模型 1.0 版本,成爲國内首批亮相的大模型産品;去年 9 月,訊飛星火大模型獲得備案批準,正式對外開放使用;如今,經過 269 天、5 次重大技術叠代,科大訊飛讓其産品的技術能力對标美國 OpenAI 公司的 GPT-4.0 Turbo。
1 月 29 日晚,科大訊飛發布的 2023 年度業績預告顯示,該公司預計 2023 年實現營業收入超過 200 億元,同比增長約 7%;實現歸母淨利潤 6.45-7.3 億元,同比增長 15%-30%;實現扣除非經常性損益後的淨利潤 8000 萬元 -1.2 億元,同比下降 71%-81%;截止 2023 年底,該公司經營性現金流量淨額超過 3 億元。
這是科大訊飛繼 2022 年歸母淨利下滑 63.94% 之後再次迎來回升。不過,其營收增長仍然是個位數。
此次發布會上,科大訊飛主要公布訊飛星火 V3.5 的四個部分的技術産品:
C 端的訊飛星火大模型平台的情感語音訊飛友伴、可以做 PPT 的訊飛智文、教師 AI 助手的星火智慧黑闆、音視頻創作的訊飛智作、圖文創作的星火内容運營大師等應用全面升級,以及賦能訊飛聽見、訊飛星火等如那件;
B 端的國産算力平台;在保險、運營商、電商、能源等領域的賦能應用,以及全棧自主可控的星火優化套件;
硬件端:基于全新訊飛語音大模型的訊飛翻譯機、訊飛智能本、訊飛錄音筆的 AI 能力全面提升;
訊飛星火開源大模型首次發布,以及星火開源 -13B(13 億參數)與華爲昇思開源社區聯合首發上線。
首先是 To C 消費端,劉慶峰透露,目前訊飛聽見用戶量達到 6500 萬人,訊飛星火用戶量達 2400 萬人,訊飛輸入法用戶量達 1.4 億人次,訊飛智能本和錄音筆已累計有超過 60 萬用戶、後台能力調用量共計達 650 萬次。
他認爲,全新的訊飛星火 V3.5 大模型可以做到 " 人機完全自然 " 的對話,它可以賦能整個萬物智聯時代,開始進入到每個人的生産生活中。在語義理解、拟人合成等方面,訊飛星火 V3.5 已經超過了 GPT-4 Turbo 水平,而多輪對話、情緒感知等方面還在快速跟進中。" 我們訓練時間還短,我們非常有信心,今年上半年還會有非常大的提升。"
語音方面,劉慶峰還發布了全新訊飛語音大模型,即日起面向開發者正式開放。據悉,訊飛語音大模型基于大語言模型框架,結合訊飛多維度語音屬性解耦表征進行預訓練的,在多語種語音識别中,首批 37 個主流語種效果超過了 OpenAI Whisper V3 語音模型;超拟人語音合成中,拟人度達到 83% 以上,基本達到與 ChatGPT 同等水平。另外,訊飛語音大模型還将賦能在訊飛翻譯機、訊飛智能本、訊飛錄音筆等硬件産品中。
其次是企業端,劉慶峰表示,星火大模型正在加速賦能保險、運營商、電商、能源等各行業頭部企業客戶,目前大模型總開發者數達 35 萬,企業開發者數量達 22 萬,客戶數量超萬家,包括華爲、交通銀行、中國移動、奇安信、韻達、平安科技等企業。
" 華爲徐直軍說過,我們不僅用科大訊飛的中文,而且全世界語種都使用科大訊飛。今天會讓語音大模型進一步賦能,星火大模型會讓賦能更透徹、更徹底。" 劉慶峰指出,從數字勞動力到代碼,從汽車到大型央國企管理,星火大模型全面賦能,而且通過全棧自主可控的星火優化套件,加速企業大模型的應用落地。
劉慶峰表示,全鏈條工具鏈可以支撐星火行業大模型高效構建,訓練提效 90% 以上。同時,千億通用大模型訓練成本大概在 1200 萬 -1500 萬美金,萬億模型約 6000 萬美金。而利用訊飛星火優化套件,可以将通用大模型訓練成本降低 5-10 倍以上。另外,在 13B/65B/175B 等多尺寸方面,訊飛星火支持異構算力調度。
最後是開源模型,科大訊飛今天正式推出基于國産算力的 " 訊飛星火開源大模型 ",包括 iFlytekSpark-13B-base、Lora、chat、Charater 四款。
劉慶峰稱,這是針對國産生态的開源 13B 模型版本,希望開源以後能夠增進學術合作,推動産業的聯合創新。與同尺寸第三方開源大模型相比,星火開源大模型效果要領先 20%,文本生成、語言理解、文本改寫、行業問答、機器翻譯等領域要比行業領先,在多個公開榜單中名列前茅。
對于國産算力,劉慶峰稱,基于科大訊飛發布的首個支撐萬億參數大模型訓練的國産算力平台 " 飛星一号 ",通過帶寬利用率提升、并行訓練算法優化等方面,在華爲 910B 芯片上,訊飛星火模型訓練實現了英偉達 A100 的 90% 的算力能力,而且在部分專用能力領域甚至超越(英偉達)。
" 訊飛星火 V3.5 能力的提升,已經達到了量質齊飛的關鍵點。" 劉慶峰表示,2024 年訊飛星火認知大模型的應用,一定會在越來越多的場景和領域中大放異彩。
展望 2024 年,劉慶峰表示,中國必須要發展通用 AI 技術。這既決定了産業鏈安全,也決定了國家安全。如果中國沒有大模型,工業、民生以及科研等各個專用領域都會極大地落後于世界,而中國又有條件,是全世界唯一的能夠成爲 " 智慧湧現 " 第二極的。中國沒法用英偉達、谷歌、微軟的算力,隻能靠自己。
" 當然,2024 年我們依然在通用大模型的底層能力上持續對标國際最先進水平,我們要看到差距。盡管我們目前跟 GPT 水平還有差距,但我們有信心,今年上半年我們就趕上現在的水平。可是我們一定要知道,人家也在訓 4.5、5.0,你趕上了,它又有新的版本出現了,所以一定要預判下一個階段。科大訊飛既要有決心堅定不移地持續對标,同時也要從算法研究、更小的算力等方面能做出相對更優的效果,這都将是我們 2024 年非常重要的研究方向。" 劉慶峰指出。
劉慶峰表示,結合科大訊飛在語音技術上的優勢,公司有信心星火大模型是全世界最好的,而且行業應用 " 我們一定要實現超越 ",另外也要構建完全自主可控的一個繁榮的通用人工智能生态。
劉慶峰強調," 我們需要頂天立地的長期主義精神,頂天就是我們希望源頭核心技術在底層的大模型能力上,一定要向國際世界最先進的能力看齊,立地要能夠大規模産業化。"
" 我覺得,2024 年一定可以實現‘星火燎原’。通用人工智能不僅能夠在中國各大領域深度且廣泛的應用,而且我們在源頭技術創新、大模型的底層能力上會再上全新的台階。" 劉慶峰在結尾表示。
(本文首發钛媒體 App,作者|林志佳)