商湯上海總部(圖片來源:钛媒體 App 編輯拍攝)
随着 ChatGPT 爲代表的預訓練大模型帶來新一輪人工智能(AI)熱潮爆發,繼百度、阿裏、360 之後,又一家大廠推出 GPT 大模型産品。
钛媒體 App 獲悉,4 月 10 日,AI 公司商湯科技正式發布全新 " 日日新 SenseNova" 大模型體系,以及自研的中文語言大模型應用平台 " 商量 "(SenseChat),參數量達千億,可實現文本生成、圖像生成、多模态内容生成等能力與場景應用。
商湯科技董事長兼 CEO 徐立表示,上述這些生成式人工智能(AIGC)産品将在醫療、短視頻、教育、營銷以及開發等産業領域應用落地。
商湯科技聯合創始人、首席科學家王曉剛表示,目前已經有一些合作夥伴和客戶開始内測其産品。未來,商湯版的 GPT 主要面向企業端(B2B)業務。此外,商湯 " 日日新 SenseNova" 大模型體系已全面支持了智能汽車、智慧生活、智慧商業、智慧城市等業務闆塊,而且商湯将向客戶提供涵蓋圖片生成、自然語言對話、視覺推理和标注服務等 API 接口。
事實上,自 2022 年 12 月開始,美國 OpenAI 公司推出的 AI 産品 ChatGPT 以及背後的 GPT 大模型,已經引發了一場 AI 新浪潮。
但 AI 技術的終極目标 通用人工智能(AGI)可不是誰都能獲得的。《奇點臨近》作者雷 · 庫茲韋爾曾表示,直到 2029 年,人類才有超過 50% 的概率開發出 AGI。而作爲 AI 技術積累最深厚的中國公司,如今商湯抓住了大模型這波新浪潮,以期在未來幾年内實現重大突破,從而邁向 AI 領域這顆皇冠上的明珠—— AGI 的前沿研發與商業化進程。
GPT 大模型熱潮來襲
如今,火爆全網的 AI 聊天大模型應用 ChatGPT 訪問量已飙升至 8.89 億次,它也是曆史上最快達到 1 億月活的應用,而且整個熱潮已蔓延至微軟、谷歌等很多大廠開始關注大模型。過去 40 天,大模型集中爆發,GPT-4、微軟 Microsoft 365 Copilot、Midjourney V5、Google PaLM API、英偉達新顯卡接連出場。
尤其是微軟,将 GPT-4 接入 Word、Excel、PowerPoint 等 Microsoft 365 Office 辦公套件中,即推出一款新的 AI 驅動的産品 Copilot(副駕駛),像助手一樣用 AI 幫助人們生成文檔、電子郵件、PPT 等,從而讓 AI 接入了生産力。此外,創造出 ChatGPT 的美國 OpenAI 公司還推出插件功能,實現了 "App Store 時刻 ",讓生成式 AI 真正變革了人類的生産力。
GPT-4 加持的微軟 Word 平台,支持自由編輯 AI 生成的文本
天津大學自然語言處理實驗室負責人、教授熊德意表示,從 AI 發展角度看,這是一個重要的裏程碑,其意義要高于 7 年前的 " 阿爾法狗 "。
實際上,過去 60 多年間,利用 AI 技術,智能化、數字化和人口紅利共同推動了中國工業與産業快速發展,尤其是深度學習十年間的快速進步,真正讓 AI 在很多領域突破了 " 工業紅線 ",在諸多特定的垂直場景中帶來了效率的提升。
不過,定制化 AI 模型的開發模式,依然面臨研發成本高、周期長等問題,而且現在 80% 的應用場景都是低頻的、長尾的需求,但卻面臨投入大量人力、收集巨量數據,卻不能解決小數據、小樣本等實際應用問題。
而谷歌 2017 年發布的 Transformer 框架催生了新的研究範式,即基于一個強大的多模态大模型,使整個網絡結構完全由 Attention 機制釋出,讓機器同時學習大量的文字,通過強化學習和人類反饋不斷強化大模型的學習能力,從而更高效地解決海量的開放式任務,讓 AI 實現了從 " 數據飛輪 " 到 " 智慧飛輪 " 的演進,最終邁向 AGI 人機共智。
"AI 對于開發者來說是一種模式的變化,下一步對很多内容創作者來說,一樣會面臨工作模式的巨大變化,未來人們不需要具備底層的制作能力,而是需要更多暢想、連接、協同的能力,這些能力才是跟 AI 協同共創的核心商業能力。而這種生産力模型的變革,可能會産生互聯網 SaaS(軟件運營服務)應用和工具鏈,或者基于這些工具鏈新生成的社區,也就是我們可能會擁有下一階段的‘小紅書’、B 站等一系列互聯網應用。" 商湯科技董事長兼 CEO 徐立,今年 2 月談及 ChatGPT 引發的商業産業變革時表示。
作爲 AI 行業的領頭羊,商湯科技擁有很強的技術實力和積累,能夠參與到這場大模型軍備賽當中。自 2018 年起,商湯科技便緻力于 AI 大模型的研發,有着超過 5 年的技術積澱和實踐經驗。目前,商湯已成功研發了 320 億參數量的全球最大的通用視覺模型,在自動駕駛、工業質檢、醫療影像等多個領域得到廣泛應用。
" ‘好的原材料’就是要深入到各個行業裏積累非常多的 know-how。美國公司 OpenAI 能夠把 ChatGPT 做出來,背後也有多年積累,從小模型到大模型的研發,中間積累了非常多的 know-how。" 王曉剛表示,商湯具有非常類似的優勢,内部有非常多的研發人員能深入到一線,用大模型去解決實際問題,有很好的技術積累。
王曉剛強調," 我們要擁抱全新研究範式,這裏面的關鍵是我們要轉變觀念。十年前,商湯還沒有誕生,我們創始團隊在當時做的決定就是 -All In Deep Learning(深度學習)。我們之前在傳統視覺技術裏也有較長積累,但是,當新技術來了,我們就果斷地去擁抱新技術。今天也一樣。"
實際上,本輪國産大模型競賽中,有三個能力極爲重要:算力、數據和應用場景。而在國内緻力于 To B(企業端)業務的大廠中,商湯處于第一梯隊。
商湯科技前瞻布局,既依托 SenseCore AI 大裝置,以 5000 Petaflops 超大規模算力和出色的并行計算能力,爲大模型研發提供強大的算力基礎設施,堪比芯片行業的 " 光刻機 ";同時還有數據算法和強大的産業化能力,在智慧城市、智慧商業等領域的長期耕耘,商湯積累了海量真實世界的高質量視覺數據,支持商湯在視覺技術方面的持續突破。領先的算力布局,以及豐富的視覺數據和技術積累,爲商湯多模态大模型的研發提供有力基礎。
徐立曾表示,AI 的核心是解決 " 工業紅線 " 問題,而商湯 SenseCore AI 大裝置相當于粒子對撞機,成爲業内稀缺的大模型專用基礎設施,可以解決 AI 軟件所需算力支撐挑戰——類似光刻機,解決芯片的 " 工業紅線 "。因此,如今基于 " 大模型 + 大算力 ",商湯擁有了 AGI 時代的 " 光刻機 ",成爲 AGI 和大模型時代的基礎設施服務領導者,對整個行業具有重要的應用價值和戰略意義。
" 需要好的頂層設計,很好地把原材料設計成一個體系,商湯能朝着 AGI 的目标努力。除了大裝置和基礎設施以外,還要能從算法、框架上,把整個系統設計好。" 王曉剛表示。
王曉剛稱,如今,商湯研發想要做的事情就是怎麽樣去用好這些新技術。它帶來的新範式包括人機共智,一起去創造新智慧。核心在于怎樣用好我們的這個大模型,能夠去形成正向的反饋,而不是一味地說 " 很害怕被颠覆了 "。
千億商湯大模型有何新亮點?
最近幾天,國内科技大廠的 GPT AI 大模型密集呈現,從百度的文心一言,到阿裏通義、華爲盤古和京東言犀,引發國内企業的大模型 " 逐鹿潮 "。
相對于其他大模型産品,商湯此次推出的千億大模型真正服務于 To B(企業)端客戶,而非一個被網絡調戲的工具。钛媒體 App 梳理了四大亮點和優勢,從體系、語言大模型平台,到應用場景和行業落地,打通大模型産業閉環。
首先是國内首個大模型體系。
4 月 10 日,商湯科技正式發布商湯 " 日日新 SenseNova" 大模型體系,基于數據、模型訓練以及部署的三位一體的飛輪,提供自然語言生成、圖片生成、感知模型預标注、模型研發等多種能力,并持續更新多模态大模型,同時結合決策智能大模型,是實現 AGI 的重要起點。
據悉,商湯 " 日日新 SenseNova" 大模型體系的名稱取自《禮記 · 大學》中,湯之盤銘曰:" 苟日新、日日新、又日新 ",商湯希望在模型的叠代速度及處理問題的能力上可以日日更新,不斷解鎖 AGI 更多可能。
實際上,大模型最核心的需求就是構建體系架構。而在前期,商湯前瞻性打造了人工智能基礎設施 SenseCore AI 大裝置—— 27000 塊 GPU(圖形處理器)芯片,5000 Petaflops 超大規模算力、是亞洲最大的智能計算平台之一、支持 20 個千億參數超大模型同時訓練、支持最大 4000 卡并行單任務訓練,可持續 7 天以上不間斷穩定訓練——這是國内爲數不多接近 GPT 所需算力的重要基礎設施公司。
如今,基于 AISaaS 服務架構,商湯已經打造了 CV(計算機視覺)、NLP(自然語言處理)、AIGC(人工智能内容生成)多個 AI 大模型。未來基于這些核心優勢,在 " 日日新 SenseNova" 大模型體系和 SenseCore AI 大裝置的支持下,商湯的多模态大模型持續演進,同時結合決策智能大模型,爲 AGI 的實現提供重要起點。
第二大亮點是首個自研中文語言大模型應用平台。
在 " 日日新 SenseNova" 大模型體系當中,商湯科技 4 月 10 日還推出了自研的中文語言大模型應用平台 " 商量 ",具備領先的語言理解、生成能力,将科技與人文相互交融。作爲高效聊天助手,它可以秒解複雜問題,提供定制化建議,還能輔助創作一流文本,并具備不斷學習進化的特性等。
具體來說,在用戶價值方面," 商量 " 可以實現單輪、多輪對話和超長文本理解能力,而且憑借 " 商量 " 中文語言大模型強大的長文本理解能力,幫助用戶快速通過與大模型互動來獲取知識、尋找答案;在技術能力優勢方面,商湯擁有千億參數中文語言大模型,具備問答、理解與生成等全面的中文語言能力,支持企業服務、城市管理、汽車出行等 600+ 垂直領域,并擁有邏輯推演與智能、兼具理解廣度與深度、知識自動及時更新等能力。
無論是一人一句編故事,還是連續對話能力," 商量 " 都能準确、快捷的回答出來。
此外," 商量 " 已經在行業實現了應用,尤其在醫療行業和編程領域。從現場實際 demo 當中可以看到,基于大模型應用平台,它能夠準确、快捷地回答關于腹部痛等關鍵性問題,給出醫療參考方案。
第三大亮點是生成式 AI 應用,真正爲短視頻、直播産業帶來生産力提升。
此次,商湯把 GPT 大模型應用于生成式 AI 領域,重構人與空間在數字時代的結合。商湯基于 " 日日新 SenseNova" 大模型體系,自研了包括秒畫、如影、瓊宇、格物等視頻内容的制作和生成工具平台,爲短視頻、直播産業帶來生産力的提升。
以 " 秒畫 " 爲例,其是商湯科技打造的 AI 内容創作社區平台,可幫助用戶輕松地創作高質量的藝術作品,自動生成元素和細節,并可不斷學習與提升。其中," 秒畫 " 具備超 10 億參數自研文生圖生成模型,支持二次元、三次元等多種生成風格;推理速度快,單卡支持每 2 秒生成 1 張 512 分辨率的圖片;用戶可基于單卡 A100,5 分鍾内定制屬于自己的 LoRA 模型 20 張訓練圖片;彙聚了 1 萬 + 開源模型,基于平台發布的模型可設置爲 ToB 服務 API,結合商湯大算力對外提供商業化服務,支持用戶訓練個性化繪模型,滿足不同繪畫風格需求。
" 秒畫 " 帶來個性化文生圖能力(來源:商湯)
而另一種 " 瓊宇 "、" 格物 " 3D 内容生成平台,是商湯科技基于神經輻射場技術(NeRF)的 3D 内容生成平台,分别是指瓊宇大空間 3D 内容生成應用、格物小物體 3D 内容生成應用,可基于 3D 内容生成技術實現對空間和物體的複刻與交互。傳統人工建模 10000 人 / 天的建模任務,通過 " 瓊宇 " 隻需要 2 天即可完成(算力爲 1200 TFLOPS)。
商湯表示,上述兩套平台生成的各類 3D 内容都夠進行再編輯再創作,通過海量高精度數字資産的生産,滿足影視創作、建築設計、商品營銷、數字孿生管理等各類對可交互 3D 實景内容有強烈需求的應用場景。
最後一個亮點就是獨特的行業賦能。商湯讓大模型對外提供 API 接口,以及多元化、多種大模型即服務(MaaS)。
具體來說,在 " 一平台四支柱 " 的戰略體系下,商湯 " 日日新 SenseNova" 大模型體系已全面支持了智能汽車、智慧生活、智慧商業、智慧城市等業務闆塊,打通了多個領域、行業的應用閉環。
而且,基于 " 日日新 SenseNova" 大模型體系,商湯将向客戶提供涵蓋圖片生成、自然語言對話、視覺推理和标注服務等 API 接口。客戶可根據實際應用需求,靈活調用商湯大模型的各項 AI 技術能力,低門檻、低成本、高效率地實現 AI 技術在實際業務環節中的部署,或進行二次開發,創造更多價值。
此外,基于商湯 AI 大裝置和大模型體系,商湯将面向客戶提供涵蓋自動化數據标注、大模型推理部署、大模型并行訓練、大模型增量訓練、開發者效率提升等多種大模型即服務(Model-as-a-Service),包括自動化數據标注、大模型推理部署、大模型并行訓練和大模型增量訓練服務、開發者效率提升等。
" 這絕對不隻是說訓練一個參數量非常大的模型,它是一個體系化的大工程。" 王曉剛表示。
王曉剛提及," 湧現 " 這個現象的出現意味着大模型會不斷給你驚喜,大模型能有新能力。而商湯在大模型訓練本身,以及 know-how 任務理解都有這樣的技術實力。結合自身的特點,具有通用性的商湯大模型,能夠真正去幫助客戶解決需求和問題。
" 未來,我們也是希望能夠依靠社區的力量把我們的這些模型進行調教,不隻有原始模型,還有各種各樣的這樣的一些模型存在,能夠更好的往前推進。" 王曉剛坦言稱。
大模型隻是起點,奔向 AGI 之路才是重點
對于整個 AI 技術進程來說,大模型絕對不是 AI 發展的終點,而隻是起點。
1950 年,才華橫溢的計算機科學家艾倫 · 圖靈提出了一個他稱之爲 " 模仿遊戲 " 的思想實驗。面試官通過打字機與兩個對象交談,知道一個是人,另一個是機器。圖靈建議,如果一台機器能夠始終讓面試官相信它是人類,我們就可以說它有能力思考。這就是著名的 " 圖靈測試 "。
後來的 70 年間,整個 AI 行業都爲之努力,希望打造通過 " 圖靈測試評估 " 能力的 AI 技術。如今,AI 算法、算力、數據 " 三駕馬車 " 同步突破,AI 技術已經蓄能完畢,所有人終于可以大展身手了。
作爲中國 AI 領域競争與發展的核心玩家,商湯擁有 AI 行業全棧性研發能力。
商湯科技聯合創始人、大裝置事業群副總裁陳宇恒表示,所謂的通用人工智能新的創新範式,可以極高的體現商湯現有的一些 AI 産品的模式和能力。從大的方向上,商湯作爲人工智能的頭部的企業,未來肯定還是要去挑戰更大的模型。因爲現在很明顯的趨勢就是,每一代的大模型 AI 和算力有很大的相關性。
" 下一代人工智能比上一代,比如說 GPT-4 比 GPT-3 可能是百倍級的算力的需求,甚至它的參數量是十倍以上的需求,對應也需要更多的數據去完成訓練。所以要不斷地去接近所謂的通用人工智能或者 AGI 的路線上,肯定是要把基礎的超大模型越做越大。這是未來 2 到 3 年,整個無論從學術界還是從工業界,還是從我們自己的對 AI 的理解上,都是比較明确的方向。" 陳宇恒表示。
此前,商湯科技發布了 2022 财年報告。
财報顯示,2022 年,商湯研發支出達 38 億元人民币(扣除以股份爲基礎的薪酬開支),同比增長 24%,2018 年至今累計研發投入達 128.47 億元;人均每年研發模型數相較于 2021 年進一步提高了 90%,累計生産的商用模型數提高了 93%,至 6.7 萬個。
當中國大力發展 AI 技術的重要時機下,商湯大量投入技術研發,不斷推進數字化、智能化、産業化升級,符合科技創新下的時代特征,如今,商湯高強度的研發投入正在開花結果,在國内大模型軍備賽中實現了第一梯隊的飛躍,成爲行業極稀缺的 " 頭雁 "。
英偉達 CEO 黃仁勳曾表示,當下 " 我們正處于 Al 的 iPhone 時刻 "。而商湯,也正在迎來屬于自己的 "iPhone 時刻 "。
"AI 是生産‘生産力工具’的工具,它将開啓軟件開發新範式,把我們帶入‘新二八定律’的時代,80% 的工作由機器完成,20% 的工作由人來做。" 徐立認爲,持續的大規模技術投入帶來創新,再有商業模式發展,這是一條罕有人走的路。商湯始終堅信 AI 技術變革帶來增量價值,必将推動普惠和公平的智能時代到來。(本文首發钛媒體 App,作者|林志佳)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App