國産 ChatGPT 之戰,已然是大步邁進白熱化階段。
就在剛剛,商湯正式發布自研類 ChatGPT 産品,名曰商量(SenseChat)。
單單是這個名字,便值得說道一番。
商量的 " 商 ",不僅體現了它是商湯自家 " 商字輩兒 " 的産品;從整體來看,更是具有商讨、交換意見的味道。
畢竟我們在使用類 ChatGPT 産品過程中,恰巧就是一種人機協同的過程:不應是一味的問與答,而是通過引導等方式讓輸出結果趨于理想。
在商量的背後,所依托的是商湯自研的千億參數自然語言處理模型。
而在此模型的背後,則是商湯最新推出的日日新(SenseNova)大模型體系。
也正是因爲這種的能力,商湯的發布還不同于此前國産類 ChatGPT 玩家,它一口氣還發布了:
秒畫:AI 内容創作社區平台。
如影:AI 數字人視頻生成平台。
瓊宇、格物:3D 内容生成平台。
更重要的一點是,根據商湯 CEO 徐立在現場的描述,上述這些 AIGC 産品所要發力之處,将是諸如醫療、短視頻、教育、營銷以及開發等産業領域。
但不得不說,這一波科技之戰,着實是愈演愈烈了。
" 商量 " 的體驗實錄
那麽商湯的 AIGC 産品,效果又是如何?
我們在前方現場也體驗了一下。
先來看下商量這款産品,是否真的能做到商量。
多輪對話能力展示
既要多輪對話,又要人機共創,那麽和它商量着創作一個故事,便是很好例子:
我們來一起創作兒童故事吧。規則是我先說一句,你再說一句,交替進行。直到我說故事編完了就結束。你明白了麽?
在我們下達指示之後," 商量 " 表示了理解,然後就開始了 " 你一句我一句 " 人機共創故事的之旅:
人類:小花是一隻小貓咪,他很喜歡釣魚。
商量:小花在河邊釣魚,他釣到了一條大魚。
人類:大魚對小花說,請你放我回去吧,我家裏還有小魚在等着我呢。
商量:小花心地善良,他同意了大魚的請求,把大魚放回了河裏。大魚感激地遊走了,小花也繼續享受着的釣魚的樂趣。
從這個過程中不難看出," 商量 " 是可以理解用戶的語義,了解故事中的角色和關系,并且能夠 get 用戶的思路,基于此以多輪對話形式來完成故事的創作。
(要是讓小朋友們跟 " 商量 " 一起創作故事,怕是能玩上一整天吧。)
不僅如此,在體驗過程中,我們還發現 " 商量 " 是具備一定共情能力的。
例如當我們處于迷茫之際,可以向它提問:
如何提高自我認識,更好地了解自己?
此時的 " 商量 " 仿佛可以抓住問題背後人類内心真正的需求,回答中的 " 學會愛自己 "、" 學會自我肯定和鼓勵 ",顯得格外暖心。
當然,多輪對話僅僅是對話機器人能力展示的一隅。
接下來,我們就要拿網友們經常調侃 AI 的諸多問題,來開啓更高難度的挑戰了!
隻認事實,不認 " 老婆說的都對 "
當然,創作能力是聊天機器人能力的一面,但對于事實的尊重也是非常重要的一點。
對于此前被網友們玩壞的 " 老婆說的都對 "," 商量 " 又會如何應對?
嗯,老婆在事實面前是真的不好使了。
我們再來一個更天馬行空的胡謅:
請告訴我以下陳述是否包含時代錯誤:在盟軍轟炸硫磺島海灘期間,拉爾夫大聲地對着自己的 iPhone 說話。
" 商量 " 面對這麽一句胡謅,直接指出了 iPhone 與二戰的時代背景不符,可見其不僅能理解句子的意思,還能通過嘗試判斷句子的合理性。
那麽對于非常繞的邏輯問題," 商量 " 是否也能輕松應對?
請聽題目:
假設 False 與 True 是 False,則 True 與 not False 是?
講真,人類都得思忖半天的 " 繞彎問題 "," 商量 " 不僅能夠秒出結果,還能把推理過程一并給出。
超長文本也能 hold 住
正如我們剛才提到的," 商量 " 是一個 To B 的産品,那麽它定然需要解決的問題不是 " 片段性 " 的。
爲此,商湯在現場還演示了基于 " 商量 " 背後的大模型,開發了幫助用戶進行新知識獲取和理解的助手工具,是可以輕松 hold 住超長文本的那種。
例如把一本《專利法》投喂給它,我們就可以向它咨詢很多專業性的問題了:
什麽樣的東西可以申請專利?
從結果上來看,這個工具并不是直接從《專利法》中 copy 對應的結果,而是模型理解了問題之後,生成并總結了答案。
基于這樣的能力,以後我們在工作上的效率提高程度,可見一斑。
不僅如此,剛才我們投喂的《專利法》是 2020 年的版本,而今年國家知識産權局就專利申請是提出過新的要求的。
從我們提問 " 今年規定有沒有新的變化 " 的回答中不難看出,模型确實融合了最新的資訊,并給出了合理的答案。
再如同樣是基于大語言模型,商湯面向開發者所打造的AI 代碼助手,可以提供代碼補全、注釋生成代碼、測試代碼生成、代碼翻譯、代碼修正、代碼重構、複雜度分析等功能。
據了解,AI 代碼助手可以同時支持中英文及多種編程語言,并且可以快速适應開發者的個性化編碼風格。
從根據商湯内部測試的結果來看,在使用 "AI 代碼助手 " 後,代碼編寫效率可以提升 62%,Humaneval 測試集一次通過率可以達到 40.2%。
馬斯克中國遊記,2 秒鍾就能搞定
除了對話機器人之外,商湯 AI 作畫産品 " 秒畫 " 也是本次發布的一大亮點。
話不多說,直接上效果。
我們同樣是先來看看被網友們玩兒壞了的一個 Prompt:
中國 80 年代,馬斯克在河南的農村,穿着當時年代的中國服裝。
嗯,是有那個味道了。
而且更爲關鍵的是,生成 512K 圖片僅需 2 秒鍾!
不僅如此,商湯在現場演示的過程中,還展示了逼真效果版的港風美女。
同樣是 2 秒出圖,引得現場觀衆 " 哇 " 聲一片:
那麽除了這種趣味性的以文生圖," 秒畫 " 的作品是否能夠達到在産業中的應用水平?
我們繼續試驗:
明亮的場面,鳥瞰圖,中國古代城市,水晶,魔幻,幻想,華麗的光作用,透明度,鏡面反射,華麗的光,錯綜複雜的細節,精細的紋理,超現實,單反攝影,廣角鏡頭,照片,現實,鋒利的焦點,超鋒利。
不得不說,如此恢宏壯麗的景象,是把想象拉進現實的那種了。
若是想生成與太空探索主題相關的高清大海報,這個也可以有,隻需把這句話投喂進去:
一艘閃閃發光的飛船繞着一顆巨大的氣态巨行星的月球旋轉,在天空中盤旋着雲,飛船在月球前氣态巨行星前,美麗的科幻藝術,超現實的白日夢。
不難看出," 秒畫 " 是經得住考驗的那種 AI 了。
除了以文生圖之外,我們再來看下 AI 數字人生成平台。
據了解,商湯的 " 如影 " 僅需要 5 分鍾真人視頻素材,就可以生成出聲音及動作自然、口型準确、多語種精通的數字人分身。
再如 " 瓊宇 " 和 " 格物 ",基于神經輻射場技術(NeRF),可以高效低成本生成大規模三維場景和精細化的物件,爲元宇宙、虛實融合應用打開新的想象空間。
由此可見,商湯的 AIGC 能力已然是做到了全面覆蓋,并且水平也是肉眼可見的達到了可以 " 上崗 " 的水平。
那麽接下來的一個問題是:
怎麽煉成的?
背後的日日新大模型,便是煉成 " 商量 "、" 秒畫 " 等一衆 AIGC 産品的殺手锏。
日日新,顧名思義,是指模型的叠代速度及處理問題的能力上可以日日更新,不斷解鎖 AGI 更多可能。
(取自《禮記 · 大學》中湯之盤銘曰 " 苟日新、日日新、又日新 ")
從現場展現的能力來看,日日新大模型能夠提供的能力,主要集中在了自然語言處理、圖片生成、自動化數據标注、自定義模型訓練等。
但日日新大模型并非是趁着這一波 AIGC 大熱潮,一蹴而就出現的那種。
其實早在五年前,商湯便已經在大模型領域着手研發。
并且在 2019 年,商湯便使用上千張 GPU 進行單任務訓練,推出了 10 億參數規模的視覺模型,并實現了當時業界最好的算法效果。
後來在 2021 年到 2022 年期間,商湯訓練并開源了 30 億參數的多模态大模型——書生。
就目前來看,商湯已經成功研發了 320 億參數量的全球最大的通用視覺模型;并且已經打造了 CV、NLP 和 AIGC 相關大模型。
因此,不難看出商湯此次發布的超大模型體系,其實是早有所準備,通過五年來的各項 " 小作業 ",融會貫通并提交了一項 " 大作業 "。
值得一提的是,在此次發布會中,商湯表示 " 日日新 " 将提供多種靈活的 API 接口和服務,包括圖片生成,自然語言生成,視覺感知通用任務與标注服務!
……
但有一說一,多模态和決策智能大模型,并非是商湯通往通用人工智能(AGI)的唯一殺手锏。
大模型時代,大算力更爲重要
沒錯,商湯自己的超強算力,正是另一項更爲關鍵的因素。
它便是于 2022 年 1 月交付使用,首付 56 億元,一舉成爲亞洲最大的 AI 超算中心之一的人工智能計算中心(AIDC)。
一年之前,商湯 AIDC 的總算力便已經是 3740 Petaflops,如此算力之下,已經可以完整訓練萬億參數規模的大模型。
時隔一年,現如今,這個算力數字已然是翻了個小翻,達到了 5000 Petaflops!
它可以以最大 4000 卡規模集群進行單任務訓練,并可做到七天以上不間斷的穩定訓練。
△商湯科技 AIDC 展廳中的裸眼 3D 展示
但了解商湯的朋友都知道,這個 AIDC 還僅是商湯 AI 大裝置 SenseCore 的一部分。
除了 AIDC 這個算力層之外,加之數據層和模型層兩大維度,便構成了 " 三位一體 " 的 AI 大裝置。
因此,綜合來看,商湯在通往 AGI 道路上的範式,便是 " 大模型 + 大算力 "。
而如此布局的背後,在今天的發布會中,商湯對此的邏輯思考也逐步浮出水面,AGI 時代之下,數據、算法和算力三要素有了新的需求:
計算量(GPU 數量 x 運行時間 x 并行效率 )= 模型參數量 x 處理數據量。
怎麽理解?
模型參數量要足夠多,才能實現 AI 智慧的湧現,而這也帶來了對算力的劇增,需要更高的并行效率,才能有效支持大參數模型訓練。
數據方面,高質量自然語言數據逐漸稀缺,而視覺數據相較自然語言在數量、質量、容納信息等方面有多種優勢,能夠使得 AI 更好地理解世界。
由此,就不難理解商湯如此布局的原因了。
總而言之,有大數據、有大模型、有大算力,商湯在國産 AIGC 的亮相,一點也不意外。
是值得期待一波了。