7 月 6 日下午,瀚博半導體在 2023 世界人工智能大會上正式發布第二代 GPU SG 100。
一并推出的還有南禺系列 GPU 加速卡 VG1600、VG1800、VG14 以及 LLM 大模型 AI 加速卡 VA1L、AIGC 大模型一體機、VA12 高性能生成式 AI 加速卡等 6 款新品,爲 AI 大模型、圖形渲染和高質量内容生産提供完整解決方案。
本次發布會以 " 智渲同芯,共生未來 " 爲主題,瀚博半導體創始人兼 CTO 張磊在發布會上發表了《從像素到傑作:國産芯片加速 AI 大模型和元宇宙》主題演講,吸引衆多行業夥伴、知名媒體以及投資機構到場。
張磊以 AGI 時代的算力需求與挑戰爲引,全面展示了瀚博針對人工智能與元宇宙行業的最新産品研發成果,此次瀚博半導體新品發布會賦能大模型創新應用,聯合上下遊企業共同打造國産大模型生态圈,以全新姿态把握時代機遇,開啓人工智能 + 元宇宙的瀚博算力序章。
第二代 GPU SG100: 集渲染、AI、視頻于一體的 7nm 全功能 GPU
瀚博此次重磅推出了集成高性能渲染、超低延時 AI 和強視頻處理能力的 7nm 全功能 GPU 芯片産品 SG100。
△瀚博第二代全功能 GPU 芯片 SG100
瀚博 SG100 芯片采用 7nm 先進制程,具備業界領先的渲染性能,同時兼具低延時高吞吐的 AI 算力和強大的視頻處理能力。
搭載瀚博自研 GPU 軟件棧,業界一流的 SR-IOV 硬件虛拟化技術,支持 Windows/Linux 下的 DirectX 11、OpenGL、Vulkan 等 API 接口,支持 H.264、H.265、AV1 等多種視頻編解碼格式,可廣泛支持數字孿生、數字人、雲桌面、雲手機、雲遊戲、雲渲染、工業軟件等多領域應用,助力打造元宇宙産業算力底座。
演講中,張磊也通過實際案例展示了瀚博産品基于 Windows/Linux 下的渲染實例效果、教育雲電腦、工業軟件、多路高畫質雲遊戲以及超寫實數字人等應用場景,爲現場觀衆直觀展示了瀚博第二代全功能 GPU SG100 的強大算力。
南禺系列加速卡:智渲一體 全面覆蓋雲端及桌面應用
發布會上,瀚博也針對不同的應用場景推出了三款南禺系列全新 GPU 加速卡産品。
三款新品分别針對雲遊戲、雲桌面與工作站提供相應算力支持,也爲高質量内容生産提供了高效的算力支撐。
此次最新發布的南禺系列 GPU 加速卡 VG1600 完美結合渲染與視頻處理,打造出沉浸式雲遊戲體驗,爲玩家創造更真實的遊玩場景。
其次,VG1800 也爲遠程工作帶來全面升級,可流暢支持各類辦公軟件、教育 APP 和工業設計軟件等,提供出色的雲桌面用戶體驗。
更有支持 Windows 操作系統下 DirectX 與 OpenGL 等 API 接口的國産工作站顯卡 VG14,能夠勝任多任務處理、大型專業軟件運行等多元辦公場景。
△瀚博南禺系列 GPU 加速卡
LLM 大模型 AI 加速卡及一體機方案:大模型應用最低門檻
今年,以大模型等應用爲典型代表打開了人工智能的廣闊前景。未來,具有并行計算能力的 GPU 芯片作爲大模型計算的 " 大腦 " 将爲大模型生成學習提供源源不斷的算力支撐。
針對大模型時代算力需求,瀚博本次首發了 LLM 大模型 AI 加速卡 VA1L,具備 200 TOPS INT8/72 TFLOPS FP16 算力,并支持 ChatGPT、LLaMA、Stable Diffusion 等主流 AIGC 網絡模型。
△瀚博 LLM 大模型 AI 加速卡 VA1L
與此同時,瀚博更重磅推出 AIGC 大模型一體機,共使用 8 張 LLM 大模型 AI 加速卡 VA1L,支持 512GB 顯存,進而支持 1750 億參數的大模型。
本次大模型一體機解決方案擁有業内最低門檻,也是目前針對 AI 大語言模型最低價格的大模型一體機方案。
此外,新品還提供兩個特殊選配:具有對話功能的 2 卡單獨運行語音轉文字或者文字轉語音版本以及使用 SG 100 做雲端實時渲染的 2U 11 卡版本,提供大模型會話數字人實時渲染,使大模型推理更高效,服務于大模型行業發展。
△瀚博 AIGC 大模型一體機方案
發布會上,張磊也爲觀衆展示了 AI 大模型 " 智能對話 "、" 文生圖 " 等應用示例,生動展現了瀚博大模型新品支撐的廣泛應用場景。
VA12: 高性能生成式 AI 加速卡
針對生成式 AI 應用和其他通用 AI 應用,瀚博本次也推出全新高性能智能加速卡 VA12。
作爲 250W 闆卡,VA12 有 512 TOPS 的 INT 8 的算力和 160 TFLOPS 的 FP16 算力,更高效支持 StableDiffusion。
與此同時,作爲瀚博 VA1 和 VA10 的升級版,VA12 也是一塊通用 AI 加速卡,支持檢測、分類、分割、視頻增強、語義理解、BERT、Transfomer 和視頻編解碼等應用。
VA 12 的發布将爲未來 AIGC 平台的發展構築算力底座,讓未來的數字内容生産擁有更高效的計算能力與更多元的可能性。
△瀚博 VA 12 高性能生成式 AI 加速卡
集結生态夥伴 攜手生成未來
生态構建一直是瀚博持續發展與進步的重要推力。發布會上,瀚博也公開了目前與業界多家行業資深企業的合作情況。
目前,瀚博已與多家行業頭部合作夥伴在雲遊戲、雲桌面等領域開展深度合作。
在雲遊戲市場,瀚博半導體正在和騰訊先鋒雲遊戲展開合作,探索高密度、低延時、高質量的安卓遊戲方案。
瀚博也正在與元境探索安卓遊戲解決方案,探索高品質、低延時、易上手的雲遊戲解決方案,爲玩家帶來全新體驗。
此外,瀚博半導體也正在與 Ampere、浩辰、麒麟軟件、統信、Unity、中望軟件等合作夥伴開展深入合作,共建 GPU 産業生态。
随着大模型技術的不斷發展和應用,GPU 行業也将迎來更多的機遇和挑戰。
瀚博半導體本次新品發布将持續助力更多 AIGC 應用,進一步拉低文字、圖像、視頻等創作優質内容的生産門檻,讓更多人享受大模型時代的科技進步成果。
秉承着 " 爲數字與像素世界提供浩瀚算力 " 的願景,瀚博未來也将基于兩代 GPU 芯片系列,以 AI、渲染、視頻三大産品線爲核心,持續與各領域開展深度合作,提供豐富的算力支持與解決方案,以智渲一芯的瀚博算力,與業界夥伴共創浩瀚未來。
關于瀚博
瀚博半導體是一家自研高端 GPU 芯片及解決方案提供商,成立于 2018 年 12 月,注冊地在中國上海。
公司秉持 " 爲數字和像素世界提供浩瀚算力 " 的使命和願景,潛心研發核心技術,勵志成爲紮根中國、服務世界的高端 GPU 芯片公司。瀚博目前擁有兩代 GPU 芯片系列,并衍生 AI、渲染、視頻三大産品線。
基于 VUCA 統一計算架構,瀚博在 2022 年量産了基于第一代芯片的雲端通用 AI 及視頻加速卡系列産品,并已于 2023 年 4 月量産基于第二代 7nm 全功能 GPU 芯片的産品系列。
瀚博憑借前沿的自主原創架構、強大的軟硬件融合開發能力以及豐富的設計研發經驗創造出高質量的 GPU 産品,賦能人工智能與元宇宙兩大産業,助力大模型與生成式人工智能、智算數據中心、智慧工業、車路協同、數字孿生、渲染工作站、工業軟件、雲手機、雲電腦、雲渲染等應用場景落地。
* 本文系量子位獲授權刊載,觀點僅爲作者所有。
— 完 —
量子位 QbitAI
վ ' ᴗ ' ի 追蹤 AI 技術和産品新動态
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~