【CNMO 新聞】近日,CNMO 了解到,華爲公司将發布一款直接對标 ChatGPT 的多模态千億級大模型産品,名爲 " 盤古 Chat"。預計華爲盤古 Chat 将于今年 7 月 7 日舉行的華爲雲開發者大會 ( HDC.Cloud 2023 ) 上對外發布并内測,産品主要面向 ToB/G 政企端客戶。
華爲
這意味着,在國産大模型軍備競賽中,繼阿裏、百度之後,又一重要科技巨頭入局。基于華爲的技術能力,盤古 Chat 有望成爲國内技術能力最強的 ChatGPT 産品之一,同時華爲生态産業鏈企業也将因此受益。
相關報道
據悉,盤古大模型于 2020 年 11 月在華爲雲内部立項成功。對于盤古大模型定位,華爲内部團隊确立了三項最關鍵的核心設計原則:一是模型要大,可以吸收海量數據;二是網絡結構要強,能夠真正發揮出模型的性能;三是要具有優秀的泛化能力,可以真正落地到各行各業的工作場景。
此外,CNMO 了解到,與其他廠商相比,華爲的優勢或在于擁有完整的産業鏈和較強的算力調配能力。據浙商證券此前披露,在訓練千億參數的盤古大模型時,華爲團隊調用了超過 2000 塊的昇騰 910 芯片,進行了超 2 個月的數據訓練能力。華爲内部稱,每年大模型訓練調用 GPU/TPU 卡超過 4000 片,3 年的大模型算力成本高達 9.6 億元人民币。
值得一提的是,由于盤古大模型擁有超大規模的參數,因此訓練成本較高,但在中文語言的處理方面具有很高的準确度和質量。