多知網 5 月 22 日消息,近日,在第七屆世界智能大會上,國家超級計算天津中心正式發布打造天河 E 級智能計算開放創新平台和天河天元大模型。
據介紹,國家超算天津中心搜集整理了網頁數據、各種開源訓練數據、中文小說數據、古文數據、百科數據、新聞數據以及專業領域的中醫、醫藥、問診、法律等多種數據集,訓練數據集總 token 數達到 350B,訓練打造了自己的中文語言大模型——天河天元大模型。
同時大模型還在持續訓練和完善中,并在此基礎上啓動深度訓練面向醫療、工業、法律等領域的專業模型。
據悉,天河 E 級智能計算開放創新平台将帶來突破百億億次的跨模态的超級計算算力,支撐傳統的科學工程計算,并服務智能混合計算,打造全方位的算力賦能創新和數字經濟高質量發展載體。