3 月初,一家互聯網公司找到西安未來人工智能計算中心 COO 張雲鵬,點名就要 60P(1PFLOPS 等于每秒一千萬億次的浮點運算)的算力,時間是三個月。
這家公司算了一筆賬:使用西安未來人工智能計算中心的昇騰算力,每 P 算力的價格是單月 1 萬元人民币,而如果使用雲服務商相同規模的 GPU 算力,成本大概要 10 萬元,足足有十倍的差距。
相似的場景在各處算力中心上演,ChatGPT 的火爆引起了連鎖反應,誰也不想錯過這一波大模型熱潮,入場的首要條件便是足夠的算力。
企業對算力的需求不隻是性價比,更突出的問題是,國内人工智能生态與海外還有不小的差距,如何把國産算力用起來,這是國内企業面臨的緊要事項。
西安未來人工智能計算中心
钛媒體 App 實地探訪了西安未來人工智能計算中心,該中心以昇騰軟硬件爲基礎,與單純的數據中心不同,西安未來人工智能計算中心不隻提供算力服務,也向上延伸至應用孵化、産業聚合、人才培養等,同時結合了本地特色産業,初步打造出有陝西屬性的人工智能産業生态。
人工智能的生态競争
ChatGPT 爲什麽沒有誕生在中國?這是國内人工智能從業者近期被問到最多的問題。
對于中國企業來說,ChatGPT 的工作量和成本并不是不可接受,無論在架構還是在方法上,ChatGPT 與以前的大模型沒有本質區别。
然而就是不斷提升數據量和模型參數量,一種目前不可完全解釋的現象誕生,ChatGPT 能自動學習知識,還能夠在一定的引導下完成較爲複雜的推理能力,所有這些新能力都并不是最初訓練的目标,這種現象被研究人員稱之爲 " 湧現 "(Emergence)。
一個較爲公認的觀點是,ChatGPT 不是 OpenAI 一家公司的成功,在算力、算法、數據等不同環節,衆多公司構成了一個龐大的人工智能生态,量變引起質變,使得大模型有了 " 湧現 " 的基礎。
歸根究底,人工智能的競争是生态的競争。
産業清晰地認知到,國内人工智能生态存在現實的挑戰,過去的生态以西方爲主導,很多創業公司都曾在産品 PPT 上 " 吊打 "英偉達,但生态層面還有很大的追趕空間。
對于很多科學研究人員及企業研發人員來說,算力仍然是一個 " 奢侈品 ",昇騰的做法有借鑒意義,在商業化并不緊迫的場景,有時間和空間不斷打磨産品的科研領域,國産算力可以做到端到端的優化,從而爲自己找到立足的根基。
據西北工業大學教授、博導,長江學者張偉偉介紹,西鹹新區樞航空科技有限公司與華爲合作,在 AI 複雜流場預測、多源信息智能融合以及智 AI 計算流體力學方向取得創新性成果,用于輻射和推廣華爲布局的國産智能芯片、智能超算以及基礎軟件。
國産大飛機 C919 研制和試飛階段,智能流體力學模型就發揮了重要作用,人工智能爲流體力學的發展提供了一種新的研究範式,而流體力學反過來也爲人工智能的發展提供了一個足夠複雜的研究對象。
華爲昇騰營銷總經理張嘉偉則表示," 我們也想構建自己的創新領先的人工智能産業生态,昇騰就是做好底下的根,做好這個産業生态,讓産業生态能夠孕育出 ChatGPT,讓它發生在中國、根植在中國。"
從算力,到應用
西安未來人工智能計算中心于 2021 年 5 月正式啓動建設,建設周期近四個月,于 2021 年 12 月 31 日正式上線運營,一期包含 AI 算力 300P、HPC 算力 8P,主要爲内置數千顆昇騰 910 AI 處理器的華爲 Atlas 900 AI 集群,單櫃功率 50KW,采用了液冷加風冷的散熱方式。
華爲
一般數據中心以通用算力爲主,人工智能算力中心則在近兩年遍地開花,城市競相建設智算中心,核心就是人工智能産業需求的驅動,起到 " 一業帶百業 " 的效果。
西安未來人工智能計算中心的 AI 算力規模,在全國範圍也屬于第一梯隊,據了解,目前西安未來人工智能計算中心算力使用率爲 98.5%,北京深圳等地均有企業使用該中心算力。
以計算流體力學(Computational Fluid Dynamics,CFD)中的算力消耗爲例,一個發動機葉片的仿真需要 1000 核計算 1 周的時間,當前的算力平台顯然無法支撐發動機全量的仿真計算,而建設一個這樣的算力平台,可能需要一兩年甚至更長的時間。
西安未來人工智能計算中心的特點可以歸納爲 " 政 - 産 - 學 - 研 - 用 ",政府投資建設算力中心,培育人工智能産業,企業、科研院所和高等院校合作,由最終用戶參與整個技術創新過程。
該計算中心主要爲包括陝西在内的西北五省以及全國頭部人工智能企業提供普惠 " 算力 ",并和高校、科研院所基于全棧國産化的昇騰芯片、異構計算架構 CANN 以及深度學習框架 Mindpore 展開合作,推動我國人工智能形成自主創新的産業生态。
截至 2022 年 12 月 31 日,已與 182 家企業合作,孵化了 179 個場景化解決方案,涵蓋遙感、語音、文旅、制造、交通等數十個行業。
" 華爲從底層的硬件開始做起,但不僅僅是做硬件,我們在硬件上的投入和軟件上的投入一半一半,硬件使能層類似于 CPU 上的彙編語言,直接在機器上執行底層的 AI 的算子,還有應用使能層,面向不同類别的開發者提供三種不同層級的開發方式,支持從底層算子的開發再到上層模型的開發、應用的開發 ",張嘉偉說。
據悉,華爲即将在 5 月份正式發布整個開發者套件,讓開發者可以便捷地使用昇騰軟硬件,加速從算力到應用的開發。
行業模型早已湧現
千億級參數的大模型實現了新的能力,但很多行業不需要如此之大的大模型,行業模型是較爲實用的方案。
華爲創始人任正非此前就表示,未來 AI 大模型上會風起雲湧,大家要關注應用,尤其是工業、農業社會的應用,模型的應用有時比模型本身還有前途,華爲主要做 AI 的底層算力平台,應用平台不是華爲的選項。
據歐洲人文和自然科學院外籍院士,西安電子科技大學人工智能研究院院長焦李成介紹,西電人工智能學院聯合西安昇騰智能科技有限公司和華爲,依托西安未來人工智能計算中心的算力,在昇騰 Atlas 算力底座和 MindSpore AI 框架下,采用華爲智能無損以太網絡将算力節點高速互連,開展了大規模雷達遙感影像智能解譯技術研究。
目前可實現複雜多樣地物的自适應建模、迥異成像參數的判别性特征提取及特征互補優化的自監督學習,獲得樣本需求低、特征刻畫好、普适度高、實用性強的 SAR 圖像智能解譯系統。
業内人士表示,華爲主要是以硬件擅長,尤其是昇騰部分,以出售闆卡的形式來賦能生态,從昇騰的角度來說,希望做成 " 中國的英偉達"。
張雲鵬表示,從過去的 AI 算力平台遷移到華爲昇騰,是一個現實的挑戰,昇騰聯合高校做了很多衆智計劃,進行了相關的算子的開發和遷移,與高校合作促促進産業長期的發展,這也是昇騰爲生态不斷提供的能力之一。
隆基智能全球領先的光伏企業,其總部位于西安,打造了光伏行業首個全流程 AI 質檢一體化系統,采用了華爲 Atlas 800 ( 9000 ) AI 訓練服務器,與未來人工人工智能計算中心進行适配。在産線關鍵工序中實現精準檢驗,智能定位風險點,替代傳統人工經驗化處理的模式。相比較人工檢驗,制造效率提升 25% 以上,漏檢率大大降低。
此外,西安未來計算中心還聯合西北工業大學開展語音預訓練大模型 " 等。在人才培養方面,西安未來人工智能計算中心同西北農林科技大學、西北大學、西安科技大學、西安工業大學 4 所高校開展合作,已累計培養人工智能産業人才 1000+。
很長一段時間内,昇騰重心不在于商業盈利,而是爲算力找到出口,讓更多的應用在昇騰軟硬件上跑起來,讓更多的企業遷移到昇騰生态,如此,國産算力才算是有了生存的空間。
大模型背後必然是大生态,生态繁榮,大模型才不是空中樓閣。
(本文首發钛媒體,作者|張帥)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App