本文來自微信公衆号:電子工程世界(ID:EEworldbbs),作者:付斌,題圖來自:視覺中國
這兩天,IBM 低調地發了一個新聞,推出了一款類腦芯片 " 北極 "(NorthPole),對比 4nm 節點實現的 Nvidia H100 GPU 相比,NorthPole 的能效提高了五倍,成爲當之無愧是現在世界最強的 AI 芯片。
如此逆天的性能,但在國内,關于這款芯片的新聞卻寥寥無幾。那麽,它究竟是何方神聖?
把腦子裝進芯片,就行了?
首先,IBM 的 " 北極 "NorthPole 是一種類腦芯片,我們需要先了解什麽是類腦芯片。
所謂類腦芯片,顧名思義,就是一種高度模拟人腦計算原理的芯片,基于對現代神經科學的理解,反複思考如何從晶體管到架構設計,算法以及軟件來模仿人腦的運算。如果把類腦芯片做得更像人腦,就會被賦予一個新的名字——神經形态計算(Neuromorphic Computing)。
人類的思考方法與現在傳統的芯片存在許多區别,比如,人沒有單獨的存儲器,沒有動态随機存取存儲器,沒有哈希層級結構,沒有共享存儲器等等。
" 存儲 " 和 " 處理器 " 錯綜複雜地深繞在人腦裏,在人腦的結構中有 " 神經元 " 的存在。在電腦中,以數字化核心相互交流基于事件的信息,叫做脈沖,這點和人腦傳遞信息的方式相似。
人類便從人腦中得到靈感,從而創造出這樣的芯片,來提升性能,成爲真正的 " 人工智能 ",甚至無限接近人類,獲得思考能力。
當然,人腦很複雜,而且人們所制造出來的 IC 器件,也存在優勢,所以人們最終目标就是把這二者的優勢融合起來。
總而言之,用人話來解釋,類腦芯片,就是結合生物大腦和人造器件各自優點而設計制造出來的一種芯片,而它也會像人一樣思考,自我學習。
想造一顆這樣的芯片,可不是光變器件結構就行的,而是從材料、器件、電路、架構帶動算法和應用改變的。一言蔽之,就是集合各種最先進的技術,才能造出這樣的芯片。
雖然實現路徑很多,但奈何這種芯片技術難度太大了,且不說好不好造,設計出來就很難了,所以目前也在開拓階段,都還無法達到商業化水平。
但筆者了解到,之所以類腦芯片還未形成大規模商業化,一是因爲設計難題依存,就拿英特爾、IBM 都看好的 CMOS 型,多塊全數字異步設計的芯片互聯、芯片連接的有效性和時效性以及軟件層互連計算、分布式計算和靈活分區等問題都難以解決;二是制造、軟件和生态都要完全推翻,雖然矽基晶體管路線部分可複用,但底層不可能完全照搬,這就進一步加劇大規模商業化難度。
那,我們爲啥費大力氣折騰類腦芯片?
類腦芯片實在太香了,筆者了解到,某些情況下,完美的神經形态芯片可以用比傳統解決方案低 1000 倍的能耗來解決問題,這意味着我們可以在固定的功耗預算下,打包更多的芯片來解決更大規模的問題。
類腦芯片的超高能效比足夠讓我們牟足力氣研究和突破。拿一個最典型的例子來看,AlphaGo 下棋打敗了人類,但人類隻用了 20 瓦的大腦能耗,而 AlphaGo 是 2 萬瓦。
神經形态芯片涉及的領域和機會,圖源丨 Nature Computational Science
結構上,目前全世界的類腦芯片基本都一緻,都是由神經元計算、突觸權重存儲、路由通信三部分構成,同時采用與脈沖神經網絡(SNN)模型。
但依據材料、器件、電路,分爲模拟電路主導的神經形态系統(數模混合 CMOS 型)、全數字電路神經系統(數字 CMOS 型)、基于新型器件的數模混合神經形态系統(憶阻器是候選技術)三種流派。
全球範圍内,參與神經形态計算芯片開發的機構主要包括三類:英特爾、IBM、高通等爲代表的科技巨頭企業,斯坦福、清華爲代表的高校 / 研究機構以及初創企業。
根據筆者之前與英特爾研究院對話中獲悉,數字 CMOS 型是目前最易産業化的形式,一方面,技術和制造成熟度高,另一方面,不存在模拟電路的一些顧慮和限制。
當然,需要強調的是,數字 CMOS 型還隻是最初階的類腦芯片,還算不上完全模拟人腦的神經形态器件,隻能算是一種借鑒神經形态理念的一種芯片。但光是借鑒人腦,這種芯片就能夠碾壓世界上任何一種芯片。IBM 的 NorthPole 就是這樣的數字 CMOS 型的類腦芯片。
類腦芯片主要類型和研發進度,制表丨電子工程世界
IBM 的芯片,什麽水平?
先說結論,應該是迄今爲止,人類水平最高的類腦芯片了,對于類腦芯片研究又上了一個台階。
2008 年,IBM 就開始研究類腦計算了,2011 年有了第一次突破性成果:IBM 的第一代神經突觸計算機芯片。研究人員制造出兩個這樣的芯片模型:一顆包含 262,144 個可編程突觸,一顆則包含 65,536 個可學習突觸,通過測試展示其可執行導航、機器視覺、模式識别、關聯記憶和分類等簡單功能。
直到 2014 年,IBM 在《科學》雜志發表了一篇文章,向全世界展示了劃時代的技術進展:一個符合 DARPA SyNAPSE 項目指标的、擁有 100 萬神經元的類腦處理器,即 TureNorth,在當時掀起了類腦芯片研究熱潮。
沉寂 8 年," 北極 "(NorthPole)問世,NorthPole 就是建立在 IBM 最後一顆類腦芯片 TrueNorth 基礎之上,彼時 TrueNorth 就有這比傳統微處理器低四個數量級的能效比,對比一下二者,就能很直觀感受到 IBM 技術的變化:
單個 TrueNorth 芯片包含 4096 個計算核心,可以實現神經突觸和神經元排列的動态映射。IBM TrueNorth 系統的一個吸引人的功能是,單個芯片由 54 億個晶體管組成,僅消耗 70mW 的功率密度,僅占傳統計算單元的 1/10000;
NorthPole 采用 12nm 節點工藝制造,在 800 平方毫米内集成了 220 億個晶體管,有 256 個内核,在 8 位精度下,每個内核每個周期可執行 2048 次運算;在 4 位和 2 位精度下,運算次數有可能分别增加一倍和四倍。運行基于人工智能驅動的圖像識别算法速度是目前市場上同類芯片的 22 倍,能效是同類芯片的 25 倍。在不使用最先進工藝的情況下,NorthPole 芯片能耗是使用最先進技術的人工智能芯片的 1/5。總體而言,NorthPole 的速度大約是 TrueNorth 的 4000 倍。
圖 /IBM
結構方面,NorthPole 與 TrueNorth 一樣,由一個大型計算單元陣列(16 × 16)組成,每個單元都包含本地内存和代碼執行能力。
計算資源方面,NorthPole 每個單元都經過優化,可執行精度較低的計算,精度從 2 bit 到 8 bit 不等。爲保證執行單元使用,它們不能根據變量值執行條件分支,也就是說,使用者代碼不能包含 if 語句。這種簡單的執行方式使每個計算單元都能進行大規模并行執行。在 2 bit 精度下,每個單元可并行執行 8000 多次計算。
存儲方面,所有的内存都被封裝在一顆芯片内, 這意味着每個内核都可以輕松地訪問芯片上的内存。設備外部來看,NorthPole 看起來像是一個主動存儲芯片,這有助于将 NorthPole 集成到系統中。
不止如此,這款 NorthPole 目前采用的是 12nm 納米節點工藝制造,目前 CPU 最先進的技術是 3nm,而 IBM 還在研發 2nm 納米節點技術,如果用上 2nm,可能 IBM 的類腦芯片性能還會再提升很大檔次。
NorthPole 的潛在應用主要包括圖像和視頻分析、語音識别以及 Transformer 神經網絡,這些網絡是爲 ChatGPT 等聊天機器人提供支持的大型語言模型(LLM)。這些人工智能任務可能會用于自動駕駛汽車、機器人、數字助理和衛星觀測等領域。
某些應用程序需要的神經網絡太大,無法安裝在單個 NorthPole 芯片上。在這種情況下,這些網絡可以分解爲更小的部分,并分布在多個 NorthPole 芯片上。
而 NorthPole 的超高能效比,意味着它不需要笨重的液體冷卻系統來運行,風扇和散熱器就足夠了,而它也可以部署在更小的空間中。
國内開始研究類腦芯片了嗎?
如此強大的芯片,國内也早已有所布局。
國内研究則包括清華大學、浙江大學、複旦大學、中科院等頂級學府和機構,同時近兩年不斷湧現初創公司,如靈汐科技、時識科技、中科神經形态等。其中以清華大學的天機芯和浙江大學的達爾文芯片最具代表性。
具體而言,國内的主要成果包括:
清華大學 2015 年開發的第一代天機芯采用 110nm 工藝,2017 年,第二代天機芯開始取得先進成果,基于 28nm 工藝制成,由 156 個功能核心 FCore 組成,包含約 4 萬個神經元和 1000 萬個突觸。相比第一代,密度提升 20%,速度提高至少 10 倍,帶寬提高至少 100 倍,此外,清華大學還自主研發了軟件工具鏈,支持從深度學習框架到天機芯的自動映射和編譯。根據清華大學的計劃,下一代天機芯将是 14nm 或更先進的工藝,且功能會強大更多;
浙江大學聯合之江實驗室共同研制的類腦計算機,其神經元數量與小鼠大腦神經元數量規模相當。該計算機包含 792 顆達爾文 2 代芯片,支持 1.2 億個脈沖神經元、720 億個神經突觸,而其典型運行功耗僅爲 350W~500W;
2020 年 10 月,清華大學計算機系張悠慧團隊精儀系施路平團隊與合作者在《自然》(Nature)雜志發文首次提出 " 類腦計算完備性 " 以及軟硬件去耦合的類腦計算系統層次結構;
2023 年 9 月,中國科學院計算技術研究所尤海航研究員和唐光明研究員帶領的研究團隊研制了超導神經形态處理器原型芯片 " 蘇轼(SUSHI)",它是一款基于超導單磁通量子(SFQ)電路的超導計算芯片;
2023 年 10 月,由中科南京智能技術研究院自主研發是目前國内規模最大、國際一流的類腦超級計算機服務正式啓用,它已實現 5 億神經元 2500 億突觸智能規模,較現有計算系統能效提升 10 倍以上,核心芯片自主可控。
IBM 的成果代表着,這項布局未來的技術離我們又近了一步,而目前一些初創公司逐漸形成方案,開始應用。不難預見,在近幾年,這項技術商業化将逐步展開,而彼時研究成果也将照進現實。
參考文獻
[ 1 ] IBM:A new chip architecture points to faster, more energy-efficient AI.https://research.ibm.com/blog/northpole-ibm-ai-chip
[ 2 ] IEEE Spectrum:IBM Debuts Brain-Inspired Chip For Speedy, Efficient AI.2023.10.23.https://spectrum.ieee.org/neuromorphic-computing-ibm-northpole
[ 3 ] Schuman C D, Kulkarni S R, Parsa M, et al. Opportunities for neuromorphic computing algorithms and applications [ J ] . Nature Computational Science, 2022, 2 ( 1 ) : 10-19.https://doi.org/10.1038/s43588-021-00184-y
[ 4 ] 清華大學:清華大學計算機系張悠慧團隊首次提出 " 類腦計算完備性 ".2020.10.16.https://mp.weixin.qq.com/s/-zZpk1pESZ_q2eDWECsIZg
[ 5 ] 中科院計算所:計算所研制超導神經形态處理器原型芯片 " 蘇轼(SUSHI)".2023.9.28.https://mp.weixin.qq.com/s/kUz6hYkI7hvs9a09pDtwhw
[ 6 ] 南京發布:問天Ⅰ,類腦計算機 .2023.10.17.https://mp.weixin.qq.com/s/Mm-Tb-Vrr-uXXu4uKZe9sA
本文來自微信公衆号:電子工程世界(ID:EEworldbbs),作者:付斌