IT 之家 11 月 12 日消息,IBM 的 NorthPole 架構芯片已經開發了近十年,現在已經越來越完善、越來越強大。
官方現在通過《科學》雜志發表了一組 NorthPole 的基準測試結果,堪稱是一個新的裏程碑。
根據對 ResNet-50 模型的測試,基于 TrueNorth 架構的 12 納米芯片比常用的 12 納米 GPU 和 14 納米 CPU 功耗高 25 倍。
據 IBM 稱,NorthPole 在延遲和計算所需的空間方面也表現更好,超過了所有主流架構,包括基于 4 納米工藝的 GPU。
那麽,它是如何實現這一成果的呢?因爲它 256 個核心本身就集成了一塊内存芯片而無需單獨連接,NorthPole 用于 220 億個晶體管,其每個核心都可以執行 2048 個運算。
該公司稱,其架構消除了馮・諾依曼瓶頸,該瓶頸圍繞着大多數系統中 CPU 和 RAM 之間數據傳輸引起的延遲。因此,它可以比市場上最好的 GPU(包括 Nvidia 最強 AI 顯卡)運行得更快。
IBM 研究部門的 Dharmendra Modha 表示:" 從架構上看,NorthPole 模糊了計算和内存之間的界限。在單個核心層面上,NorthPole 表現爲接近内存的計算;而在芯片外部的輸入輸出層面上,它表現爲主動内存。"
IT 之家注意到,AMD 也探索了類似的技術,并成功将内存和計算結構集成到單個組件中。上個月,Xilinx 便展示了其 Virtex XCVU7P 卡,其中包括八個内存加速器模塊。
據介紹,IBM 在其 NorthPole 芯片中爲每個計算核心的添加了内存芯片,他們認爲這個組件非常适合新興的 AI 用例,包括與計算機視覺相關的用途。此外,它還經過了自然語言處理和語音識别方面的測試。NorthPole 還适用于邊緣應用,這些應用可實時處理大量數據。