IT 之家 10 月 24 日消息,IBM Research 日前推出 AI 芯片 NorthPole,該芯片靈感号稱 " 來自人類大腦的運作 ",推論性能據稱超越 4nm GPU,适用于邊緣計算等範疇。
IT 之家經過查詢得知,NorthPole 芯片是 IBM 曾在 2014 年 " 模拟人腦運作 " 的 TrueNorth 芯片的後繼者,芯片開發同樣由 TrueNorth 芯片負責人 Dharmendra Modha 所主導。
▲ 圖源 IBM
據悉,在傳統的半導體産業中,芯片主要遵循相同的基本架構,處理單元與儲存信息是相互分開的,這種架構雖然簡化了芯片設計模式,卻也因傳輸速度趕不上處理速度而出現了 " 馮・諾伊曼瓶頸(von Neumann Bottleneck)",而 Dharmendra Modha 則認爲,人腦是目前所知最節能的處理器,因而持續尋找以數字方式複制人腦的方法。
IBM 目前推出的 NorthPole 芯片,相對于傳統芯片最大的不同點在于 " 芯片内置存儲器 ",在沒有 " 馮・諾伊曼瓶頸 " 的情況下,NorthPole 芯片的 AI 推論能力優于市面上競品。
雖然 NorthPole 采用 12nm 工藝,于 800 平方毫米上安置了 220 億個晶體管,擁有 256 個核心,于 8-bit 精度下每核心每個周期可執行 2048 次操作,若是在 4-bit 或 2-bit 精度下,操作次數則可翻倍。
▲ 搭載 NorthPole 的 PCIe 卡,圖源 IBM
在具體架構上,NorthPole 号稱模糊了運算與存儲間的界線,這讓 NorthPole 容易整合至系統,且明顯減少了搭載芯片的設備負載。
IBM Research 在 ResNet-50 模型上測試 NorthPole,相較于同樣基于 12nm 工藝的 GPU 競品,NorthPole 每秒辨識幀數的能效是競品的 25 倍,而且不管是在延遲或運算空間的要求上,表現都優于市面上所有主流架構,甚至淩駕基于 4nm 工藝的 GPU。
不過,NorthPole 的優勢同時也是它的弱點所在,NorthPole 隻能輕松讀取集成在芯片中的本地數據信息,讀取外界數據時,便沒有計算速度優勢。
Dharmendra Modha 聲稱,雖然 NorthPole 無法用來承載 GPT-4,但應該可滿足許多企業所需的模型推論要求。
目前 IBM Research 仍在研究 NorthPole 的适用領域,研究人員許多需要即時處理大量資料的邊緣計算可能非常适合 NorthPole,例如自動駕駛、遙感通信等領域,NorthPole 均有用武之地。