芯東西(公衆号:aichip001)
作者 | ZeR0
編輯 | 漠影
芯東西 11 月 15 日報道,在周二舉辦的 2023 英特爾 FPGA 中國技術日上,英特爾披露了 Agilex 3 系列、Agilex 5 系列等多款 FPGA 産品細節及其早期驗證計劃,其最新 FPGA 産品路線圖如下:
1)英特爾 Agilex 3 FPGA 系列:外形小巧,在功耗和成本上進行了大幅優化,且擁有廣泛的 I/O 支持。即将推出的 Agilex 3 B 系列 FPGA 面向電路闆和系統管理,包括服務器平台管理(PFM)應用;C 系列 FPGA 針對一系列複雜可編程邏輯設備(CPLD)和 FPGA 應用提供更多功能以用于垂直市場領域。
2)英特爾 Agilex 5 FPGA 系列:采用第二代英特爾 Hyperflex FPGA 架構和 Intel 7 制程工藝,對晶體管的每瓦性能進行了優化,能耗出色;采用英特爾上一代高端産品中嵌入的業界首個針對 AI 優化的模塊,并将其擴展至 Agilex 5 FPGA 的中端産品中。Agilex 5 E 系列 FPGA 在功耗和尺寸上進行了優化,将于第四季度起逐步向早期體驗客戶提供樣品,并将推出優化的 FPGA AI 套件軟件支持,明年第一季度将開始大批量交付工程樣品與提供相關設計軟件。
3)英特爾 Agilex 7 FPGA 系列:采用 CXL 提高帶寬和連接性能,并借助 HBM 加快内存訪問速度,具有性能功耗比優勢的 Agilex 7 M、F 和 I 系列 FPGA 現已上市。Agilex 7 FPGA R-Tile 相較于其他同類 FPGA 産品,其每個端口的 PCIe 5.0 帶寬速度提高了 2 倍,CXL 帶寬提高了 4 倍,現已大量出貨。
英特爾今年計劃推出15 款FPGA 産品,現在已經達到 11 款。
此前英特爾宣布其可編程解決方案事業部(PSG)預計将于 2024 年 1 月 1 日開始獨立運營,英特爾預計将在 2024 年第一季度财報中,将 PSG 作爲一個獨立的業務部門進行報告。對此,在接受媒體采訪時,英特爾可編程方案事業部副總裁兼網絡業務部總經理 Mike Fitton 博士作了補充說明,PSG 的拆分獨立不會是一件 " 趕時間 " 的事情,不是說到明年上半年突然就變成一家獨立公司,而是會在未來兩三年間逐步完成。
大會期間,英特爾還全面分享了其最新 FPGA、結構化 ASIC 産品及解決方案如何應對人工智能(AI)等行業挑戰,并解析英特爾如何推動 FPGA 産品和技術創新。
英特爾 PSG 中國區總經理葉唯琛博士談道:" 在新場景、新應用海量增長的驅動下,中國本地市場對于 FPGA 産品的需求也在日益多元化和快速擴展。我們始終緻力于以中國客戶的實際需求爲導向,基于領先的 FPGA 産品和軟件爲各行業提供全場景的解決方案。"
一、主攻三大關鍵市場,FPGA 更易于開發定制 AI 解決方案
英特爾可編程方案事業部副總裁兼網絡業務部總經理 Mike Fitton 博士談及 PSG 拆分上市的情況,稱 PSG 将在未來兩三年逐步成爲一家由英特爾控股的獨立公司,并在未來幾年走向 IPO。
這将使得 PSG 能夠專注于新的創造,也可以擁有更加具有彈性的供應鏈,同時能獲得來自英特爾的協同效應,變得更加靈敏、更好支持客戶需求。另外,英特爾希望通過這樣的拆分,可以使英特爾股東價值得到最大化的回報。
" 雖然我們之前說過它未來會被拆分,但我們還是會和 CXL、接口、至強之間有很強的連接性,受到英特爾生态網絡的支持。" 他談道。
除了芯片創新外,英特爾 FPGA 的創新還涉及支持的 IP、軟件和整個系統。
Mike Fitton 特别提到 FPGA 對于 AI 解決方案的價值,由于 FPGA 的 I/O 可配置性非常高,有助于邊緣應用靈活互連,從數據預處理到後處理,都可以針對 AI 進行預先部署,尤其适用于支持小批量的實時 AI。英特爾 FPGA 的優勢是具有很強的靈活性、精準度更高、可擴展性更高,能夠降低功耗和總擁有成本,加快 FPGA 上市速度。
未來 AI 将更多從雲向邊緣遷移,而 FPGA 産品可以扮演一個非常重要的角色,因爲它本身就已經在邊緣端,可以更加實時去處理更小批量的量級,而且具有低延遲的特點,可以在邊緣端直接收集到數據再進行 AI 訓練、AI 推理,能夠支持任何新型神經網絡快速部署。
從軟件的角度,英特爾希望實現更快的模拟和編譯速度,同時還需以 IP 爲中心的流程,将 AI、C++ 轉換爲 RTL、RISC-V 和 Arm 工具套件,就像添加 IP 一樣簡單,這些都能與英特爾至強 CPU 實現全棧連接。據 Mike Fitton 分享,相比市場上其他可行的 FPGA,英特爾 FPGA 的速度要快一個量級,有助于降本增效。
數據中心、網絡、嵌入式是 FPGA 的三大關鍵市場領域。下圖是英特爾 FPGA 在數據中心中的應用,IPU 是 FPGA 基礎設施處理單元,就像 " 服務器中的服務器 ",與至強搭配使用,能夠提供更多的功能和性能。
最後,Mike Fitton 談道,英特爾 FPGA 的供應鏈加速周期是可預測的,所有相應設備到今年第四季度可以達到 16 周或更短的時間;原型設計也更加敏捷,幾周内将有超過 80 個器件出貨;預計将産品的供應生命周期延長至 2035 年。
二、詳解高、中、低端産品組合分工,用芯粒架構滿足高性能需求
英特爾可編程方案事業部 FPGA 芯片産品營銷高級總監 Lux Joshi 分享了英特爾的一些方法如何滿足當前的行業趨勢和所需功能。
首先是基于芯粒的異構集成,能夠快速集成新功能,并能支持任何制程節點、代工服務或 IP,以适應不斷變化的标準、層出不窮的工作負載、對更高性能和更高功效的旺盛需求。
其次是DDR,擁有更高的内存帶寬和集成内存的新選項,并支持全新的内存接口,以跟上數據激增、每一級擁有更多存儲方案和帶寬趨勢的步伐。
第三是大幅提升 FPGA 易用性,面對日益複雜的 FPGA 設計和工作負載加速,提供更簡便的 FPGA 開發、AI 和工作負載加速工作流、開放式加速生态系統。
Lux Joshi 總結了英特爾 Agilex 系列 FPGA 産品組合的 3 個主要特點:全面、優化、統一。更加靈活、便捷以及非常優秀的每瓦性能,還有更低的 TCO,這些都是 FPGA 與生俱來的優勢。
其中,高端産品英特爾 Agilex 7 基于芯粒架構,采用英特爾 10nm SuperFin 制程;中端産品英特爾 Agilex 5 是單體式 FPGA 芯片,采用 Intel 7 制程。Agilex 7 和 9 已經開始出貨。
英特爾 Agilex 7 的邏輯結構性能功耗比,對比競争性 7nm 節點 FPGA,提升約 2 倍。
Agilex 7 有多個系列:F 系列進行了靈活性優化,DSP 支持 FP16、BFLOAT16、整數模式;I 系列進行了互連帶寬優化,擁有更高的 I/O 和處理器 I/F 帶寬;M 系列性能更高,實現了最高内存帶寬,超過 1Tbps,在支持 HBM 的 FPGA 中 DSP 計算密度行業領先。所有 Agilex 7 産品會在今年年底完成所有密度規格的出貨。
AI 應用的客戶需要高帶寬互連,希望有更加優化的互連解決方案。而基于 Agilex 7 的 IPU,可以加快數據流以及對這些數據進行預處理,使得後端更有效加速 AI 工作負載。
英特爾 Agilex 5 是首批支持 LPDDR4、LPDDR5(+DDR4、DDR5)的 FPGA、首批配備 AI 張量塊的中端 FPGA,擁有首個非對稱多核應用處理器系統(2x Arm A76、2x Arm A55),可提升在邊緣端 AI 推理能力。其 E 系列進行了功耗和尺寸優化,對比 16nm 競品,性能功耗比提升 1.6 倍;D 系列進行了性能優化,對比 7nm 競品,性能功耗比提升 2 倍。
即将推出的英特爾 Agilex 3 已經進行客戶前期測試,注重低功耗、成本優化,其 B 适用于平台、闆卡、系統管理等;C 系列擁有廣泛的功能集,能夠适應各種低功耗、成本優化的 CPLD 和 FPGA 應用的需求。
英特爾提供自定義邏輯組合,包括 FPGA、結構化 ASIC 和 ASIC。其中 FPGA 上市速度最快、靈活度最高,ASIC 能實現更低功耗、更低單位成本和更高性能,結構化 ASIC 介乎于兩者之間。
在軟件開發框架上,英特爾能提供開發者所需要的大部分内容,幫開發者節省時間,軟件開發者不需要重新設計驅動,硬件開發者可以更快速進行自己的系統設計。
三、提出五個方面指标,測量 FPGA 有多簡單易用
英特爾可編程方案事業部副總裁兼軟件工程總經理薛華博士重點分享了英特爾 Quartus 設計軟件的願景、演進與特點。
英特爾 Quartus 的願景是針對 HML 全系列 FPGA 優化的 PSG FPGA 軟件設計,打造卓越的 FPGA 設計工具,實現領先的高端産品、不斷突破易用性極限,希望能夠提供更多一鍵式的使用模型,支持客戶獲得更加簡單的應用,以更小的投入來獲得最大的體驗優化,最終實現零支持、無縫安裝和許可,以及社區支持模式。
從設計角度來講,英特爾認爲,所有的元件、組件都是 IP 的一部分,不管是從傳統的 RTL 還是 Nios V 處理器、DSP Builder 和 HLS Compiler,都能以一種邏輯一緻的方式來處理。因此以 IP 爲中心的 Quartus 工具編譯速度更快,可進一步推動簡單易用,适應多樣化需求。
薛華認爲易用性有3 個關鍵點:
1、确保軟件工具是在芯片完成前就及早備好,支持客戶在芯片誕生前至少 12 個月開始設計,以此來提高生産力;
2、提供客戶開始設計所需的所有組件,幫助大家減少叠代,進一步提高生産效率;
3、不斷縮短編譯時間及周期,設計周期平均縮短至少 30%,降低客戶的開發成本。
英特爾希望能夠創造一個平台,去測量 " 簡單易用 " 這樣一個主觀界定指标。
如果工程師開發時界定了 5 個不同的方面去衡量" 簡單易用 ",涉及到端到端的設計流,從開始階段,到設計輸入階段,然後是遷移,之後還會進行模拟,以及編譯和時序收斂。
這五方面都分别會有 5~10 個 KPI,比如一開始會進行一個許可、下載、安裝的體驗,還有一些參考的設計,以及中間如何去解決障礙或問題。同時,在工具之中去跑這個設計的時候,它的速度和順暢性怎麽樣,都是要去權衡的部分。
英特爾的目标是在每個部分都能夠提供更好的體驗,希望得到反饋,并以此更好地衡量其對未來推出的新版本的影響。
結語:垂直市場需求多元化,單一方案無法決勝未來
作爲 FPGA 頭部玩家之一,英特爾正通過産品矩陣有序擴張,實現面向三大應用領域覆蓋高、中、低端市場的全面 FPGA 系列産品布局,并通過提供全棧式軟件工具和全生命周期的産品服務,來不斷降低開發者的使用門檻,以更廣泛地發揮 FPGA 在靈活性方面的價值,縮短上市時間。
據 Mike Fitton 分享,英特爾認爲回應垂直市場不斷增加的多元化需求,需要提供非常廣泛多樣的解決方案,單一方案不是未來的決勝之道。Lux Joshi 相信 FPGA 充分适應了未來硬件加速的需求,并承諾英特爾未來會不遺餘力地發展在數據中心、通訊汽車、網絡、嵌入式等領域的 Agilex 廣泛應用,推動硬件加速。
"2024 年同樣将是非常激動人心的時刻,因爲我們會不斷深耕現在已有的 4 個産品線,包括在今年年底,Agilex 7 的 F 系列和 I 系列将完成,明年我們會繼續完成 M 系列。對于 Agilex 5,我們今年年底會給到早期使用用戶相應的樣品,2024 年會持續提升 Agilex 5 産量。Agilex 3 的 B 系列會在 2024 年推出。"Lux Joshi 說。