生成式 AI 的火爆,吸引了大量人開始挖掘 AI 的金礦。生成式 AI 模型所需的算力,每 100 天就要翻一倍,AI 對 " 芯經濟 " 的推動作用非常顯著。
" 芯經濟(Tech Economy)" 是英特爾公司首席執行官帕特 · 基辛格(Pat Gelsinger)近日在 2023 英特爾 on 技術創新大會上提出的概念,指的是芯片和軟件的推動下,正在不斷增長的經濟形态。
AI 代表着新時代的到來,AI 正在催生全球增長的新時代,特别是 AI 推動的芯經濟。
幾乎所有芯片公司在 AI 芯經濟面前,面臨着一個共同的問題:如何挑戰英偉達?
2023 英特爾 on 技術創新大會期間,雷峰網和全球少數媒體一起,和帕特 · 基辛格面對面聊聊與英偉達的競争以及英特爾的 AI 優勢。
英特爾公司首席執行官帕特 · 基辛格(Pat Gelsinger)
作爲英偉達創始人黃仁勳 35 年的老朋友,基辛格沒有回避這個問題,他重點談論了軟件。
" 我們正在推動的一個簡化工作(oneAPI),就是創建一個可編程的中間層,以抽離出所有獨特的硬件元素,這起到了兩個關鍵作用。" 基辛格進一步解釋。
有些工作流需要在 CPU 上運行,有些需要在 GPU 上運行,有些需要在專用加速器上運行,還有一些需要在邊緣設備上運行,它們的功耗可能隻有 10 瓦。另一方面,大型數據中心的功耗可能高達 10 兆瓦。
這些情況差異很大,大家都希望有一個合理的跨架構軟件堆棧兼容性,這是一個行業趨勢。整個行業都在付出巨大的努力,以創建穩定的中間表示語言,使其在多個架構上具備兼容性。
" 我們積極參與并确保我們的硬件符合這種表示語言,并提供堆棧支持。希望推動行業的進一步發展。" 基辛格同時說,"我們不希望開發者一直在内核級别進行編程,而是能夠把時間花在更高層次的工作上。我們緻力于提供适合這個新的軟件編程市場的硬件産品。"
基辛格重點談論的軟件生态,正是英偉達在 AI 領域最堅固的護城河。他談論英特爾統一的跨架構編程平台 oneAPI,實際上也是在分享英特爾如何構建一個強大的 AI 生态挑戰英偉達。
作爲後來者,英特爾顯然需要爲 oneAPI 投入更多的資源,也需要數年壯大 oneAPI 的生态,才能和對手一戰。好的方面是,oneAPI 更加開放,這有希望借助更多人的智慧更快建立強大的 AI 生态。
自己建設一個 AI 生态,其實是最難的選擇,但這也是超越強大的對手唯一可行的路徑。相比之下,不少公司選擇兼容英偉達的 AI 生态,這确實降低了不少難度,但也很難超越。
生态建設是一個長期的工作,能夠更快直接與英偉達競争的是性能更高的芯片,英特爾是否也把握住了趨勢?
" 随着 AI 模型變得更大,短期内市場需求也更大,最終 AI 和高性能計算将融爲一體。" 基辛格同樣看到了高性能 AI 芯片市場的趨勢。
同樣看到這個趨勢的英偉達和 AMD,都在今年推出了融合 GPU 和 CPU 的産品,作爲全球少有的能夠設計出同類産品的英特爾,預計要 2025 年才能有同樣定位的産品。
在 2025 年新産品推出之前,英特爾又如何與英偉達競争?
" 我會說,通過提供更好的産品,我指的是 GPU。" 基辛格說,"Ponte Vecchio GPU 和 GPU Flex 系列等産品更具可編程性。"
當下英特爾更加強調 Gaudi,這也是英特爾進攻 AI 市場核心的關鍵。
" 我們正在打造最優秀的 AI 加速器,對于某些用例來說,它并不具備全部的 GPGPU 可編程性。但是,它符合大語言模型、穩定擴散和核心模型等領域的需求。我們産品的性能基準是英偉達 H100 的 1.4 倍,相當不錯。" 基辛格也進一步解釋了 Gaudi 的優勢。
Gaudi 在性能、總體擁有成本(TCO)、性能成本比、功耗等特性方面,非常有競争力。雖然它不是适合萬事萬物,但它适用于大部分 AI 工作負載的中間部分。
基辛格非常清楚在當下的 AI 競争環境下,Gaudi 是英特爾最有力的武器,強調性能、TCO 和适用大部分 AI 工作負載總能打動一些客戶。
Gaudi 與英偉達競争的方式,對于中國不少 AI 芯片公司具備參考價值。因爲許多中國的 AI 芯片初創公司也都是 AI 專用加速芯片。
當然,還是不能忘了軟件的重要性,Gaudi 的工程師團隊還必須完成所有的軟件工作,這樣客戶才能夠輕松地進行模型訓練、推理等工作。
采用 7nm 制程的 Gaudi2 已經被客戶采用,英特爾将在 2024 年推出 5nm 的 Gaudi3,接下來會是代号爲 Falcon Shores 的融合産品。
不過對于英特爾能否按照産品路線圖上的時間推出 Falcon Shores,外界存在擔憂,他們對于英特爾的執行力持有悲觀的态度。
讓英特爾重新擁有強大的執行力也是基辛格上任兩年半時間工作的重點。
" 我們正在重建‘格魯夫式的執行力’文化。" 基辛格說," 重點用數據說話并關注工程問題。我們會花 1 分鍾互相鼓勵,然後在剩下的 59 分鍾内把問題解決得更好。"
雷峰網了解到,基辛格采取了非常多措施重建紀律、執行力、工程、卓越、以數據爲中心的文化。
其中包括重新啓動了按節奏推進、管控風險的開發流程,現在稱之爲 Tick Tock 2。重新采用了英特爾發明的 OKR,即 " 目标 - 關鍵結果 ",并将其重新定義爲小組和管理團隊之間跟蹤績效和工作聯動的獨特模式。
基辛格還舉了一個提升英特爾效率的例子,這與他上任之後就提出的 IDM2.0 戰略息息相關。
英特爾的産品部門過去常比較随意地要求生産制造部門進行流片生産,芯片的制造非常昂貴,但沒有相關的成本計算方式,損害了制造效率。
現在,英特爾的産品部門要爲芯片流片生産付費,這使他們會變得更加謹慎,不會把每個設計都送到工廠,而是要仔細驗證來确保産業設計過關。
這樣做不僅能讓英特爾的産品部門更加嚴謹,使工廠的運作更加高效,極大地提高工廠的生産能力,降低每批次的成本。
" 改變需要一段時間,才能實現有條不紊,并在公司上下保持一緻。" 基辛格非常清楚,兌現了承諾,實現了目标,大家才會相信英特爾,然後可以開始新的布局。
這樣看來,産品路線圖上的時間點是檢驗英特爾執行力和創造力非常好的标尺。
當然,談論 AI 還不能忘記邊緣和終端的 AI,這是英特爾的優勢所在。
"AI 正朝着從雲原生開發轉向邊緣人工智能原生開發的方向前進。我們可以花 10 億美元創建一個數萬億參數的模型。但如何讓數億人使用它呢?這不應該僅是通過訪問雲去實現的,而是要把它推向客戶端和邊緣。在這些領域,我們在技術和産品方面有很大的機會。" 基辛格這樣認爲。
英特爾在 2023 英特爾 on 技術創新大會上預覽了首款面向 AI PC 的處理器酷睿 Ultra 處理器(産品代号 Meteor Lake),這是首款集成神經網絡處理器(NPU)的酷睿産品。
" 我認爲會出現獨立的 NPU,就像出現了獨立的 GPU 一樣。尤其在 AI PC 的早期階段,人工智能加速器是獨立的。" 基辛格進一步分享," 顯卡可能是唯一一個在可持續時間内獨立存在的類别,其他類别則大多數随着時間的推移逐漸融入到平台中。"
但未來 NPU 到底是融合到基礎平台還是成爲獨立的芯片類别?
" 對此我不太确定。但考慮到 GPU 和 NPU 在圖形領域之間的關聯,我們幾乎可以想象會存在 GPU 和 NPU 二合一的獨立芯片。" 這是基辛格給出的回答。
AI PC 是一個充滿吸引力的概念,但能否如基辛格所暢想的一樣,可以等待今年 12 月 14 日 AI PC 處理器發布後再進一步觀察。
與基辛格的小型采訪持續了一小時時間,他非常坦誠地談論了關于他的領導力,英特爾的執行力,英特爾在 AI 競争力以及在制造方面面臨的挑戰及進展。
就像基辛格對于英特爾完成看起來不可能的任務 " 四年五個節點 " 充滿了信心一樣,他對于英特爾重回領導地位也充滿信心,這種信心和實際行動,也正在感染越來越多英特爾的員工。