圖片來源@視覺中國
文 |矽谷101,作者 | 陳茜,編輯 | 陳茜
"英偉達是我們遇到過最糟糕的公司。So F**k you,Nvidia。"
因爲英偉達多年來拒絕對GPU内核驅動開源,"Linux"之父Linus Torvalds終于忍不住在2012年公開對英偉達和黃仁勳豎起中指。
不僅僅是Linux,還有微軟,英特爾,AMD,三星,高通等等科技巨頭都曾和英偉達對峙公堂。這就是黃仁勳:不怕得罪客戶,不怕戰鬥,不和解。
英偉達頂着"史上最任性乙方"的罵名,一路推動GPU走向主流市場,順市而動;多年堅持搭建生态,形成了如今高聳的護城河和壟斷式的市場占有率。2023年8月中旬,有咨詢公司測算,英偉達最新GPU H100利潤率高達1000%,且在市面上供不應求。
這期視頻,我們構建了英偉達GPU崛起的整個曆史,來深度聊聊,關于英偉達GPU最重要的戰鬥,以及這些戰鬥如何在AI浪潮來襲之際将英偉達推到了萬億市值的寶座。
01 英偉達GPU的誕生
在我們詳細深扒英偉達GPU的第一場戰役之前,我們稍微來講講當時的市場格局。
将時間拉回到90年代末期,英偉達因爲第一款芯片産品(RIVA128)成功推出,加上1997年和1998年全球遊戲發展的浪潮,使得英偉達在1999年1月22日正式在納斯達克交易所挂牌上市。在同一年,英偉達趁熱推出了Geforce 256,這款被稱爲"全球首款GPU"的圖形處理器。
其實,GPU這個技術并不是英偉達發明的,在英偉達發布Geforce 256之前,這項技術已經存在在其他大公司中了,包括索尼早在1994年版的PlayStation裏面已經使用了,但沒有人在市場上大肆推銷這個技術。所以,把自己和"GPU發明者"這個稱号綁定起來,其實英偉達的市場營銷的意味很濃。現在看來,這是老黃刻意爲之。
這是因爲,當時的世界是英特爾的CPU所稱霸的世界。而英偉達要想跟英特爾對打、唯一能殺出一條血路的策略,就是營銷GPU。
圖形處理器GPU和中央處理器CPU具體的區别在:CPU就像一個學識淵博的教授,什麽都精通都能做,但任務得一項一項做、比較慢。而GPU就像一堆小學生,對于特定的簡單運算任務,人多力量大,所以在大量并行計算上,GPU完勝。
(英偉達比喻CPU的工作過程)
(英偉達比喻GPU的工作過程)
這并不是說GPU就比CPU好,或者GPU能徹底取代CPU,隻是大家的專長不一樣。但在産品形态上,英偉達拿着GPU這樣的産品差異點去打英特爾,是非常聰明的。
我們現在有了"上帝視角",知道GPU有多厲害,但在21世紀初期微軟Windows生态和英特爾CPU稱霸的年代,而且GPU在産業上的優勢和需求還沒體現出來,英偉達是非常弱勢的。
而就這樣,弱勢的英偉達把自己卷入了一場大戰,這不僅僅是一場大戰,還是一場非常複雜和驚險的五方混戰。
02 英偉達與微軟、英特爾、AMD及ATI的五方混戰
2000年初,幾個芯片玩家的格局是這樣的:
英偉達主要開始大力售賣GPU。
ATI是一家加拿大公司,比英偉達早成立8年,在90年末也開始進軍圖像芯片GPU,成爲英偉達的主要競争對手。
英特爾其實也看到了GPU崛起的趨勢,1998年嘗試研發過一次單獨的圖像獨立顯卡,也被有些人稱爲最早的GPU之一,叫i740,但市場反應非常不好,沒成功;之後一年在推出升級版i752的時候,直接被叫停,之後英特爾放棄了獨立顯卡。
當時因爲英特爾CPU的市場太大了,處于非常舒服的位置,基本上的态度就是:市場上有啥新東西,你們先搞着,到時候組裝到我的主闆裏面就行了。後來英特爾采用了CPU+GPU的集成顯卡策略,讓ATI和英偉達去競争,英特爾坐收漁翁之利。
再來看如今英偉達的最大對手之一,AMD。當時AMD還不是英偉達的競争對手,最開始AMD是英特爾的競争對手,主打CPU市場。
兩個CPU巨頭盯着兩個GPU新星,明着暗着拉幫結派,再加上一個超級大甲方客戶,微軟,就開始搞事情了,五方混戰正式拉開序幕。
2.1 八面玲珑
在這場混戰中的第一階段,英偉達可以說是八面玲珑。
2000年,在商業合作方面,微軟爲了進軍遊戲主機行業、與任天堂和索尼展開直接競争,就找到了英偉達,讓他們成爲當時還是秘密項目的Xbox的GPU提供商。拿下微軟這個重要的訂單,英偉達可以說是幹勁十足。
另外一邊,英偉達和AMD現在成了死對頭,但在2000年初期,英偉達和AMD可是結盟關系去共同打擊英特爾。而且黃仁勳在1984年到1985年在AMD工作過,更有着"老東家"的淵源,所以在早期,英偉達在2001年6月進軍主闆芯片組(chipsets)、發布nForce一代的時候,首選就在AMD的平台上發力。
這時的英偉達非常意氣風發。大金主微軟爲了讓英偉達全力開發Xbox GPU,給出了總計5億美元的合同,定金就直接給了2億美元。要知道,當時英偉達一整年的銷售額也就才5億美元,相當于是買了"全年套餐",一下給包養了。
随後股價也是蹭蹭往上漲。但很快,英偉達就發現,大金主的錢,其實并不好拿。
2.2 十面埋伏
爲了在2001年和索尼還有任天堂正面競争,微軟給英偉達的時間隻有一年。正當英偉達加班加點的給初代Xbox供應GPU時,微軟遭遇到一系列生産和供應問題,被迫推遲發布,錯過了先機,敗給了索尼的Play Station2。
于是微軟所有的壓力堆積到了第二年的二代産品上。
爲了快速占領市場,微軟開始使用低價策略,将Xbox的北美售價定在299美元。這個概念是英偉達在2001年賣的GPU叫GeForce 3,市場售價329美元,英偉達給微軟特定的X-Chip是基于GeForce 3的産品。
這相當于,裝載英偉達GPU的Xbox比單純英偉達芯片還要便宜,這就好比你去買汽車的發現這個汽車大減價,比裏面裝載的發動機還要便宜。
當時,微軟在Xbox初期,每賣一台Xbox,就要虧126美元,那如果微軟想降低虧損的話怎麽辦呢?微軟打開Xbox,看看自己的供貨商說:诶英偉達,你是不是得便宜點兒?
然而,就算面臨微軟這麽大的一個客戶,2002年二季度微軟的訂單占英偉達總收入近30%,黃仁勳不愧是"史上最任性乙方",一口回絕了微軟的砍價提議。雙方還走上了法律程序。當年的美國證監會SEC文件,微軟和英偉達直接走的是"binding arbitration"具有約束力仲裁,就是說,判決之後,雙方都沒有上訴的機會,要的就是快狠準。
跟強勢甲方鬧掰的結果就是,微軟直接轉向英偉達的對手ATI,作爲下一代Xbox 360的GPU供應商。而英偉達和微軟鬧掰的消息直接讓英偉達股價雪崩式下挫。而更雪上加霜的是,因爲之前英偉達站隊AMD,使得英特爾也開始扶持ATI。
這時,英偉達面對的是兩個行業巨頭同時開始扶持自己的最大競争對手:微軟,英特爾和ATI,展開了對英偉達的圍剿。
英偉達的股價就一年,市值蒸發90%。
黃仁勳前一年剛入選美國《财富》雜志的《40歲以下的40位富豪》,以5.07 億美元的身家排在第12位,後一年他的個人财富縮水10倍,直接從"億萬"回到了"千萬"富翁。
差一個零還是差得挺多的哈。
所以,和微軟的這次合作可以說讓英偉達付出了慘痛代價。微軟當年可以說是行業标準的制定者,英偉達在剛創業的時候就因爲不符合微軟的行業标準就吃過一次大虧。現在和微軟鬧掰之後,英偉達又直接錯過微軟新規格确立的重要消息,
直接導緻新推出的GeForce FX因爲和微軟的标準不兼容,而被對手ATI推出的Radeon 9700打得一敗塗地。而更糟糕的是,GeForce FX還出現了運行溫度過高的問題,引發多次自燃事故,這也使得黃仁勳一度被遊戲玩家調侃爲"兩彈元勳"。
說到這裏,大家是不是覺得,老黃你怎麽就這麽倔呢?當個乙方,委屈一下怎麽了。但事實黃仁勳也意識到了錯誤,接下來就是忍辱負重的幾年。
2.3 忍辱負重
首先,黃仁勳意識到,在如此十面埋伏的境地,最大的甲方是得罪不起的。
所以,英偉達服了軟,在2003年2月6日與微軟共同宣布結束法律仲裁程序,"同意與微軟合作降低Xbox的未來成本"。這爲英偉達在2003财年帶來了4040 萬美元的額外收入。
另外一邊,在2002年底,英偉達終于争取到了索尼的訂單,爲下一代遊戲主機PlayStation3提供顯示芯片,這個時候遊戲主機中的另外兩個大玩家微軟和任天堂都被競争對手ATI搶走了,所以英偉達拿下索尼,是非常關鍵的一步。
與此同時,英偉達開始對英特爾表達誠意。我們之前說過,英偉達的主闆芯片組産品nForce一代發布的時候,是和AMD深度綁定的,隻兼容AMD的平台。2004年1月的CES國際消費電子展上,英偉達首次展示了支持英特爾标準的芯片組産品。而在2004年稍後,英偉達和英特爾達成相互授權的專利交叉許可協議。大家注意,這個協議之後又引發了兩家公司的一場硬仗,我們這個待會兒講。
至此,英偉達與行業中兩大巨頭關系緩解,訂單慢慢穩定,也不斷推出新産品受到市場好評,總算是化解了危機。
與此同時,英偉達與ATI的競争也日益激烈。就在這個時候,一個改變市場格局的事件發生了:黃仁勳的"老東家"、之前與英偉達同一戰線的AMD,收購了英偉達最大的競争對手,ATI。
2.4 重新洗牌
2004年第三季度,在獨立顯卡市場中,ATI的市場占有率在59%,而英偉達隻有37%。
英特爾對戰AMD,英偉達對戰ATI,CPU和GPU兩個戰場上的戰火,都越燒越猛烈。
2005年,英特爾宣布和ATI達成協議,爲英特爾新系列主闆提供解決方案,同時,我們剛才提到,英特爾也跟英偉達簽訂了專利許可。所以對于英特爾來說,CPU+GPU集成主闆策略還是湊效的。雖然這樣的集成主闆在最高端設備上的某些任務跑不過獨立顯卡GPU,比如說大型單機遊戲,繪圖或視頻編輯需求,但是對于中低端設備完全夠用,所以也獲活得挺舒服。而AMD就很焦慮了:眼看CPU争不過英特爾、在GPU這塊也沒辦法狙擊英特爾,并且AMD當時也認同GPU的發展會是未來重要的策略,于是一狠心一跺腳,做出了一個決定:買下市面上最好的GPU供應商。
也就是從英偉達和ATI中間選。最開始,AMD想買的是英偉達。
《福布斯》雜志的文章爆料,AMD前員工透露,當時AMD的首席執行官叫Hector Ruiz,他在2006年首先接觸的是英偉達,但黃仁勳堅持要擔任合并之後公司的首席執行官,所以老黃和Hector Ruiz沒談攏,AMD轉而去找了英偉達的對家ATI。
2006年7月,AMD宣布,以54億美元收購ATI,這也讓AMD成爲全球唯一一家有能力研發且生産CPU和GPU的廠商。市場認爲,一個強大巨頭即将誕生。
當所有人都爲英偉達的處境捏把冷汗的時候,黃仁勳卻看到了機會。他笃定,AMD吞下ATI之際必然有一段時間的消化和整合期,而英偉達需要抓住這個時期,重新找到市場優勢。
黃仁勳在接受Business Week采訪時說:"這簡直是天上掉餡餅一樣的禮物。ATI 基本上已經認輸了,我們成爲了世界上唯一一家獨立的圖形芯片公司。"
而黃仁勳知道,接下來的幾年,将是最重要的時刻。
2.5 "天上掉餡餅的禮物"
對于AMD來說,整合ATI并沒有想象中那麽容易,不僅不容易,還讓AMD傷筋動骨。
首先在财務上,收購ATI讓AMD背上了沉重的負債。
54億美元的收購金額中,42億美元是現金,12億美元是股票。 這個交易方案讓AMD貸款25億美元,幾乎用光了公司的賬面現金。
自從收購ATI之後,AMD的債務開始大規模增長,2006年AMD長期債務上升至37億美元,2007年更是上漲到50億美元。
AMD的負債表到2010年才降下來,一度讓AMD瀕臨破産。
以現在的上帝視角來看,當時的收購其實是有着大量的溢價。
在AMD收購ATI之前,ATI花了相當的時間在當時的顯卡領域中"買買買",把一衆老牌的顯卡芯片商還有一些核心技術都給買了個遍。這些專利和技術在ATI收購的過程中就産生了大量的溢價,也就是說,ATI花大價錢把自己吃成了個大胖子,然後這個大胖子又被AMD花更大的價錢吃掉。
并且,雖然看上去ATI擁有的各種技術專利很關鍵,但跟英偉達最先進的技術相比已經落後,所以在整合的時候又拖慢了節奏。總而言之,AMD吃進ATI才發現,這項收購對于AMD自身的資金結構和市場競争力來說,簡直是毀滅性的打擊,這直接導緻AMD在之後長達數年的時間中,對GPU的研發一直處于比較弱勢地位。
而且,AMD還被迫做出一個壁虎斷尾的動作:拆分自家的晶圓廠。
在2008年的時候,AMD的CEO Hector Ruiz,沒錯,就是當年主張要買ATI的那位,不得不将AMD的晶圓廠賣給了阿布紮比的ATIC公司,也就成爲了之後的Global Foundries晶圓廠。就這樣,AMD也和英偉達一樣成爲了一家無廠半導體公司。時隔多年,業内還有人歎息說,當時AMD的CEO Hector Ruiz賣掉晶圓廠是錯誤的選擇,讓AMD喪失了自主的晶圓制造能力,讓生産完全陷入被動。而Hector Ruiz也在将晶圓廠賣掉之後離開了AMD。
Hector Ruiz之後還出了一本書名爲《Slingshot: AMD's Fight to Free an Industry from the Ruthless Grip of Intel》(彈弓:AMD反抗英特爾的殘暴統治來解救整個産業)來爲自己正名,說如果不賣晶圓廠,AMD必破産無疑。
但是,爲什麽當年又要買ATI呢?
因此,AMD和ATI的合并暫時沒有産生1+1大于2的效果,反而在之後很長的一段時間内,都讓AMD在與英偉達和英特爾雙線作戰的時候力不從心。資金鏈緊張拖累了研發進度,市場占有率節節潰敗,AMD好幾年都掙紮在生死線上。
所以,AMD在CPU端輸給了英特爾,在GPU端也輸給了英偉達。公司股價也從2006年的40美元每股直線下挫到2008年的2美元,而這樣的頹勢一直持續到2016年。而就在AMD把自己折騰得夠嗆的時候,它的對手,英特爾和英偉達,已經在布局新的戰線。
而在AMD暫時不構成威脅的時期,市場上僅剩的兩個玩家,英特爾和英偉達,終于開打。
2.6 英偉達:"絕不和解"
也許從一開始,英特爾和英偉達這場戰鬥就必不可免。
AMD買下ATI,英偉達日漸羽翼豐滿,而英特爾也越來越意識到GPU未來發展的重要性。最重要的是,英偉達已經開始蠶食英特爾的地盤了。
2007年,英偉達推出Tesla系列,用于大規模的并聯電腦運算。這個Tesla和馬斯克的特斯拉電車沒關系,是老黃緻敬發明家尼古拉·特斯拉給取的名字。Tesla系列的推出意味着,英偉達的GPU計算解決方案已經可以涵蓋到個人電腦以及大規模的服務器集群。
也就是說,英偉達已經不滿足隻做英特爾的芯片組集成顯卡的提供商了。它開始進攻英特爾的蛋糕。而且,這個香饽饽客戶還是蘋果。
2007年,蘋果MacBook如果和英特爾合作的話,需要英特爾的Core 2 Duo CPU,再加英特爾的芯片組集成顯卡,包括"内存控制集線器",俗稱"北橋";以及"I/O控制集線器",俗稱"南橋"。一年之後,2008年的蘋果MacBook除了CPU還用英特爾的Core 2 Duo之外,剩下的直接替換成英偉達Tesla架構支持的集成控制器GeForce 9400MG。
于是,英特爾正式開打。
首先,英特爾牟足了勁想自研芯片。當時英特爾是芯片市場的絕對霸主:在個人電腦和服務器CPU市場中,英特爾的市場占有率是80%。在圖形處理器市場中,英特爾憑着"芯片組",也就是之前與英偉達等GPU公司合作的集成顯卡,也能占據市場的一半以上份額。
英特爾這麽大的公司,這麽多人才,給了這麽多年的機會,你自研一個獨立GPU芯片應該不是什麽難事吧。
結果,英特爾還真就研發不出來。
英特爾自研的GPU芯片平台叫做Larrabee。2009年12月9日,英特爾公司正式取消Larrabee GPU産品的推出計劃,主要原因就是産品的性能以及驅動的開發,遠遠落後于原先計劃。這讓市場大吃了一驚,當天英偉達股票就漲了超過12%。
那英特爾還有一招,就是跟英偉達決裂,提前脫鈎。
我們之前說到,2004年英偉達和英特爾達成相互授權的專利交叉許可協議。在2009年初,英特爾正式向美國特拉華州法院遞交訴狀,要求之前跟英偉達簽的授權協議不适用于英特爾下一代的集成内存控制器(integrated memory controller),也就是剛才這幅圖裏面北橋的這個部分。
也就是說:你,英偉達,之後不能再給英特爾提供GPU了。拜拜。
但是,老黃也是不是吃素的,一個月之後,2009年3月,反手就把英特爾給反訴了。英偉達指出英特爾違反合同,真正的目的是阻礙GPU技術。而當時老黃在接受采訪時,信誓旦旦地說:"絕不和解。"
這個官司一打就是2年。直到2011年,英特爾終于打累了,去找英偉達達成和解協議。
老黃提出的和解條件是:英特爾要在五年内向英偉達支付15億美元的專利使用費。英特爾這才發現,自己玩脫了。
而當時英特爾想不到的是,之後它和英偉達的差距會越拉越大。
而現在我們知道,2000年,英特爾的市值是2770億美元,世界排名第六,是英偉達的60倍,如今,英特爾市值是英偉達的七分之一。
回顧2000年到2011年,這11年,5家巨頭,6場戰役:微軟,ATI,AMD,英偉達與英特爾的混戰,真的可以說是高手過招,驚心動魄。
而英偉達暫時成爲了最後的赢家,順應着這十年快速成長,成爲GPU市場中的佼佼者。英偉達因爲專注研發最領先的GPU技術,将巨頭們都甩在身後。
但也是這十年,黃仁勳深刻意識到,産品過于單一、過于依賴性金主甲方的商業模式終究是不安全的。大客戶永遠想砍價、永遠想将技術變爲自有、永遠不會安分。于是老黃開始下注GPU産品的多樣性以及軟件生态的搭建。
而這,是英偉達真正能夠成爲萬億美元帝國的關鍵。
但是,這條路并不好走。
03 被華爾街估值爲"零"的CUDA
我們把時間線拉回2006年。
剛才我們說到,AMD買下ATI,英特爾準備研發自研芯片,整個GPU市場格局大洗牌之際,英偉達在思考,如何将自己身的技術更前沿化,修建更高的護城河,将産品更多元化,更少依賴單一大客戶。如果英偉達可以做到這一點,這将是未來GPU競争格局中的立足之本。
英偉達的首席科學家David Kirk提出了"将GPU技術通用化"的思路。
意思是:GPU在此之前主要是爲了圖形圖像處理而生,主要做3D渲染,遊戲方向是長期以來的核心業務。David Kirk認爲,英偉達應該探索"運行圖形渲染"之外的"通用計算"任務,這包括了超級計算機。再細一點說,将會是科學研究和計算、模拟、藥物發現、更專業的好萊塢制作等其他更高端的專業圖形領域。
因爲GPU編寫程序的複雜度非常高,如果要爲更通用的人群做GPU産品,那就要開始做軟硬件的生态,來滿足不同領域的開發者用他們已經熟悉的編程語言在軟件生态上編寫程序和應用,來驅動GPU處理不同的計算任務。
黃仁勳支持了David Kirk的想法,英偉達在2006年開始投入大量人員和資源研發這樣的并行計算程序開發環境,名爲CUDA。
這個想法在當年是非常有前瞻性的。但是,問題在于,可能太前瞻了,以至于外界質疑一片,完全無法理解老黃的決定。
非但不理解,華爾街衆人紛紛看跌英偉達。
英偉達開始全員投入研發CUDA平台。但這個決策意味着巨大的投資,導緻公司成本瘋狂上漲。建立生态從來都不是一件容易的事情。
在産品上,英偉達要在硬件産品中增加CUDA邏輯電路,這使得芯片面積變大、散熱增加、成本上升、故障率增高。
在2008年就發生了英偉達"顯卡門"事件,包括蘋果、戴爾、蘋果等多家筆記本電腦出現高溫下屏幕扭曲、畫面雜亂,或者幹脆開機了也沒屏幕的現象,引發全球不少用戶的不滿、發起了集體訴訟。
然後大家發現,原因是:他們都裝載的英偉達G84和G86顯卡系列,出現了問題。
很多人質疑,這是因爲CUDA對散熱的更高需求導緻了芯片瑕疵。無論如何, "顯卡門"危機對英偉達的打擊非常大,不僅讓蘋果這些大客戶對英偉達産生了不滿、對之後的手機芯片合作帶來負面陰影,還讓華爾街對英偉達的不滿上升到了極緻。
同時,英偉達投入了大量的人力和資金在CUDA上。反映在财報上,2008年之後英偉達的利潤大幅度走低,經營利潤甚至在2009和2010年出現大幅度虧損。同時又遇到金融危機的雙重打擊,英偉達股價重挫。
華爾街上所有人都在問黃仁勳,爲什麽要做CUDA,甚至華爾街将CUDA的市場價值定義爲"零"。
但從2008年金融危機之後英偉達股東的角度來看,這些質疑都是可以理解的。如果做CUDA的原因僅僅是基于"科學計算"的需求,你将所有市場加起來,也不過是個幾十億美元的小市場。你花這麽多人力,這麽多時間成本做這個東西,合理嗎?
當然,老黃在之後的幾年,特别是現在AI浪潮起來之後,終于向世界證明了合理性:正是因爲CUDA生态,英偉達才可以在AI時代占據GPU市場超過90%的絕對壟斷份額。但在當時,說實話,老黃在當年也無法準确預知,這個市場會有多大,是不是正确的選擇,更别提給華爾街證明了。
黃仁勳後來在接受采訪的時候說,他隻知道他押注的是"加速計算"并相信這是未來。如果這份堅持對的,那麽更大更寬的市場會向他打開大門。
終于,2012年的一個事件,讓黃仁勳更堅信了自己的選擇。
2012年是本輪AI浪潮的奠基之年。後來被稱爲"深度學習之父"的Jeffery Hinton教授帶着他的兩位學生Alex Krizhevsky和Ilya Sutskeverz,參加了全球最爲權威的計算機視覺大賽ImageNet大賽,設計的深度卷積神經網絡AlexNet一舉奪冠,開啓了之後十多年神經網絡AI的迅速發展,也奠定了如今生成式AI。
而Ilya Sutskeverz這個名字是不是熟悉?他就是如今OpenAI的首席科學家。
在AlexNet赢得ImageNet大賽的短短幾年後,他将從谷歌出走、帶領OpenAI叠代出GPT大模型,才有了如今的ChatGPT。
而這一年的比賽中,還有個大赢家,就是英偉達。
在Hinton團隊參賽的時候,他們發現,如果用CPU來訓練AlexNet,需要幾個月的時間,于是他們嘗試了一下英偉達的GPU,沒想到,他們驚喜的發現,兩張GTX580顯卡隻花了一周時間,就訓練完成了1400萬張圖片。
這标志着整個人工智能曆史上算力的重大突破。而英偉達裝載了CUDA的GPU GTX 580,從因爲功耗和發熱問題而臭名遠揚的"核彈顯卡",一夜之間,變成了通往未來最重要的必要裝備。很快,谷歌,IBM等各大廠商,還有各個高校實驗室,紛紛開始向英偉達訂購GPU。
而黃仁勳敏銳的意識到AI發展的重要性,開始加速打造爲AI設計的GPU硬件。
2016年,在OpenAI成立初期,老黃就親自把第一台裝載了8塊GPU,當時叫P100芯片的超級計算機DGX-1,送去OpenAI的辦公室。
在上面寫到:"緻馬斯克及OpenAI團隊,爲了計算和人類的未來,我向你們介紹世界上第一款DGX-1。" 落款,Jensen Huang。
這台DGX-1價值過百萬美元,是老黃帶領英偉達3000名員工,耗時三年打造,能把OpenAI 一年的訓練時間,壓縮到短短一個月。
OpenAI當時還是一個非營利組織,馬斯克,奧特曼等一衆早期員工興奮不已,拿着馬克筆在這台DGX-1上簽名寫下自己的名字。可能你也注意到,衆多簽名中有一個中文名字,範麟熙。他當時還在斯坦福求學,是OpenAI最早的實習生之一。如今,他也入職了英偉達。
這個時候,華爾街終于意識到,他們曾經給出"零市值"的CUDA,成爲了英偉達入局人工智能浪潮的秘密絕招。多年的布局已經讓CUDA軟件生态被衆多業界和學界專業人士所熟悉所推薦,護城河已築成。這時候,英偉達的競争者們也意識到GPU和CUDA生态的重要性,然而,他們已經落後得太遠了。
然而,英偉達的戰鬥還遠未結束。雖然人工智能屆已經意識到GPU的重要性,但當時,需求也隻停留在學術界和科技大廠實驗室。
AI的爆發增長點還沒到,老黃必須要靜待時機。
04 百變金剛
2012年之後,GPU的用途開始顯現在各個市場,英偉達開始多方布局。這些市場争奪戰,也是幾場硬仗。
有的打輸了,有的打赢了。但總之,就像黃仁勳預期的那樣,更多扇門向英偉達打開了。
首先,是手機芯片。
4.1 手機芯片:英偉達與三星,蘋果和高通
蘋果手機iPhone自2007年誕生以來,引領的智能手機熱潮推動了移動互聯網市場的高速發展。正因爲智能手機對圖像處理的高需求,這對GPU來說,成了一塊巨大的蛋糕。英偉達開始攻打手機市場,也引發了接下來幾年的混戰。
這是英偉達與三星,高通,以及蘋果之間的愛恨情仇。我們看看老黃是怎麽輸掉手機芯片這場戰鬥的。
我們剛才有提到,英偉達之前一直是蘋果Mac電腦系列的GPU提供商,而自然也想争取iPhone手機芯片的合作。
手機芯片這樣一塊大蛋糕,除了英偉達想合作,AMD也想,英特爾也想,三星也想,高通也想,聯發科也想,誰都想。那大家想想,蘋果怎麽想呢?
結果,蘋果說:你們都别想了。我自研。
2010 年,蘋果推出了首款自研芯片Apple A4處理器,由三星來代工,同時合作了高通的基帶芯片。我們來畫個簡單的動畫來給大家解釋一下移動手機芯片。
移動手機芯片被稱爲SoC,是System on Chip的縮寫,分爲兩個部分,分别是BP(Baseband Processor)和AP(Application Processor),前者指的是基帶芯片,我們手機能夠打電話上網,主要靠它;後者的AP指的就是處理器,包含了CPU和GPU。
所以,蘋果自研出來了自己的AP處理器并給三星代工之後,再加上高通已經積累了很多年經驗的BP基帶芯片,自然就沒英偉達什麽事了。英偉達雖然推出的獨立移動芯片,也就是AP處理器,叫做Tegra系列一度獲得了不少訂單,包括小米手機,小米3發布的時候雷軍還和黃仁勳在台上夢幻聯動;然而,英偉達最大的問題是,自己沒有基帶芯片的能力,廠商買了英偉達的Tegra處理器,還要另外向其他廠家買基帶芯片。
同時,雖然英偉達的移動GPU看似功能強大,但功耗發熱問題,以及英偉達是從電腦芯片"半途轉行"到手機芯片,底層架構被認爲比較老舊,有點水土不服。所以,一直以來,英偉達Tegra芯片的口碑并不算好。
到2014年第三季度的時候,蘋果的自研移動芯片占據整個市場13%的份額,高通是42%,三星4%,而英偉達在移動手機芯片上的市場占有率下降到僅僅1%。
然後,英偉達,就将三星和高通告上了法庭。
2014年9月,英偉達率先發起訴訟,不僅起訴三星,還起訴高通侵犯英偉達的圖形技術專利,說三星和高通在他們的SoC芯片中使用了英偉達GPU的7項專利權。之後,在兩個月後,三星迅速提出反訴,指控英偉達推出的Shield平闆電腦侵犯了三星的8項專利。
所以,這個官司一打就是接近兩年。終于,2016年,就在美國國際貿易委員會宣布最終裁決前幾個小時前,英偉達三星以及高通達成了庭外和解。當時市場覺得非常意外,英偉達當時告三星告高通不就因爲想收專利費嗎,但和解條款裏面沒有涉及任何的費用。想當年,英特爾和英偉達的官司也是和解的,但英偉達還向英特爾要了15億美元的專利費呢。
當年就有一些觀點認爲,可能英偉達覺得最終的判決會對英偉達不利,而且2016年的時候,英偉達已經找到了下一個發力的風口,決定放棄移動芯片市場,全力去進攻這個市場。
大家能從英偉達股價中看出來,新市場的業務已經起飛。所以,和解也就和解了吧。
雖然英偉達進攻手機移動芯片以慘敗收尾,但似乎老黃還沒有完全放下手機芯片這個大蛋糕。在三年前,2020年,英偉達一度想從軟銀手中買來ARM,想結合CPU和GPU,繼續進攻手機移動芯片,雖然這項交易最終因爲反壟斷法而流産,沒買成,不過也向我們透露出黃仁勳的野心:他依然在盯着每一個可能的市場。
軟銀旗下的ARM現在由孫正義主導,尋求在今年年底之前上市,我最近有聽到業内消息說可能會在十月定價,之後很快IPO。
回到蘋果上來,蘋果開啓自研芯片之路之後,與英偉達的合作關系就越來越淺了。蘋果還在2015年,挖走了英偉達深度學習軟件主管喬納森•科恩(Jonathan Cohen)。
各種事件的摩擦,也讓英偉達很不爽,在2019年,英偉達發布CUDA策略更新時,明确點名蘋果,表示未來的NVIDIA CUDA軟件産品将不再繼續支持蘋果的MacOS操作系統。
回顧蘋果自研芯片、遛了英偉達這麽一大圈,也告訴了黃仁勳一個道理:在商業世界裏,最好的客戶可能就是最危險的對手。如果甲方自己擁有了足夠好的技術,那麽乙方将不再被需要。
而這個道理對英偉達如此之深刻,以至于在老黃剛剛找到的新賽道中,又繼續給他上了一課。這個新賽道就是:自動駕駛。
4.2 自動駕駛芯片:英偉達與特斯拉
雖然老黃對手機移動芯片市場非常戀戀不舍,但當年英偉達轉去自動駕駛業務還是非常快狠準的。之前說到英偉達推出的Tegra系列除了手機等移動産品之外,在崛起的汽車自動駕駛行業,也是硬需求。
早在2012年,特斯拉就宣布采用英偉達的Tegra 3芯片,并且在高端車型Model S上率先使用。
之後的幾年,馬斯克和老黃其實一直眉來眼去,保持着非常好的關系。在2015年的英偉達年度GTC大會上,黃仁勳還把馬斯克請到了現場做嘉賓。
這場大會的一年後,2016年,特斯拉公布了Model 3的車型。而就在同一年,英偉達推出了基于兩顆Tegra處理器的Drive PX 2,以此希望在自動駕駛領域建立起GPU計算生态。
2017年,特斯拉Model 3開始交付,至此,Drive PX 2被裝備在了所有新生産的特斯拉車上,包括Model 3,還有Model X和Model S上。
簡單來說說GPU如何驅動自動駕駛。
我們都知道,特斯拉的自動駕駛系統名爲Autopilot,它的硬件部分是由8個攝像頭,12個超聲波傳感器,以及1個雷達系統。這些硬件部分會将探測到的數據傳給車的軟件系統名爲Tesla Vision,而給Tesla Vision提供算力的,就是GPU。
英偉達号稱,Drive PX2的算力等同于150台蘋果MacBook Pro,可以獨自滿足Tesla Vision達到L4,也就是4級自動駕駛所需要的所有計算任務的運算需求。L1到L5指的是自動駕駛的自動程度,如果到L5完全無人駕駛的程度,需要兩台Drive PX 2,而到L5之前,一台Drive PX 2就能搞定。
老黃暢想得很好,自動駕駛技術到L5還有很多年的研發時間,到此之前,特斯拉還有全球一衆的車企,全部都是英偉達的客戶。
但是,老黃很精,馬斯克更精。
在裝載Drive PX2的特斯拉車輛交付之後,非常硬核的一些美國特斯拉車主想看看傳說中的這個"自動駕駛心髒"長什麽樣子。于是他們開始拆特斯拉車,看看Drive PX2給裝哪兒了。
一般人肯定都猜不到,這麽重要的部件,居然就被安裝在了副駕駛前面的手套箱的面闆後面。
而且,很簡單幾步,把面闆拆了,就能把Drive PX2拿下來替換。當時市場就有聲音猜測:這麽便捷的更換方式設計,是不是意味着特斯拉想要保留GPU供應商随時更換的靈活性,甚至有一天,特斯拉自己自研GPU,也不用動車身的任何設計。
這個猜想,很快被驗證了。
特斯拉的自研FSD芯片在2017年12月第一次試産,2018年7月獲得認證後開始全面生産,2018年12月,特斯拉開始用新的硬件和軟件對員工用車進行改裝。在2019年3月,特斯拉開始在其Model S、Model X、Model 3上批量交付FSD芯片。
英偉達和特斯拉的蜜月期,也隻有短短幾年而已。而英偉達的股價,搭乘着特斯拉和自動駕駛的風口得到的漲幅,也在2018年底、特斯拉宣布自研芯片之後被腰斬。
而馬斯克也不太厚道,在推銷自己的芯片是"全世界最好的芯片"同時,還不忘拉踩英偉達,說FSD比英偉達的車載芯片要好7倍。氣得老黃硬氣發聲明回怼,說馬斯克拿特斯拉和英偉達的自動駕駛芯片比較不準确。馬斯克舉例的特斯拉芯片是"全自動駕駛自研芯片",運算能力是每秒144萬億次,然後拿英偉達舉例的是英偉達用于"輔助自動駕駛"的DRIVE Xavier芯片,運算能力是30萬億次。
老黃說,要公平的比,你應該比較的是英偉達的全自動駕駛電腦芯片NvidiaDrive AGX Pegasus,算力是每秒320萬億次。
特斯拉和英偉達結束合作之後,黃仁勳和馬斯克之前那麽好的私交也基本上成爲過去式了,也是挺唏噓的。
曾經馬斯克數次到英偉達GTC大會給黃仁勳站台,完全都沒有排練的,黃仁勳也相信馬斯克不會有出格的言論,隻是開玩笑的警告他說,"不要毀了我的大會",而我們之前提到過,黃仁勳也在馬斯克開創OpenAI的早期,親自把GPU送過去。結果,蘋果發生在英偉達身上的教訓,在特斯拉身上又得到了驗證。
但是,就在英偉達股價跌倒低點之際,有一扇門給英偉達打開了,這就是加密貨币。
4.3 加密貨币:英偉達與挖礦
在2019年初,區塊鏈風口來了。其實這個風口有兩個牛市,第一個是在2016年到2017年,之後再是2019年開始的第二個牛市。在這兩個牛市中,英偉達都賺得盈滿缽滿。
比特币,以太坊,還有各種各樣的加密貨币價格飛漲。比特币價格從2019年的3000多美元瘋長到2021年底的超過6萬美元。
我們知道,加密貨币的一大特點是它們是可以用電腦算法來獲取加密貨币,這個過程簡稱"挖礦",而手持GPU的這批"挖礦"者,被稱爲"礦工"。這些礦工們爲了加快獲取加密貨币的速度和效率,購買了大量的GPU,構建了大規模的算力的顯卡集群,來集中"挖礦"。
這樣的行爲雖然推高了英偉達GPU的價格,甚至引發了遊戲玩家的集體不爽,但英偉達确是躺赢的狀态。黃仁勳立馬從與馬斯克決裂的傷感中脫離出來,掉轉馬頭,進軍區塊鏈領域。
在加密貨币風光的那幾年,黃仁勳的話風變爲了各種說以太坊有價值,加密貨币挖礦的未來,雖然在2023年3月的一篇采訪中,英偉達的首席技術官又說加密貨币無法給社會帶來啥價值,AI有價值多了。
就感覺,妥妥精明的生意人。
但在挖礦浪潮中,英偉達動作很快,各種推出專門面向"挖礦"定制的專業礦卡,比如說GTX 1060,還有之後的P106、P104這種擁有更強算力的專業礦卡系列,以及再之後的CMP系列。但要注意的一點,這些專業礦卡就是爲了挖礦生産的,遊戲玩家們沒辦法用,而且,CMP礦卡直接舍棄了圖形處理功能。
這讓很多遊戲玩家們覺得很寒心,覺得英偉達你可是遊戲業務起家的,現在完全置遊戲用戶們于不顧了。
2021年,新冠疫情席卷全球,供應鏈中斷使得全球芯片短缺、價格飙升,同時,美聯儲降息刺激經濟引發市場中流動性泛濫,推動加密貨币價格持續走高。這一年,英偉達全年收入創下269.1億美元,較上一财年的166.8億美元增長61%,首次實現連續7個季度營收上漲。
這一次英偉達的甲方是市場周期。當市場周期不再是你的朋友,就像之前的微軟,蘋果,特斯拉一樣,英偉達就會摔得很慘。從越高的地方,摔得越慘。
2021年底,加密貨币的牛市結束,各類資産價格大跌。同時,以太坊因爲升級,從POW(工作量證明)轉成了POS(權益證明),簡單來說,過去靠堆算力來産出以太坊的方式已經被棄用。這使得,礦工手中大批英偉達顯卡不再有價值。
2022年可以說,是英偉達最近禍不單行的一年。
先是3月,英偉達遭遇黑客攻擊,導緻超過1TB的數據洩露,其中包括了驅動程序、設計圖紙和固件等資料,對方認領是南美的勒索團夥Lapsus,目的是要讓英偉達開放Windows、Mac OS以及Linux系統下的GPU驅動、解除特定顯卡的挖礦限制,目的就是爲了"挖礦"。
英偉達在反擊失敗,一些重要的信息和數據被黑客洩露之後,還是在5月認慫,宣布将Linux GPU 内核模塊作爲開放源代碼發布。
大家還記得在這個系列的開頭,"Linux之父"Linus Torvalds給英偉達豎的中指嗎?就是因爲英偉達長期以來拒絕開源,使得Linux用戶體驗非常差。沒想到,豎中指的十年之後,英偉達終于給開源了,但原因竟然是因爲黑客勒索。也不知道Linus Torvalds應該開心還是無語。
然後同樣在五月,英偉達受到美國證監會SEC的指控,認爲英偉達在2018财年的連續幾個季度中"沒有披露加密貨币挖礦是公司遊戲收入同比增長的重要因素",從而涉嫌誤導投資人。英偉達對此,也沒有申辯,而是選擇了和解,支付了550萬美元。
在2022年,英偉達股價大跌。每股價格從2021年11月26日的315美元上方跌到2022年10月的112美元左右,跌幅接近65%。
然後,就在一個月之後,2022年11月30日,OpenAI發布ChatGPT,生成式人工智能浪潮來了。
在2012年播種了AI市場爆發的期望之後,折騰了這麽久,黃仁勳和英偉達終于等到了AI的勝利果實。
05 英偉達與AI:利潤1000%的生意
如今在AI芯片市場中,英偉達的市場占有率高達95%。在全球巨頭争先恐後的步入大模型訓練之戰時,英偉達這可怕的壟斷,意味着絕對的市場定價權。
英偉達很早之前就密切關注這輪大模型的進展,從OpenAI的第一台GPU,到之後微軟幫OpenAI訓練ChatGPT用的一萬顆英偉達A100 GPU打造的超級算力中心,英偉達都非常清楚AI的進展。
英偉達的GPU,是如今訓練通用模型的最優解。GPU在AI工作中的能效是CPU的20倍,英偉達最新發布的H100 GPU在訓練大型語言模型方面的效率是CPU的300倍。而英偉達CUDA軟件框架則提供了一個通用平台,允許開發人員和用戶在不同型号和連續幾代GPU上運行相同的軟件,實現無縫升級,并顯著簡化原始開發。
我前幾天和矽谷這邊的一個頭部VC Andreessen Horowitz專門看硬件的投資人聊,他說如今英偉達的護城河并非GPU本身,而是在軟件部分。當其他競争對手看到了這塊蛋糕快速推出同類型産品時,即使GPU本身的性能沒有太大差别,但市場用戶們還是會因爲太熟悉CUDA的軟件生态而不願意選擇非英偉達的GPU。這就是CUDA從2007年開始積累的生态力量,形成了英偉達如今強大的護城河。
在2023年8月中旬,《巴倫周刊》資深作家Tae Kim在社交媒體上爆料,投行Raymond James的數據顯示,制造一枚英偉達H100芯片隻需3200美元,但H100的售價高達3萬美元,這樣算下來H100芯片的成本利潤率達到了不可思議的1000%。
我就此也咨詢了英偉達内部的線人,他确認了這個數字,還告訴我因爲如今英偉達GPU一貨難求,不少國際上的科技大廠願意加價購買,甚至将A100和H100混着賣,英偉達也能有8倍左右的利潤。而且這樣的排期已經到了兩年後。
而這樣的定價權,将英偉達送上了萬億美元市值的寶座,成爲了有史以來第六家公司加入這樣的trillion dollar club。2023年8月23日,英偉達公布了2023年第二季度财報,第二财季營收爲135.07億美元,比上年同期翻倍,比上個季度環比增長88%,創下曆史紀錄。此外,淨利潤爲61.88億美元,與上年同期暴漲843%,比上一财季環比增長203%,并且公司未來展望也大幅度好于預期。這讓英偉達的股價,又一次暴漲。
當然,英偉達這一次又能風光多久,還是一個未知數。芯片市場中的競争從來都是殘酷的,這一點可以從我們之前講的每一個例子,每一個時期都能看出來。
而就在英偉達站在最風光的勝利山頂,也面臨着高處不勝寒的風險:谷歌的TPU,英特爾将在2025年推出的Falcon Shores,AMD除了推出MI300之外,英偉達的大客戶微軟也正在與AMD合作共同自研人工智能處理器"雅典娜"(Athena),來制衡英偉達。矽谷不喜歡壟斷的供應商,競争一定會加劇,另外一些專業領域的芯片比如說ASIC,Analog,還有FPGA芯片這些小玩家,也在虎視眈眈,尋找更專業的AI切入口。
雖然1000%的利潤率确實也讓英偉達還有很高的降價空間、這一回合的血确實很厚,但英偉達還面臨一個最大的風險,就是這一輪生成式人工智能是基于Transformer模型發展出來的,它很強大、通用性很強,但AI發展尚在早期階段,而Transformer不一定是帶領人類到達通用人工智能AGI的正确解或者最優解。如果之後大模型發展遇到瓶頸,或者有其他的技術路徑出現而GPU不适用的情況,需求消失,英偉達會再次面臨巨大的市場風險。
但黃仁勳并沒有停止戰鬥的意思。他如今已經是矽谷科技巨頭中現任最久的CEO了,1993年成立英偉達以來已經持續戰鬥了30年,而他在接受CNBC采訪的時候說,他還能再戰鬥30年。就算之後肉身不在了,還能以AI數字人的方式繼續戰鬥。
在這一系列視頻中,我們幾乎把英偉達發展路徑翻了一個底朝天,發現老黃真的是戰鬥力爆表的一名創始人,作爲一家2B的芯片公司,英偉達的崛起幾乎就是跟各大科技巨頭不停合作、不停競争、不停戰鬥、不停打官司、不停折騰一路走來。
黃仁勳在技術上是堅持的,雖然這樣的堅持讓很多客戶不爽,也讓英偉達丢了很多合作,摔過很多摔,但也許沒有這樣的堅持,英偉達也不會有如今早已鋪墊好的護城河。在商業上,黃仁勳是精明的,他足夠敏銳足夠靈活,雖然在加密貨币提供礦機的幾年背負了很多罵名,但至少,那幾年的業務讓英偉達撐到了AI爆發的周期,作爲一名商人也無可厚非。
英偉達沒有永遠的客戶,沒有永遠的朋友。黃仁勳是孤獨的,也是叛逆的,他能做的,隻有不斷往前跑,戰鬥永不停止。
2005年,英特爾制定了"鍾擺計劃"。當時,英特爾公司創始人之一、76歲的戈登.摩爾提出了摩爾定律,制定了英特爾處理器微架構和芯片制程更新的時間線。他預測,"芯片上的晶體管每24個月翻一倍,即半導體行業的産品性能每兩年翻一倍"。
而在2012年,黃仁勳提出了Huang’s Law黃氏定律。他認爲,随着芯片制造商已經達到原子級電路和電子物理的極限,摩爾定律已經過去。而在AI時代,GPU将推動AI性能實現逐年翻倍。
英偉達首席科學家Bill Dally分享了一組數據支持黃氏定律,說從2012年11月到今年5月,英偉達的芯片性能在人工智能計算方面提升了317倍。換句話說,目前英偉達人工智能芯片的增長速度保持在每年增長一倍多的水平上。
而這樣的增長能持續多久呢?人工智能将帶給我們如何的一個新世界呢?這個問題我們無法回答,但确定的是,英偉達,黃仁勳,還有他的一衆對手們,還将會持續戰鬥。