第二期華夏基石數智時代領導力特訓營熱招中!
報名即送十月管理論壇名額一個!價值12800元!
來源 | AI工作坊,管理智慧
咨詢合作| 13699120588
文章僅代表作者本人觀點,圖片來源于pixabay
金句整理
——公司的真正潛力不在于當前規模,而在于其'魚塘'大小——市場創造者通過開辟新天地獲得無限可能,而僅專注于在現有市場中争奪份額的企業終将受限,因此企業應以前瞻性思維拓展'魚塘',而非局限于現狀
——所有偉大的公司都應該有這樣的核心問題:你們正在做的事情是否必要?是否有價值?是否有影響力?是否能幫助到人?
——我們自己已經有AI芯片設計師、AI軟件工程師、AI驗證工程師,所有這些AI都在内部構建,因爲我們有能力,我們也樂于親自探索這些技術的可能性
——我的工作并不總是有趣的,當然也沒有指望它有趣。你問我這是不是我期望的,我會說因爲工作是重要的。我不太看重自己,但我非常認真對待我的工作和責任以及我在這個時代的貢獻
近日,NVIDIA首席執行官黃仁勳(Jensen Huang)就AGI發展、AI市場前景及其對各行業的影響等話題接受了采訪。作爲科技行業的領軍人物,黃仁勳對AI的現狀和未來提出了一些個人見解。
黃仁勳首先強調了區分AI模型與AI應用的重要性。他指出,模型隻是AI的基礎組成部分,真正的價值在于AI的具體應用。無人駕駛、人形機器人、聊天機器人等不同領域的AI雖有關聯,但各自特點鮮明。這意味着AI産業鏈的每個環節都蘊含商機,但并非無限。
談及AI對企業管理的影響,黃仁勳認爲AI将成爲企業決策的有力助手。AI可以幫助自動化流程、拓展思考維度,但确定核心問題仍需人爲判斷。他預見每個人都将成爲"AI代理的CEO",通過創造力和推理能力來指導AI完成任務。他認爲,通過AI之間的交流、辯論和強化學習,可能産生類似于人類頭腦風暴的效果,從而實現智能的進一步提升。他同時也分享了自己使用AI的親身體驗。他表示AI已成爲自己日常工作中不可或缺的工具,無論是研究、驗證還是頭腦風暴,AI都在其中發揮着重要作用。
他堅信,AI将爲社會帶來巨大貢獻,而繼續探索AI的無限可能性,正是他堅持不懈的動力所在。
( 1:50 ) AGI 和個人助理的演變
( 15:51 ) AI推理和訓練的未來
( 19:01 ) 構建AI基礎設施
( 31:35 ) 創造AI未來的新市場
( 43:25 ) AI模型的未來
( 55:54 ) 推理時間推理及其重要性
( 01:00:46 ) AI在生産力方面的作用
( 01:12:31 )開源與閉源的平衡
主持人: 我們現在在英偉達的總部,就在Imer街的附近。歡迎你!
嘉賓黃仁勳: 謝謝,謝謝。
AGI即個人口袋助手
主持人: 今年的主題是從智能擴展到通用人工智能(AGI),這真是讓人難以置信。兩年前我們第一次談論這個話題時,還處于AI的時代,那時距ChatGPT發布隻有兩個月的時間。而如今的變化令人難以置信。我想我們可以通過一個思想實驗開始,并做一個預測。如果我把AGI設想成一個口袋裏的個人助手,它會了解我所有的信息,擁有完美的記憶,能夠和我交流,幫我訂酒店,甚至幫我預約醫生。你覺得,随着世界變化的速度,這樣的個人助手什麽時候能真正出現在我們的口袋裏?
黃仁勳: 很快,以某種形式吧。是的,很快。這個助手會随着時間的推移變得越來越好,這是科技的魅力所在。所以一開始它會很有用,但不會完美,随着時間推移,它會越來越完美,就像所有的技術一樣。
主持人: 當我們觀察變化的速度時,我記得Elon(馬斯克)曾說過,唯一重要的就是變化的速度。而我們現在感受到的變化速度似乎已經加快到了前所未有的程度。因爲我們一直在圍繞AI這個話題轉悠了十年,而你甚至比我們還要早。這是你職業生涯中見過的最快的變化速度嗎?
黃仁勳: 确實如此,因爲我們已經重新定義了計算。很多變化都是因爲我們在過去十年裏将計算成本降低了十萬倍。摩爾定律隻能帶來百倍的增長,而我們做到了十萬倍。我們通過幾種方式實現了這一點:首先是引入了加速計算,把一些在CPU上效率不高的工作放到了GPU上。其次是我們發明了新的數值精度、新的架構,比如張量核心。我們還發明了新的系統架構,比如NVLink,以及極其快速的存儲器HBM。所有這些創新都促成了計算能力的飛速發展。
結果就是,我們從人類編程走向了機器學習,而令人驚訝的是,機器學習的速度也很快。随着我們重新定義計算的分布方式,我們引入了各種形式的并行計算,包括張量并行、流水線并行等,我們變得擅長在這些基礎上發明新的算法和訓練方法。這些技術和創新互相疊加,最終帶來了令人難以置信的進展。以前的摩爾定律時代,軟件是靜态的,預編譯後裝入商店,硬件按摩爾定律增長。而現在整個堆棧都在增長,我們在所有層面上進行創新,因此我們看到了前所未有的擴展速度。确實如此。以前我們讨論的是預訓練模型的擴展,每年翻倍模型大小和數據量,計算需求也因此每年增加四倍。而現在我們在推理階段也看到了擴展,甚至有人認爲預訓練很難,而推理很簡單,但現在看來一切都變得更加複雜。這也很合理,畢竟把所有人類思維都簡化爲一次性反應是荒謬的。快速思考和慢速思考、推理、反思、叠代和模拟,這些概念現在都開始顯現了。
主持人: 我認爲關于英偉達的一個被普遍誤解的事情,就是英偉達的競争護城河到底有多深。我覺得有一種說法是,一旦有人發明了一個更好的芯片,他們就赢了。但事實上,你們過去十年一直在構建的是從GPU到CPU再到網絡,尤其是軟件和庫的全棧架構,能夠支持應用程序的運行。所以,當你思考今天的英偉達時,你覺得今天的競争壁壘比三到四年前更了,還是更小了?
黃仁勳: 我很感謝你能認識到計算的變化。實際上,很多人過去認爲,包括我現在還有很多人認爲,隻要設計出一個更好的芯片,擁有更多的計算能力,更多的浮點運算能力(flops),就赢了。你知道他們的意思,他們在發布會上展示的都是關于這些浮點運算能力、條形圖之類的東西。這當然很重要,計算能力确實很重要。然而,這種思維方式已經過時了。這是一種過時的想法,因爲過去的軟件都是在Windows上運行的,軟件是靜态的,也就是說,你提升系統性能的最好方法就是做出更快的芯片。但是我們意識到,機器學習并不是人類編程。機器學習不僅僅是軟件的問題,它關乎整個數據管道。
事實上,機器學習的關鍵是"飛輪效應",這是最重要的事情。因此,我們要考慮如何讓這個飛輪高效運轉,同時讓數據科學家和研究人員在這個過程中保持高效。很多人甚至沒有意識到,光是數據的整理和訓練都需要AI,這個過程本身就非常複雜。
英偉達競争優勢
主持人: 是的,而且這個AI本身也在不斷加速,對吧?當我們考慮競争優勢時,它是整個系統的組合效應。
黃仁勳: 完全正确。正是因爲有了更智能的AI來整理數據,我們現在甚至有了合成數據生成以及各種不同的數據整理方式。因此,在進行訓練之前,你已經有了大量的數據處理工作。很多人認爲PyTorch是這個過程的起點和終點,PyTorch确實很重要,但别忘了,在PyTorch之前有大量工作,之後也有大量工作。所以,當你考慮這個飛輪時,應該從整體來看待它,而不僅僅是關注訓練這一塊。你應該設計一個計算系統和計算架構,能夠讓這個飛輪的每一步都盡可能高效,而不僅僅是某個特定的應用場景的訓練。這種思維方式有意義嗎?訓練隻是其中的一步,每一步都是艱難的。
所以,你要做的第一件事不是想着如何讓Excel運行得更快,或者如何讓遊戲《毀滅戰士》運行得更快,那是過去的思維方式。現在你要思考的是,如何讓整個飛輪轉得更快。而這個飛輪包含了很多不同的步驟,機器學習沒有任何容易的部分,你們也知道,無論是OpenAI做的事情,還是DeepMind的Gemini團隊做的事情,都不是簡單的任務。所以,我們決定這才是你應該關注的整個過程。你需要加速每一個步驟,尊重Amdahl定律。如果某個步驟占用了30%的時間,你把它加速了三倍,但實際上并沒有加速整個過程很多。你要做的是加速每一個步驟,這樣才能真正顯著地提高循環時間和整個飛輪的效率。
這個學習的加速過程,最終會帶來指數級的提升。因此,我想說的是,一個公司對自己在做什麽的理解,最終會體現在産品中。正如你所看到的,我一直在談論這個飛輪,整個系統的飛輪。我們現在加速一切。現在的主要焦點是視頻,很多人專注于物理AI和視頻處理。你能想象一下前端每秒數TB的數據流入系統的場景嗎?舉個例子,展示一下如何構建一個能夠攝取所有這些數據并準備訓練的管道。整個流程都是通過Cuda加速的。今天,大家大多還在關注文本模型,但未來的視頻模型同樣重要。我們還會使用一些像o1這樣的文本模型來處理大量數據,甚至在我們真正進入訓練階段之前。語言模型将參與到每一個步驟中。整個行業花了巨大的技術力量和努力來訓練大型語言模型,現在我們幾乎在每一步都在使用這些語言模型,真是不可思議。
主持人: 我不想把這件事說得過于簡單,但我們經常聽到投資者問:"那定制的ASIC呢?競争壁壘會不會因爲這個被打破?"我聽到你說的是,在一個組合系統中,優勢會随着時間的推移而增長。所以我理解的是,我們的競争優勢比三四年前更強,因爲我們在不斷改進每一個組件,而這種改進是累積的。再舉個例子,比如英特爾作爲商業案例研究,他們在某個周期的頂峰時具有顯著的競争優勢。你能簡單比較一下今天你們的競争優勢與他們在巅峰時期的競争優勢嗎?
黃仁勳: 英特爾确實很了不起,他們可能是第一家在制造工藝、制造和芯片設計方面極其優秀的公司。他們在x86架構上不斷提升芯片速度,這就是他們的輝煌成就,他們将制造與設計完美結合。我們的公司有些不同。我們意識到,實際上,并行處理并不需要每個晶體管都要完美無缺,而串行處理則需要每個晶體管都非常優秀。并行處理需要大量晶體管更具成本效益。我甯願要10倍更多的晶體管,但速度慢20%,也不願要10倍更少的晶體管,但速度快20%。
他們喜歡的可能是相反的,串行處理和并行處理非常不同。我們發現,實際上,我們的世界并不是往下走得更好,而是往上走得更好。并行計算很困難,因爲每個算法都需要爲不同的架構重新架構。很多人不知道的是,你可以有三個不同的CPU指令集架構(ISA),它們各自都有自己的C編譯器,你可以将軟件編譯到ISA上,但這在加速計算和并行計算中是做不到的。
發明架構的公司必須自己創建特定領域的庫,比如我們革命性地推進了深度學習,因爲我們有一個叫cuDNN的領域特定庫。沒有cuDNN,就沒有人談論cuDNN,因爲它在PyTorch、TensorFlow等框架的下層運行。以前還有Cafe和Theano,現在有Triton和許多不同的框架。因此,cuDNN是一個領域特定的庫,Optics是一個,cuQuantum是一個,Rapids是另一個,用于行業特定算法的庫都位于PyTorch下層。我常聽到人們說,如果我們沒有發明這些,任何應用程序都無法工作。你們明白我的意思吧?NVIDIA擅長的是算法,我們在架構和科學的融合方面非常優秀。
推理模型訓練
主持人: 現在大家都關注推理階段了。我記得兩年前,Brad和我跟你共進晚餐時,問過你一個問題:"你認爲在推理階段,你們的壁壘會和訓練階段一樣強大嗎?"你剛才提到的許多因素,比如靈活性,對于客戶來說能夠在不同階段之間保持靈活性非常重要。既然我們已經進入了推理的時代,推理訓練正以規模化的方式進行,你對此有什麽看法?
黃仁勳: 是的,你說得對。如果你訓練得很好,那麽在推理階段很可能也會表現得很好。如果你基于這個架構進行訓練,即使沒有特别的優化,它也能在這個架構上運行。當然,你可以去爲其他架構進行優化,但至少它已經在英偉達的架構上構建了,肯定能夠在英偉達上運行。另一個方面是資本投資的考慮。當你訓練新模型時,你會希望用最好的新設備來進行訓練。而那些你昨天用過的設備,正好适合用來進行推理。因此,新設備之後會留下一些免費的設備和基礎設施,而這些都與Cuda兼容。我們非常有紀律地确保整個系統的兼容性,這樣我們留下的所有東西依舊可以發揮極大的作用。我們還投入了大量精力不斷重新發明新的算法,這樣當時機成熟時,Hopper架構的性能可能會比購買時提高兩到四倍,基礎設施仍然能保持很高的效率。我們所做的所有工作,包括改進新算法、新框架,都會對我們所有現有的基礎設施有益。Hopper受益,Ampere也受益,甚至Volta也受益。
我記得Sam剛剛跟我說,他們最近才在OpenAI停用了他們的Volta基礎設施。所以我認爲,我們留下了一條堅實的安裝基礎,就像所有計算設施一樣,英偉達在每一個雲中都存在,無論是本地還是邊緣設備。現在創建的視覺語言模型可以在邊緣設備上的機器人上完美運行,無需修改,因爲它們全部與Cuda兼容。所以,我認爲架構的兼容性對大規模應用非常重要,就像iPhone或其他設備一樣。我認爲安裝基礎對推理非常重要,而我們真正受益的是,因爲我們正在爲這些大型語言模型構建新架構,所以我們可以思考如何設計出在未來推理時表現出色的架構。
我們一直在考慮推理模型,特别是如何爲你的個人助手創建非常互動的推理體驗。你不希望它聽到你的話後需要長時間思考,而是希望它能快速回應。于是我們發明了NVLink,這樣我們可以利用這些系統進行高效的訓練,并且在訓練完成後,它們的推理性能依然非常出色。我們希望優化的是從開始到生成第一個詞的時間。而實現這個目标非常困難,因爲這需要大量的帶寬。如果你的上下文豐富,你還需要大量的計算能力。因此,要在幾毫秒内實現響應,你同時需要無限的帶寬和計算能力。這種架構非常難以實現,我們爲此發明了Grace Blackwell NVLink。
主持人: 我本周早些時候和Andy Jassy一起吃了晚餐,Andy說我們有Trainum和Inferentia即将推出。很多人認爲這是英偉達的威脅,但緊接着他說,英偉達對我們來說是非常重要的合作夥伴,而且在可預見的未來都會保持這種重要性。他說,世界運行在英偉達的基礎上。當你考慮到定制的ASIC,比如Meta的推理加速器,或者亞馬遜的Trainium,以及谷歌的TPU,再加上你們當前的供應短缺問題,這些因素是否會改變現狀?或者這些隻是對你們系統的補充?
黃仁勳: 是的,實際上我們在做的是不同的事情。英偉達的目标是爲這個新的世界——機器學習的世界、生成式AI的世界、具備代理能力的AI的世界——構建一個計算平台。我們想要創建的東西非常深遠,在經過60年的計算之後,我們重新發明了整個計算棧。我們改變了從編程到機器學習的軟件編寫方式,改變了從CPU到GPU的軟件處理方式,改變了從軟件到人工智能的應用方式。每一層技術堆棧都發生了變化。我們希望創建一個随處可用的計算平台。
我們現在做的事情非常複雜。如果你想象我們所做的事情,我們實際上是在構建一個完整的AI基礎設施,我們把它視爲一台計算機。正如我之前說過的,數據中心現在是一個計算單元。當我思考一台計算機時,我不隻是在思考一個芯片,而是在思考整個系統,包括所有的軟件和協調工具,這就是我的計算機模型。我們每年都在努力構建一台全新的計算機。沒有人曾經像我們這樣,每年都構建一台全新的計算機,每年都将性能提升兩到三倍,每年都将成本降低兩到三倍,每年都将能效提高兩到三倍。因此,我們會告訴客戶,不要一次性購買所有設備,每年買一點。這樣,他們可以更好地成本平均化到未來,而所有設備都是架構上兼容的。
這樣快速地構建新的系統已經非常困難了,而更難的是,我們要把所有這些技術解耦開來,并将其整合到GCP、AWS、Azure以及其他平台中。每個平台的集成都是不同的,我們需要把我們的所有架構庫、算法和框架整合到他們的平台中。我們需要把我們的安全系統、網絡都整合進去,對吧?我們每年都進行大約10次集成操作,每年都是如此。這真是個奇迹,但同時也是瘋狂的。
英偉達市場策略
主持人: 你們每年都在做這件事。是什麽促使你們每年都這樣做呢?還有,Clark剛從台北、韓國和日本回來,拜訪了你們的供應商合作夥伴,這些合作關系已經持續了十年之久。你覺得這些長期的合作關系對建立競争壁壘有多重要?
黃仁勳: 當你系統地分解這些事情時,越分解,你會越感到驚訝。整個電子行業的生态系統今天都在與我們合作,最終構建出一個計算機集群,這個集群被集成到所有不同的生态系統中,且協調非常順暢。當然,這背後有API、設計方法、業務流程以及設計規則,這些東西我們已經推行了幾十年,并且它們還在不斷進化。當這些API整合在一起時,無論是在台灣,還是世界各地生産的設備,最終都會落地到Azure的數據中心,所有東西都順利地"咔咔咔"組合在一起。有人調用OpenAI的API,一切就能正常運轉。這就是我們發明的——這個龐大的計算基礎設施。整個地球都在和我們合作,這些系統無處不在。你可以通過Dell銷售,也可以通過HP銷售,它們在雲端托管,甚至延伸到邊緣設備。現在人們在機器人、自駕車上使用它們,它們全部與架構兼容,這确實是瘋狂的。關于你的ASIC問題,我的意思是,我們隻是在做不同的事情。
作爲一家公司,我們要有情境意識,我非常清楚我們公司周圍的一切,包括我們的生态系統。我知道所有人正在做的替代方案,有時這些方案對我們有競争性,有時沒有。我非常清楚這些事情,但這不會改變我們公司的使命。我們公司的唯一使命就是構建一個能夠無處不在的架構,一個平台。這就是我們的目标。我們不是要從别人那裏搶市場份額,英偉達是市場創造者,而不是市場份額的掠奪者。如果你看看我們的公司幻燈片,你會發現,我們從來不談論市場份額。我們所關注的是如何創造下一個東西,解決下一個問題。我們想的是如何讓原本需要一年的飛輪運轉時間縮短到一個月的時間,光速是什麽?我們在考慮這些不同的問題。我們對周圍的一切都有情境意識,但我們對我們的使命非常明确。唯一的問題是,這個使命是否有必要?
所有偉大的公司都應該有這樣的核心問題:你們正在做的事情是否必要?是否有價值?是否有影響力?是否能幫助到人?我非常确信,如果你是一個開發者,或者你是一家生成式AI初創公司,正在決定如何成爲一家企業,有一個選擇你不需要做,那就是支持哪種ASIC。如果你支持Cuda,你就可以走遍天下。之後你可以随時改變主意。我們是AI世界的入口。一旦你決定進入我們的平台,其他決策可以推遲。你随時可以自己構建ASIC,我們對此并不反感。當我們與所有的GCP合作時,比如與Azure、AWS合作時,我們會提前幾年向他們展示我們的路線圖。他們不會向我們展示他們的ASIC路線圖,但我們也不會對此感到不滿。如果你的使命明确,并且這個使命是有意義的,透明性就不會成爲問題。你們在GTC上看到的路線圖對我們的朋友Azure和AWS來說更加深入。即使他們在構建自己的ASIC,我們仍然沒有問題。
主持人: 人們觀察我們公司時,你說過,最近對Blackwell的需求非常大。你還說,工作中最艱難的一部分是面對無法滿足所有人計算需求的情緒壓力。批評者說,這隻是暫時的現象。他們說這就像2000年的思科一樣,我們正在過度建設光纖網絡,這會是一次繁榮與衰退的周期。你還記得2023年初我們共進晚餐時,當時預測英偉達2023年的收入是260億美元,而你們最終實現了600億美元的收入。
黃仁勳: 我的确記得。我要說的是,這是曆史上預測失敗得最嚴重的一次,對吧?(哈哈哈哈)
Blackwell的需求
主持人: 我的感受是,2022年11月時我們非常興奮,因爲像來自Inflection的Mustafa和來自Character的Noah這樣的創業者來我們辦公室談論他們的公司投資時說,如果你無法投資我們的公司,那就買英偉達的股票吧,因爲全世界的人都在争搶英偉達的芯片來構建這些将改變世界的應用程序。當然,ChatGPT的誕生引發了這個"寒武紀時刻",而這些分析師們卻還沉浸在加密貨币的"寒冬"中,無法想象這個世界正在發生的變化。結果遠遠超出了預期。你說過,現在對Blackwell的需求非常大,并且這種情況在未來可見的時間内都不會改變。當然,未來是未知的,但爲什麽批評者會如此錯誤地認爲這次不會像2000年的思科那樣,出現過度建設的情況呢?
黃仁勳: 從第一性原理出發思考未來是最好的方式,對嗎?那麽問題是,我們現在在做的事情的第一性原理是什麽?首先,我們在做什麽?我們正在重新發明計算,不是嗎?我們剛剛說過,未來的計算将高度依賴機器學習,對吧?幾乎我們做的每一件事、每一個應用程序,比如Word、Excel、PowerPoint、Photoshop、Premiere、AutoCAD,所有這些過去是由人類手工設計的應用程序,我可以保證,未來它們都将高度依賴機器學習。這些工具将會被重新設計,并且我們還會有機器代理來幫助我們使用它們。我們現在已經可以确定這一點,不是嗎?我們已經重新發明了計算,不會回頭了。整個計算技術棧正在被重新定義。那麽,軟件将會不同,軟件的編寫方式将會不同,使用軟件的方式也會不同。這些就是我們的"真理"。
接下來,我們要問的是,接下來會發生什麽?讓我們回頭看看過去的計算是如何進行的。我們已經投入了數萬億美元的計算設備。如果你看看現在的數據中心,問問自己,這些設備是否适合未來的計算需求?答案是否定的,對吧?你看到的是那些堆滿了CPU的設備,我們已經知道這些設備能做什麽,不能做什麽。我們也知道,我們有數萬億美元的數據中心需要現代化。現在我們讨論的是,在未來四到五年裏,逐步升級這些舊設備是合理的,對吧?這很合理。而你們正在與那些需要現代化的公司進行對話,他們正在使用GPU進行現代化改造。再做個測試。假設你有500億美元的資本支出,選項A是爲未來建設基礎設施,選項B是像過去一樣建設基礎設施。你已經擁有過去的資本支出,對嗎?它就在那裏,但摩爾定律基本上已經終結了。爲什麽還要重新建設舊的基礎設施呢?不如把這500億美元全部投入到生成式AI中,不是嗎?這樣,你的公司就變得更好了。那麽你會把這500億美元中的多少投入到未來?我會把100%都投入進去,因爲我已經有四年的曆史基礎設施了,這些基礎設施屬于過去。因此,我從第一性原理的角度來思考這些事情,而這些聰明人也正在做同樣的事情。
第二部分是,我們現在有價值數萬億美元的設備需要建設,未來四到五年可能會投入約1500億美元的資金進行現代化改造。第二個我們觀察到的現象是,軟件的編寫方式已經發生了變化,但未來軟件的使用方式也會有所不同。我們将會有"AI代理",對吧?我們公司裏會有數字員工。你收件箱裏現在有很多小點和小頭像,未來這些都會變成AI的圖标,不是嗎?我将不再用C++編程,而是用提示詞來編程AI,對吧?這和我今天早上與團隊溝通時沒什麽不同。我描述了背景、我所知道的基本約束條件,以及我對他們的任務要求。我會給出足夠明确的方向,讓他們明白我的需求,并盡量清晰地表達出我希望的結果。但我也會留出一些模糊的空間,給他們發揮創造力的餘地,這樣他們就能給我帶來驚喜,不是嗎?
這與我現在如何提示AI沒有區别。這正是我如何提示AI的方式。因此,在我們正在現代化的基礎設施之上,将會有一套新的基礎設施,這個新的基礎設施就是運行這些數字人類的AI工廠。它們将全天候運行,不間斷地爲世界各地的公司工作。我們會在工廠、自動化系統中使用它們,對吧?所以這将是一整層新的計算結構,我稱之爲AI工廠,而世界必須爲其建設一個全新的基礎設施,而這些在今天是完全不存在的。那麽問題是,這個市場有多大?現在我們還無法知曉,可能會是幾萬億美元的規模。我們無法确定,但美妙之處在于,現代化數據中心的架構和AI工廠的架構是相同的,這就是好消息。
主持人: 你已經明确指出,舊的數據中心基礎設施需要現代化改造,而與此同時,大量的AI工作負載也正在到來。你今年大概會實現1250億美元的收入。有一次有人告訴你,這家公司永遠不會超過10億美元的市值。今天坐在這裏,你是否認爲沒有理由相信未來的收入會是現在的兩倍、三倍?
黃仁勳: 是的,正如你所知,公司的發展并不取決于當前的規模,而是取決于"魚塘"的大小。金魚隻能在足夠大的魚塘裏長大。所以問題是,我們的魚塘有多大?這需要一些想象力。這也是爲什麽市場創造者會考慮未來的原因。如果不創造新的魚塘,你很難通過回顧過去并試圖搶奪市場份額來實現大的增長。搶市場份額的公司往往隻能做到一定規模,而市場創造者的潛力卻很大。我認爲我們公司很幸運的一點是,從公司創立之初,我們就必須發明一個市場來供我們發展。人們可能不記得了,但我們實際上是3D遊戲PC市場的開創者。我們發明了這個市場以及所有的生态系統,圖形卡的生态系統也是我們發明的。所以,創造一個新市場并爲其服務,這對我們來說是一件很自然的事情。
OpenAI 的影響
主持人: 确實如此。既然你提到了市場的創造者,我們來談談模型和OpenAI。你知道,OpenAI本周融資了650億美元,估值約爲1500億美元。我們都參與了他們的融資,對此感到非常高興。他們做得很棒,團隊表現出色。有報道稱,他們今年的收入或收入運行率将達到50億美元,明年可能會達到100億美元。如果你看看今天的業務規模,它的收入大約是谷歌在IPO時的兩倍,他們有2.5億周活躍用戶,這大約是谷歌在IPO時的兩倍。如果你相信明年他們的收入将達到100億美元,那市盈率大約是15倍,這與谷歌和Meta在IPO時的估值水平相當。22個月前,這家公司還沒有收入,沒有周活躍用戶。Brad對曆史有着非常深刻的理解。你能和我們談談OpenAI作爲你們的合作夥伴的重要性嗎?以及OpenAI在推動公衆對AI的認知和使用方面所發揮的作用?
黃仁勳: OpenAI是我們這個時代最具影響力的公司之一,是一家專注于AI的純粹公司,緻力于追求AGI(通用人工智能)的願景。至于AGI的定義究竟是什麽,我認爲這并不是最重要的,甚至時間節點也不那麽重要。我唯一知道的是,AI的能力将随着時間的推移逐步發展,而這個能力路線圖将會非常壯觀。在達到任何人對AGI的定義之前,我們已經能夠充分利用AI。你現在隻需要去找數字生物學家、氣候科技研究人員、材料科學家、物理學家、天體物理學家、量子化學家,或者去問視頻遊戲設計師、制造工程師、機器人專家,無論你選擇哪一個行業,深入其中,詢問那些真正掌握工作的人,問問他們,AI是否已經徹底改變了他們的工作方式?你會得到肯定的答案。
你收集這些數據點,然後再回頭問自己,你到底想對AI保持多大的懷疑态度?因爲他們談論的不是AI的某種概念性好處,而是現在就在使用AI。無論是氣候科技、材料科技,還是其他領域,AI現在正在幫助他們推進工作。每一個行業、每一家公司、每一所大學都在利用AI,這難道不令人難以置信嗎?AI肯定會在某種程度上改變商業運作。毫無疑問。我們現在可以感受到,它的影響已經非常明顯,甚至是觸手可及的。ChatGPT的問世激發了公衆的覺醒,這簡直是不可思議。我非常喜歡他們的速度和他們推動這個領域的明确目标。這真的是一家非常重要的公司,
主持人: 他們構建了一個經濟引擎,可以爲下一代模型的研發提供資金支持。矽谷現在有一種越來越普遍的共識,即整個模型層正在變得商品化。像LLaMA這樣的模型讓很多人可以非常便宜地構建自己的模型。早期有很多模型公司,比如Character、Inflection、Cohere等等。很多人質疑這些公司是否能夠建立足夠的經濟引擎來繼續爲下一代模型提供資金。但我們看到的是,OpenAI顯然已經達到了這種"逃逸速度",他們能夠爲自己的未來提供資金。而其他很多公司是否能做到這一點,這一點還不太清楚。你覺得這種看法是否正确?未來我們會像其他市場一樣,看到市場領導者的整合,這些領導者有足夠的經濟引擎和應用場景,能夠繼續投資于未來的發展。
黃仁勳: 首先,我們要區分模型和人工智能之間的區别。模型是人工智能的必要成分,但并不足夠。人工智能是一種能力,但關鍵在于它的應用是什麽。無人駕駛汽車的人工智能與人形機器人、聊天機器人的人工智能相關,但并不完全相同。因此,你需要了解每個層次的"棧"結構。在這個棧的每一層都會有機會,但并不是每一層都有無限的機會。就像我剛剛說的,你可以把"模型"這個詞替換成"GPU"。我們公司32年前的一個重要發現是,GPU和加速計算之間有着根本的區别。加速計算與我們在AI基礎設施上的工作相關,但它們并不完全相同。每一層抽象都需要不同的技能。那些擅長構建GPU的人未必懂得如何成爲一家加速計算公司。我們發明了GPU,但現在并不是唯一生産GPU的公司。GPU無處不在,但不是每家公司都是加速計算公司。有很多公司做應用加速器,但這與一家加速計算公司是不同的。
舉個例子,一個非常專業的AI應用可能會非常成功,這就是我們所說的MTIA(Meta Tensor AI)。這是一種非常專業的加速計算應用。但這可能不是那種能夠廣泛影響和提供能力的公司。因此,你必須決定你想要站在哪一邊。不同領域可能都有機會,但就像建立公司一樣,你需要意識到生态系統的變化,以及什麽東西會随着時間的推移而商品化,認清哪些是功能、哪些是産品,哪些是真正的公司。這裏有很多不同的思考方式。
馬斯克和 X.AI公司
主持人: 當然,有一個新入局者具備資金、智慧和野心,那就是X.ai。外界有傳言說你和Larry以及Elon共進晚餐時,他們談論過購買10萬塊H100,他們去到孟菲斯,幾個月内建造了一個大規模的超級計算集群。你能談談他們的能力嗎?有消息說他們還想要再購買10萬塊H200來擴大集群規模。首先,跟我們聊聊X.ai的雄心和他們的成就,同時我們現在已經進入了擁有20萬到30萬塊GPU集群的時代了嗎?
黃仁勳: 答案是肯定的。首先,應該對他們的成就給予肯定。從概念的提出到爲英偉達準備數據中心,再到我們将設備連接并啓動系統,進行第一次訓練,這一切的時間都非常短暫。建造一個如此大規模的工廠——液冷、供電、獲得許可——在這麽短的時間内完成,簡直超乎常人想象。據我所知,世界上隻有一個人能做到這一點,那就是Elon。他在工程、建設、大型系統和資源調度方面的理解是獨一無二的。他的工程團隊也非常出色,軟件團隊、網絡團隊、基礎設施團隊都非常優秀。Elon對這一切理解非常深入。從我們決定開始到規劃完成,英偉達的工程團隊、網絡團隊、基礎設施計算團隊和軟件團隊都做了大量的前期準備工作。
然後是基礎設施、物流、以及那天湧入的技術和設備,英偉達的基礎設施和計算設備,還有所有的技術,19天内完成訓練。你知道,有人睡覺嗎?毫無疑問,大家沒怎麽睡。但是,首先,19天是一個令人難以置信的時間。不過,我們也可以退一步思考一下,19天實際上也就是幾周時間。而這期間涉及到的技術量,簡直讓人難以置信。如果你看到那裏的布線和網絡系統,你會驚歎不已。英偉達的網絡設備與一般的大規模數據中心網絡非常不同。一台計算機的背後全都是線纜,整合這麽龐大的技術體系,以及所有軟件的整合,真是難以想象。:所以我認爲Elon和X團隊所做的事情非常了不起,我非常感激他承認了我們在工程、規劃等方面的合作。但他們的成就是前所未有的。爲了讓大家有個概念,10萬塊GPU,這毫無疑問是全球最快的超級計算機集群。通常,建造一台超級計算機需要三年的計劃,然後花一年時間安裝和調試。而我們在19天内就完成了,這也證明了英偉達平台的可靠性。所有流程都已經非常成熟。當然,X團隊有自己的一整套算法、框架和技術棧,我們也進行了大量的集成工作,但前期規劃是非常了不起的。Elon确實是個例外。
主持人: 你回答問題時提到,20萬到30萬塊GPU的集群時代已經到來了。那這種規模會擴大到50萬塊甚至100萬塊GPU嗎?你們對産品的需求是否依賴于集群規模擴大到上百萬塊GPU?
黃仁勳: 最後一個問題的答案是否定的。我的感覺是,分布式訓練必須有效運行。而我的預感是,分布式計算将會被發明出來,某種形式的聯邦學習和異步分布式計算将會出現。我非常有信心和樂觀。當然,過去的擴展規律主要集中在預訓練階段,但現在我們進入了多模态、合成數據生成的時代。後訓練也實現了驚人的擴展,合成數據生成、基于獎勵系統的強化學習等,現在推理的擴展也飛速增長。你可以想象,一個模型在回答問題之前,可能已經進行了内部推理,可能多達一萬次,也許還做了一些研究、強化學習、模拟,肯定還進行了大量的反思,查找了一些數據、信息,不是嗎?所以它的上下文信息可能已經非常龐大。這種智能正是我們所做的,不是嗎?所以,這種擴展能力,如果你進行簡單的數學計算,再加上每年模型大小和計算能力的四倍增長,再結合日益增長的使用需求,你會發現,我們需要上百萬塊GPU,這是毫無疑問的。
那麽問題是,我們如何從數據中心的角度進行架構設計?這與數據中心的規模密切相關,比如它們是以千兆瓦爲單位還是以250兆瓦爲單位?我的感覺是,兩者都會出現。我認爲分析師往往專注于當前的架構選擇,但我認爲本次對話的一個重要啓示是,你在考慮整個生态系統,并且考慮了未來的多年發展。因此,英偉達的擴展并不是爲了應對當前的需求,而是爲了迎接未來的發展。并不是說你隻能依賴于50萬或100萬塊GPU的集群規模。到分布式訓練普及時,我們已經爲此做好了準備。要記住,如果沒有我們七年前開發的Megatron,這些大規模訓練任務的擴展就不會實現。我們發明了Megatron、NCCL、GPU Direct,還有我們在DMA上的工作,使得流水線并行化、模型并行化和分布式訓練得以實現。
Strawberry和o1 模型
主持人: 現在我們正在爲未來一代的技術奠定基礎。既然如此,我們來談談Strawberry和o1。我不想占用你太多時間。
黃仁勳: 我有的是時間。
主持人: 非常感謝你的慷慨。首先,我覺得他們将o1命名爲o1簽證(指的是美國吸引全球頂尖人才的簽證)真的很酷。這種簽證的宗旨是吸引全球最優秀、最聰明的人才來到美國,這也是我們都非常熱衷的事情。我喜歡這種理念:建立一個能夠思考并帶我們進入下一個智能擴展階段的模型,向那些通過移民帶來集體智慧的人緻敬,他們爲我們今天的成就貢獻了力量。這無疑是我們朋友Noan Brown帶領的項目,他曾在Meta工作,參與了Pluribus和Cicero項目。那麽,推理時間推理作爲一種全新的智能擴展向量,與僅僅通過構建更大模型相比,重要性如何?
黃仁勳: 這非常重要。很多智能無法提前完成。很多計算也無法提前完成,比如無序執行是可以提前做的,但很多事情隻能在運行時完成。所以,無論你從計算機科學的角度,還是從智能的角度來看,很多事情都需要上下文、環境、所需答案的質量以及具體的應用場景。有時一個快速的答案就足夠了,取決于答案的後果。你可能會說:"有些答案可以等一夜,有些答案可能需要一周。"我完全可以想象,我給我的AI發一個提示,告訴它:"考慮一晚再告訴我。"然後第二天,它會給我最好的答案,經過了充分的推理和思考。所以,從産品的角度來看,智能的質量和分層是非常重要的。當然,而且有些問題的回答可能需要五分鍾,而智能層會根據問題的需求将其路由到合适的模型。
主持人: 我昨天晚上在使用o1的高級語音模式,我正在爲我兒子的AP曆史考試輔導他,就像有世界上最好的AP曆史老師坐在旁邊思考這些問題,真的非常了不起。今天我的導師是AI,對吧?當然,現在的AI導師已經存在了。而且回到剛才的話題,今天你們40%以上的收入來自于推理,推理即将迎來因推理鏈(Chain of Reasoning)的出現而大幅增長,對嗎?推理能力即将呈現出億倍的增長,這也是大多數人還沒有完全理解的部分。
黃仁勳: 我們所談論的這一切,其實就是一場工業革命,這是智能生産的革命。沒錯,推理的增長将達到億倍的規模。
主持人: 現在每個人都過于專注于英偉達在大模型訓練上的表現,不是嗎?但事實上,如果你們今天的收入是50%來自訓練,50%來自推理,未來推理的增長将遠遠超過訓練的增長。訓練固然重要,但推理的增長會更大。
黃仁勳: 我們希望如此。這就像上學的目标是爲了将來在社會中有所貢獻。訓練模型很重要,但最終的目标是推理它們。
主持人: 你們是否已經在自己的業務中使用推理鏈和o1這樣的工具來提升業務表現?
黃仁勳: 我們目前的網絡安全系統無法運行得那麽好,如果沒有我們的AI代理。我們的芯片設計、Hopper、Blackwell都不可能實現。如果沒有AI,我們根本無法完成這些任務。我們有AI芯片設計師、AI軟件工程師、AI驗證工程師,所有這些AI都在内部構建,因爲我們有能力,我們也樂于親自探索這些技術的可能性。
英偉達企業文化
主持人: 當我今天走進這棟大樓時,有人告訴我說,要問問黃仁勳關于文化的問題,一切都關乎文化。我看着你們的業務,我們談論了很多關于效率和靈活性的内容——扁平化的組織結構能夠快速執行,小團隊高效運作。英偉達在這一方面真的獨樹一幟,每位員工平均産生的收入大約爲400萬美元,利潤或自由現金流大約爲200萬美元。你們創造了一個以效率爲基礎的文化,釋放了創造力、創新精神和責任感,打破了傳統的功能管理模式。你認爲AI的運用是否是讓你們在保持高創造力的同時依然高效運作的關鍵?
黃仁勳: 毫無疑問。我希望有一天英偉達會從今天的3.2萬名員工發展到5萬名員工,同時擁有1億個AI助手。它們将存在于每一個團隊中,我們會有一個完整的AI目錄,其中的一些AI擅長通用任務,而我們也會有專門的AI助手,它們會解決特定的難題。我們未來的收件箱将充滿AI目錄,這些AI都是我們合作過的,擅長特定技能的助手。AI還會招募其他AI來一起解決問題。AI會和人類一起出現在Slack頻道中,成爲一大群員工的一部分,有些員工是數字AI,有些是生物體。我甚至希望有些員工會是機電一體化的。
主持人: 從業務角度來看,你剛剛描述了一家公司,這家公司現在的産出相當于擁有15萬名員工的公司,但你們實際上隻有5萬人。你并沒有說要減少員工數量,而是說公司員工數量還會繼續增長,但公司的産出會顯著增加。
黃仁勳: 這常常被誤解。AI不會取代所有工作,它将改變每一個工作方式。我們要承認這一點。AI有巨大的潛力去做一些難以置信的好事,但它也有可能帶來負面影響。我們必須構建安全的AI,這是基礎,必須要做到的。而被忽略的一點是,當公司通過人工智能變得更高效時,這通常會體現在更好的收益或更快的增長上,或者兩者兼有。當這種情況發生時,CEO發出的下一個郵件通常不會是裁員通知,反而是公司在增長。因爲我們有太多的想法需要探索,需要更多的人來幫助我們思考問題,然後再去自動化。AI可以幫助我們自動化,也能幫助我們思考,但我們仍然需要決定我們想解決哪些問題。我們有成千上萬的問題可以去解決,公司的目标就是找到合适的問題,然後找到一種方法來自動化和擴展。所以,當我們變得更高效時,我們會雇傭更多的人,而不是更少。人們往往忘記了這一點。如果我們回顧曆史,顯然今天我們擁有的想法比200年前多得多,這就是GDP變大的原因,更多的人被雇傭了。盡管我們在瘋狂地自動化,但今天的經濟體量遠超過去。
主持人: 這是一個關鍵點。幾乎所有的人類生産力和繁榮,都是過去200年技術進步和自動化的結果。從亞當·斯密到熊彼特的"創造性破壞",你可以看到過去200年來人均GDP的增長圖表,它一直在加速。這引出了一個問題:如果你看看90年代,美國的生産率增長率大約是每年2.5%到3%,到了2000年代,降到了大約1.8%,而過去10年是有記錄以來生産率增長最慢的時期。生産率的增長是固定勞動和資本投入所能産出的産量,而過去10年,這個增長率創下了最低紀錄。很多人讨論了背後的原因,但如果按照你剛才的描述,随着我們大規模利用和制造智能,人類生産率是不是即将迎來一次劇變?
黃仁勳: 這是我們的希望,确實如此。而且我們有直接的證據表明這一點,無論是一個單獨的研究人員現在能夠通過AI以難以想象的規模探索科學,這是一種生産率的提升;還是我們在設計複雜的芯片,以前不可想象的速度和複雜性在飛速增長,而公司員工數量并沒有呈指數增長,這同樣是生産率的提升。我們開發的軟件越來越好,AI和超級計算機幫助我們開發這些軟件,而員工數量幾乎是線性增長的,這也是生産率的提升。所以,無論是在很多行業中進行抽查,還是從我們自己的業務來看,生産率的提升都非常明顯。毫無疑問,智能是世界上最有價值的商品,而現在我們即将大規模制造它。我們必須學會如何應對一個充滿這些強大AI的世界,它們做的事情可能比你更好。
當我反思這一點時,這也是我的生活寫照。我有60位直接彙報的董事成員,他們之所以在團隊中,是因爲他們在各自的領域表現得非常出色,比我做得更好得多。我毫無問題與他們互動,毫無問題"提示"他們,或者"編程"他們,就像我與AI的互動一樣。所以我認爲,人們将學到的一件事就是,每個人都會成爲自己AI代理的CEO。他們将通過創造力、意志力以及某些推理能力,分解問題,從而編程這些AI,幫助他們完成目标。這就是我現在做的事情,叫做經營公司。
AI監管重要性
主持人: 你提到了一點——安全AI。你提到中東的悲劇事件,現在世界上很多地方都在使用自主系統和AI。我們談談壞人、談談安全AI、談談與華盛頓的協調工作。你現在覺得我們走在正确的道路上嗎?我們的協調力度是否足夠?
黃仁勳: 馬克·紮克伯格曾說過,打敗壞AI的方式是讓好AI變得更好。我認爲這是非常重要的觀點。如何确保AI爲人類帶來淨正效益,而不是将我們推向一個沒有意義的反烏托邦世界,這是一個非常重要且值得讨論的話題。對AI的抽象化、概念化,像是把AI看作一個巨大的神經網絡,這種理解并不太準确。原因在于,人工智能和大語言模型雖然相關,但并不完全相同。現在有很多做得非常出色的事情。首先,開源模型的發布讓所有研究人員、每個行業、每家公司都可以接觸AI,學習如何将這種能力用于他們的應用,這非常好。第二,大家沒有足夠認識到投入到AI發明、保持AI安全的技術有多麽重要。
我們已經創造了AI來攜帶數據、信息,訓練AI、對齊AI、生成合成數據,擴展AI的知識,減少幻覺。還有很多AI正在被創造,用于矢量化、圖形化等等,來告知其他AI,設立AI的"護欄"。這些AI系統用于創建安全的AI,但它們并沒有得到足夠的重視。事實上,我們已經在構建這些AI,并且行業各界都在全速前進。建立這些評估系統、模型卡、基準測試系統以及所有的"安全帶",進展速度非常快,但并沒有得到足夠的關注。你們知道,世界上沒有任何政府規定要求必須這樣做,而是現有領域的從業者們自發地重視這些問題,并圍繞最佳實踐進行協調。所以這點确實沒有得到足夠的重視。大家需要開始更多地讨論AI作爲一個由多個AI組成的系統,它是一個工程化的系統,這些系統是從第一性原理出發構建的,經過了充分的測試和驗證。
主持人: 說到監管,你認爲AI作爲一種能力可以被應用于多個領域。監管是必要的,但你覺得在某些情況下,過度監管可能會導緻問題嗎?
黃仁勳: 是的,重要技術需要監管,但不要過度到限制創新。大部分監管應該發生在具體應用層面。像FAA、NHTSA、FDA這些機構已經在監管技術的具體應用,現在他們也需要監管那些融合了AI的技術應用。因此,不要忽視當前世界上已經存在的大量監管,也不要依賴于某種全球統一的AI監管機構。不同的監管機構是爲不同的目的而設立的,我們需要遵循這些機構的專業領域來進行有效的監管。
主持人: 我必須回到開源這一點上,你們最近推出了一個非常重要、功能非常強大的開源模型。Meta也在開源領域做出重大貢獻。我在社交媒體上看到很多關于"開源 vs 封閉"的讨論,你對開源的看法如何?開源模型是否能跟上前沿發展?你認爲未來是否會有開源與封閉模型并存的局面?這是否會帶來一種健康的安全性張力?
黃仁勳: 開源和封閉與安全相關,但不完全是關于安全。沒有什麽問題是因爲有封閉模型存在,這些封閉模型可能是商業模式的引擎,它們是推動創新所必需的。我對此完全支持。重要的是,不應是"開源 vs 封閉"的對立,而是"開源和封閉"并存。開源對于激活許多行業是必不可少的。如果沒有開源,許多科學領域和行業如何能夠參與AI?因爲他們需要開發自己的特定領域AI,而這通常是基于開源模型來實現的。開源模型使得金融服務、醫療保健、交通運輸等領域得以激活,帶來了巨大的潛力。
主持人: 你們的開源模型需求量大嗎?
關于AI個人想法
主持人: 好的,我們快到時間了。你自2016年推出DGX-1以來,經曆了一段令人難以置信的旅程。你們的旅程既不可能想象,但又異常輝煌。你成功了,生存下來真的是非常不容易。你們在2016年交付了第一個DGX-1,2022年我們迎來了"寒武紀時刻"。我常被問到的問題是:你如何能在今天依然保持你所做的一切?你有60個直接下屬,你無處不在,推動這場革命。你還在享受這個過程嗎?你有想做其他事情的想法嗎?
黃仁勳: 如果你在問我過去一個半小時的感受,我的回答是:我非常享受。我真的很開心,我無法想象有比這更想做的事情。我不認爲我們工作的全部都是有趣的。我的工作并不總是有趣的,也沒有指望它永遠有趣。你問我這是不是我的期望,我會說這工作是重要的。我不太看重自己,但我非常認真對待我們的工作、我們的責任和我們在這個時代的貢獻。
主持人: 這不是永遠有趣的,但你一直都熱愛它嗎?
黃仁勳: 是的,和所有的事情一樣,家庭、朋友、孩子,它們不總是有趣的,但我們總是深深地熱愛它們。
主持人: 你能做多久呢?
黃仁勳: 真正的問題是,我還能保持多長時間的相關性。這個問題隻有通過我是否能繼續學習來回答。我今天對自己能保持相關性并繼續學習的能力更加樂觀。這個不是因爲今天的讨論,而是因爲AI。我每天都在使用AI,沒有一天不使用。沒有一個研究我不使用AI,即使我知道答案,我也會用AI再确認一下。通常,接下來的兩三個問題會揭示我不知道的東西。AI作爲導師、助手,作爲一起頭腦風暴的夥伴,檢查我的工作,它徹底颠覆了一切。而我隻是一個信息工作者,我的輸出是信息。所以我認爲,AI對社會的貢獻将是非凡的。如果我能通過AI保持相關性,并繼續做出貢獻,我知道這項工作足夠重要,值得我繼續追求。而我的生活質量也非常好。
主持人: 我也無法想象錯過這個時刻,這是我們職業生涯中最重要的時刻。我們非常感謝這次合作,感謝你讓我們變得更聰明。
黃仁勳: 感謝你們的邀請,我非常享受這次對話。
原視頻來源:https://www.youtube.com/watch?v=bUrCR4jQQg8&t=1s&ab_channel=Bg2Pod素材來源官方媒體/網絡新聞