在人工智能應用 " 淘金潮 " 的火熱背後,總少不了 " 賣水工 " 英偉達的 " 默默付出 "。
最近爆紅的 ChatGPT 也離不逃脫不開這一定律。正如英偉達 CEO 黃仁勳在 GTC 演講中展示的那樣,數年以前,正是黃仁勳親手将附有自己簽名與贈語的全球首台 DGX 交給了 OpenAI。
正因爲這台集成了八塊通過 NVLink 共享算力的 H100 組成的超級計算機,OpenAI 才獲得了向世界交出這份名爲 ChatGPT 答卷的機會。
在英偉達向 OpenAI 交付首台 DGX AI 電腦後,位列《财富》100 強的企業中有一半都使用了 DGX AI 計算機。英偉達的算力基礎設備與人工智能應用,俨然已經成爲了一枚硬币不可分割的正反面。
在剛剛結束的英偉達 GTC 2023 上,英偉達向我們展示了他們向人工智能的未來邁出的下一步。
人工智能的 "iPhone 時刻 "
如今,生成式 AI 和大語言模型帶來的殺手級應用在全球的火熱,又讓人工智能站到了一個新的路口前,如黃仁勳在 GTC 2023 的演講中所說的一樣,人工智能現在等來了屬于自己的 "iPhone 時刻 "。
而作爲 AI 硬币另一面,英偉達也正随 AI 一同前行。
黃仁勳預測,就像 iPhone 帶來智能手機和應用程序的普及一樣,能生成自然文章和圖像的 " 生成式 AI" 将在社會普及。
" 算力即權力 " 這句口号正以人們未曾預料到的速度變爲現實,但對于企業和開發者來說,想獲得這樣的 " 權力 " 并沒有那麽容易。
新生的初創公司競相構建從未有過的産品的商業模式,老牌公司也在積極擁抱變化,應對新的環境。
而大模型的訓練需要數據中心成百上千的計算卡 " 齊心協力 ",對企業來說,這代表着場地和維護成本,是一道并不容易越過的門檻。
不論是新生血液還是老牌豪強,都呼喚更快捷的人工智能開發流程。
作爲 " 算力供應商 " 的英偉達已經發覺了這一新需求,并推出了雲端人工智能 DGX Cloud。
DGX Cloud 能夠爲客戶提供專用的計算集群,每個 DGX Cloud 實例配備八個 NVIDIA H100 或 A100 80GB Tensor Core GPU 共 640GB 的 GPU 内存,用戶能夠按月租用這些計算資源,并使用簡單的 web 浏覽器訪問。從而消除在本地獲取、部署和管理基礎設施的成本,大大增加了 AI 的便捷性。
對于這一産品的遠景,黃仁勳充滿憧憬的描繪到:" 如今通過一個浏覽器,就能将 DGX AI 超級計算機即時地接入每家公司。"
這樣的願景并非空中樓閣,在 GTC 2023 的演講中,黃仁勳宣布,英偉達将與雲服務提供商合作托管 DGX 雲基礎設施,目前已經于甲骨文達成了合作,甲骨文的 OCI RDMA Supercluster 已經提供了一個可擴展到超過 32000 個 GPU 的超級集群。微軟 Azure 預計下個季度開始托管 DGX Cloud,很快谷歌雲也将加入托管的行列。
打開生成式 AI 的 " 魔盒 "
iPhone 問世之後,并沒有止步不前,而是引領了智能手機長達數十年的大發展。如今走到 "iPhone 時刻 " 的 AI,面對的也是一個與當年的 iPhone 極其相似的世界。
ChatGPT 的成功,對 AI 的革命而言,僅僅是踏進門口的一小步。
門後的世界中,還蘊藏着屬于生成式 AI 更廣闊的世界。
在基礎設施之外,對想要掌握 AI" 原力 " 的企業來說,如何搭上 AI 的下一班車,建立一個生成式 AI 模型,并将其應用到生産中,也将是一個重要命題。
英偉達發布的新雲服務平台 NVIDIA AI Foundations 則是讓企業做到這一點的 " 神兵利器 "。
NVIDIA AI Foundations 被分爲用于構建定制的語言文本模型的 Nemo、提供視覺語言制作服務的 Picasso 和提供醫學相關數據專有模型構建服務的 Bionemo 三個而部分。
在 Nemo 中,客戶可以引入自己的模型,或使用 Nemo 包含的從 GPT-8、GPT-43 到 GPT-530 等數十億參數的預訓練模型,并基于此構建自己掌控下的語言模型。
Picasso 則爲使用者提供了大量具有授權許可的專業圖像和視屏素材,使用者能夠使用這些許可内容或根據自己的專有内容訓練自定義模型,并将生成的内容導入編輯工具,甚至可以導入英偉達元宇宙平台 Omniverse,投入 " 元宇宙 " 的大基建事業。
能夠提供包括語言、視覺和生物學等領域模型在内的制作服務,适用于需要構建、改進和操作自定義 LLM 的客戶以及使用專有數據訓練的生成 AI,以及針對特定領域的任務。
使用 Bionemo,用戶既能夠即時訪問藥物研發工作流,也可以用于蛋白質結構預測和蛋白質生成與分子生成、分子對接等新藥研究關鍵步驟的模型生成中。
英偉達不僅将三者合一的 NVIDIA AI Foundations 視爲雲服務,更将其視爲構建生成式 AI 模型的 " 代工廠 "。
GPU 反客爲主,造芯關鍵步驟 " 搶班奪權 "
要想真正跨過 AI 下一次進化的大門,作爲人工智能最重要的 " 基建設備 " 的 GPU 芯片本身的制造也極爲重要。
人工智能的火熱,離不開 GPU 的助力。能夠提供大量執行重複簡單計算的 GPU 對需要大量算力的大模型和神經網絡來說,是天然的伴侶。
在過去的幾年裏,人工智能在掀起了在工業上落地的浪潮。小到餐廳中的小料台補貨,大到碼頭或光伏電站,人工智能已經成爲了工業領域公認的 " 先進産能 "。
而在兜兜轉轉之後,GPU 的發明者英偉達,終于把人工智能的觸手帶回了 " 最初的起點 " —— GPU 芯片的制造上。
黃仁勳在演講中提到,随着芯片制造工藝的進步,如今的芯片制造已經要求約一個金原子或一條人類 DNA 鏈尺寸的誤差。
而作爲芯片制造的核心步驟和起始階段的光刻更是重中之重。
大約 30 年前,晶體管的尺寸已經發展到比光刻機波長更小,由于衍射效應,掩膜上的圖案與最終圖案特征變得完全不同,這使得模拟光通過光學元件和光刻膠互相作用結果的計算光刻成爲了芯片制造過程中機器重要的一環。
此前,CPU 一直是承擔這一工作負載的主力。根據黃仁勳的估算,每年芯片制造商們在這一步驟上消耗了數百億 CPU 小時的算力來創建用于光刻系統的掩模闆。
但随着先進制程發展,計算光刻變得愈加複雜,CPU 負載已經舉步維艱。
多次高呼 " 摩爾定律已死 " 的英偉達 CEO 黃仁勳在今天的演講上帶來了人工智能與芯片制造結合的最新成果:基于用于芯片制造的 NVIDIA cuLitho 軟件庫,爲芯片制造找到了一條新的 " 活路 "。
英偉達表示,在 cuLitho 加持下,短期内可以提升芯片産業鏈效率,并大幅降低功耗,在新的流程下,僅需要 500 塊 H100 就能夠完成此前需要傳統流程中 40000 個 CPU 系統才能完成的工作,讓光刻技術性能躍升了 40 倍。
而相比現有的流程,使用 cuLitho、能夠僅使用如今九分之一的功耗做到每天三到五倍的生産效率,也能在一夜之間完成傳統方法兩周才能完成的單個掩模闆處理任務。
而長遠來看,英偉達則有着更遠大的目标。
英偉達不僅将與台積電、新思科技合作,将 NVIDIA cuLitho 軟件庫集成到軟件和系統中,用于制造最新一代的 Hopper 架構 GPU。
黃仁勳還在演講中宣布,英偉達将與台積電、阿斯麥與新思科技合作,并利用 cuLitho 爲未來 2nm 及後續更先進制程芯片的制造打下基礎。從而爲 AI"iPhone 時刻 " 後的革命準備好充足 " 糧草 "。雷峰網