無論你出于什麽原因看過去年被熱議的電影《芭比》,那麽你一定對下面這個經典轉場有印象:
但你可不要被畫面下方的提示 "insert coin" 誤導,以爲電影《芭比》被改編成了需要投币的街機遊戲。這是一個經過 AI 轉繪的作品,AbleSlide 聯合創始人、Blender 藝術家、AI 創作者 Simon 阿文将《芭比》電影中的經典過場,通過 AI 的方式轉繪爲像素風,還原出複古 16bit 遊戲的經典美術風格。
Simon 阿文表示:" ‘ AI 如何塑造我們的工作與生活’ 這個在過去聽起來是少數大公司才有資格讨論的問題,但在如今這個問題的答案由 AI 社區和創作者塑造。包括央視春晚 AI 動畫等作品在内,從文字、圖像到影像,我的許多探索是基于本地 GeForce RTX 4090 完成的。AIGC 的可能性是一片藍海,AI PC 是我的帆船。"
實際上,随着圖像、建築、音樂等專業領域的産品與應用陸續落地,AI PC 的形象也正逐漸清晰,并開始悄悄改變我們熟知的生産力形态。
在最近一次 RTX AI 媒體品鑒會上,NVIDIA 向我們展示大量與 AI 相關的技術 Demo,不僅有來自底層硬件廠商視角的觀點分享,也帶來了各種實機的 Demo 體驗。對于 "AI PC 具體是如何帶來生産力革命的?""AI PC 如何在本地獲得充沛的算力支持?" 等問題,我們嘗試着在這次活動中尋找答案。
AI PC + RTX 40 系 GPU,生産力呼嘯而來
盡管早已在眼花缭亂的 AI 新聞中浸淫多年,但當我看到 NVIDIA 這次展出的技術 Demo,應用層生成式 AI 發展的速度之快,可以說大大超出了我的預料。
要知道,此前雖然我們已經可以自由使用各種 AIGC 生成工具,但往往都是湊個熱鬧的 " 玩具 " 屬性,離高效可控的實用生産力依然有一定的距離。而在 NVIDIA RTX 技術的支持下,已經有越來越多成熟的工作流 Demo 被構建,其成果甚至已經進入商用領域。此次 NVIDIA 就帶來了大量優秀成果。
在 RTX AI 品鑒會現場,對于 NVIDIA 這樣的頭部芯片廠商來說,其代表性技術幾乎都需要通過合作夥伴的産品搭載來實現,所以本文介紹的這些活動現場的技術 Demo 演示都是通過 AIC 與 OEM 的産品來展示,其中現場用來展示部分 AI Demo 的幾台搭載 RTX 40 系筆記本電腦 GPU 的聯想拯救者吸引了我們的注意。
首先是這台聯想拯救者 Y9000P 至尊版,其正在展示 AI 證件照 Demo,稍後我們會介紹到。搭載 RTX 4090 筆記本電腦 GPU,支持 175W 性能釋放,同時配備了更豪華的大面積 VC 均熱闆,CPU 部分加入了液金導熱,雙烤功耗進一步提升到最高 250W。因此在 3D MARK 跑分(DX12)能達到 21883,這也就意味着,市面上那些 3A 大作或者是複雜圖形渲染,這台筆記本電腦都可以輕松搞定。
另外,這塊屏幕的顯示效果非常出色,一塊 16:10 黃金顯示比例的 16 英寸面闆,擁有 2560 × 1600 像素分辨率,100% DCI-P3 高色域,240Hz 刷新率,500nits 亮度,3ms 響應時間,還支持畫面防撕裂技術、杜比視界,DC 調光、防藍光護眼和 X-Rite 出廠校色等等。這意味着,這塊屏幕可以完全滿足專業創作者對畫面的高标準要求。
而這台白色的 Y9000X 2024 上展示了來自數字藝術家 & 策展人土豆人 Tudou_man 的 AIGC 作品,他通過 AI 把晚霞做成了毛絨絨的圍巾,挂在了武康大樓、外灘鍾樓還有和平飯店上,聖誕的氛圍拉滿。
這台聯想拯救者 Y9000X 2024 搭載了 GeForce RTX 4070 筆記本電腦 GPU,延續了精湛的 CNC 一體精雕工藝,全金屬機身,ACD 面還采用了 AED 電泳白工藝,視覺上顯得更加簡約幹淨,辨識度爆表。最薄處做到了 17.6mm。
活動現場第一個給我帶來深刻印象的 Demo 就是:開發者基于 Stable Diffusion 和人像生成控制模型 InstantID,建立起的 AI 證件照生成工作流 Demo。
即便你身穿睡衣、加了一晚上班滿眼黑眼圈,隻要打開前置攝像頭拍一張照片,就可以生成一張精精神神的證件照。不僅畫面純淨通透,光影變化明暗自然,還對人像進行了恰到好處的美顔并達到影棚級别的水準。
立等可取的高質量 AI 證件照
由于這套工作流對算力與顯存都有着更高的要求,最低也要 16G 顯存,因此活動現場的 Demo 是運行在了一台搭載了 GeForce RTX 4090 筆記本電腦 GPU 性能強勁的聯想拯救者 Y9000P 至尊版上。
當然,光是高水準的出圖還不夠,爲了提升效率,現場還演示了市面上最快的 Stable Diffusion 計算出圖方案——在 GeForce RTX 4090 D 桌面端 GPU 上開箱即可享受到高達每秒 8 張圖的生成速度。什麽概念?要知道筆者用自己兩年前配的電腦跑 Stable Diffusion 文生圖的時候,平均幾乎要 30 秒才能生成一張圖,看到這我當場想換顯卡。
此圖沒有加速處理,一秒八張的圖片加特林
這還沒完,若是使用 NVIDIA TensorRT,并配合開發者進行性能優化,采用 GeForce RTX 4090 D 的台式 AI PC 最高甚至可以實現每秒超過百張圖的生成速度。這不僅僅是速度快的問題,不妨開一下腦洞:要知道比較普遍的視頻和遊戲畫面幀數也才不過 60fps,設想一下每秒 100 幀實時生成的畫面,足以一定程度颠覆傳統視頻和遊戲的消費邏輯。
另一個實用的技術 Demo 演示來自于前沿建築設計師、艾哎集瑟科技聯合創始人言蕭。在演示過程中,隻需要在繪畫區按照自己的意願勾勒幾筆,一張兼具設計者表達與實際效果的建築渲染圖就出現了。創作者還可以根據現有圖片快速調整,效果極佳。
随畫即可見的建築渲染
這對于設計師的工作輔助是非常大的:過往的設計提報往往需要設計師花時間手繪,再約時間開會決定方案,流程相對漫長。但在這樣實時生成的渲染圖的輔助下,設計師可以在會議中即時作圖,确定方向以後再逐步細化,大大加速了推進效率。據說,這裏使用的建築大模型全網下載量超 50W,在專業領域已經逐漸開始創造商業價值。
當然,我們對 AI PC 的期望不光是生産力效率革命,還有使用者的個性化需求,這裏的個性化肯定不是用 Stable Diffusion 畫小姐姐,而是指将來的 AI PC 作爲 " 私人助理 " 這個角色存在時,爲 PC 用戶提供更爲私密、個人化的定制服務。
而在活動中 ChatRTX 的技術 Demo 演示,基本可以看做 AI PC 個性化模型的雛形:活動演示中 ChatRTX 搭載的是智譜 AI 的 ChatGLM3-6B 模型,可以讀取用戶的本地文件,篩選出最符合用戶描述的圖片,并生成文件夾用以下一步操作。
導入文件夾,ChatRTX 就可以幫你挑出符合你描述的文件
而剛剛這一切都是通過 AI PC 本地資源完成的:ChatRTX 使用檢索增強生成 ( RAG ) 、NVIDIA TensorRT-LLM 大模型推理加速庫和 NVIDIA RTX 加速,将本地生成式 AI 功能引入到支持 RTX 的 Windows 系統中。用戶可快速、輕松地将本地文件作爲數據集連接到開放式大語言模型,快速查詢與上下文相關的答案。
看了這些 RTX AI 技術 Demo 演示不難發現,有了 NVIDIA 技術的加持,AI PC 早已不是停留在概念中的想象。這些具備了極高實用性的 Demo 正轉變爲創作者手中的生産力高速落地,在工作流中發揮着巨大作用,并給越來越多産業帶來本質改變。
AI 大算力如何實現?
從生态的角度來看,目前 NVIDIA 在 AI 領域的全棧生态給 AI PC 帶來了極爲重要的支持,畢竟這是一個已經耕耘了十多年的生态,即便此前發力的重點并不在 PC 平台這種邊緣端,但其積累的各種庫、中間件也足以爲 AIPC 生态打下基礎,比如說,我們今天看到的 TensorRT-LLM for Windows 幾乎就可以看做發展有些年頭的 TensorRT 在 LLM 上的延伸。
實際上,最早被用來做 AI 計算的 NVIDIA GPU 也正是遊戲顯卡:近代 AI 發展史知名的 ImageNet 圖像識别大賽上,有團隊嘗試使用 GTX 580 加 CUDA 來跑卷積神經網絡,随後就開啓 GPU 加速 AI 的新時代。
而今天,在我們看到這些行業領先的 Demo 中,NVIDIA 的技術所提供的大算力,幾乎是目前 AI PC 體驗的核心。
爲了讓更多創作者、開發者在 AI PC 發展的初期就能得到有效、客觀的參考、更方便地選擇自己的 AI PC,國内頭部 AI 大模型社區吐司 /Tensor.Art 聯合 NVIDIA 發布了行業内首個《個人用戶玩轉 Stable Diffusion 的 GPU 配置推薦》。
在這份配置推薦中,吐司 /Tensor.Art 聚焦眼下最受關注的 SD 1.5 和 SDXL ,通過第三方測試軟件 UL Procyon AI 測試 RTX 40 系列多款型号在 Stable Diffusion 的推理性能表現。
" alt=" 在 UL Benchmark SD1.5 和 SDXL 下,RTX40 系顯卡的表現
" width="1280" height="818">在 UL Benchmark SD1.5 和 SDXL 下,RTX40 系顯卡的表現
在開啓 TensorRT 後的加速效果
在 UL Benchmark SD1.5 下,RTX 40 系列筆記本電腦 GPU 表現
其中在 UL Benchmark SD1.5 TRT vs. OpenVINO 的對比測試中,RTX 4090 筆記本電腦 GPU 相對于 iGPU ( Arc Graphics ) 有超過 27 倍的性能提升。
而在吐司 /Tensor.Art 這份性能參考報告之外,NVIDIA 還聯合火星時代教育發布了《NVIDIA TensorRT Stable Diffusion 創作加速指南》和使用案例。指南包括安裝與設置,加速引擎構建,加速效果對比及 NVIDIA TensorRT 在實際商業創作場景的應用方法——簡單來說,這份指南可以幫助 AI 設計愛好者和創作者基于 RTX 40 系 GPU 在創作的各個環節中提升 Stable Diffusion 創作效率。
在活動現場,火星時代教育 AI 設計教研總監吳大吉還分享了 NVIDIA TensorRT 對于 SD 計算時間縮短的對比數據,數據顯示 TensorRT 可以讓 GeForce RTX 40 系 GPU 的 SD 生圖速度最快提升約 1 倍,大幅縮短了創作時間。
TensorRT 可以爲 RTX 40 系 GPU 的提供非常出色的 AI 算力提升
看下來不難發現,NVIDIA 過去十餘年積累起來的 AI 生态正快速地融入 AI PC,并爲無數應用提供大算力支持。
老本行,新花樣
在 NVIDIA 的老本行遊戲領域,AI 也同樣正在重構遊戲開發者的生産流程、以及遊戲玩家的娛樂體驗。
或許你還記得 NVIDIA 在去年曾經展出過一個賽博朋克拉面店的 NVIDIA ACE 技術 Demo,基于玩家與 NPC 的對話,可以讓老闆提供飲料、更換燈光,甚至可以指着桌子上的東西問 NPC 這是什麽,老闆則會給你講這東西的來曆和意義。
在這次活動上,NVIDIA 帶來了一個全新的 NVIDIA ACE 技術 Demo 演示《Covert Protocol》,相比上次的 Demo 場景規模更大。在這個 Demo 中,三位 NPC 都有自己的性格與故事,玩家想聊什麽都可以,他們的回答不僅會帶出這個遊戲世界的背景世界觀,更是會讓玩家感受到這個角色、這個世界是真實的、有生命的。對于遊戲玩家來說,這是前所未有的虛拟世界代入感。
遊戲中可以與 NPC 自由對話
實際上,這種技術不僅僅可以豐富遊戲的内容,增加真實性。更是可能會進一步改變一部分遊戲的叙事方式。
遊戲行業有一種高階叙事手法叫做 " 離散型叙事 ",指将世界觀背景與曆史、劇情延伸、甚至是主要角色的故事分散并隐藏在 NPC 的對話、收集品、甚至是場景的設計中。讓玩家通過互動主動發掘遊戲内容。熟悉宮崎英高的各式魂系列作品的玩家想必對這種手法深有體會。
試想這種叙事手段與 NVIDIA ACE 技術結合以後,遊戲過程中某一部分關鍵劇情、某個寶箱的打開方式、某個傳奇武器的下落被遊戲中某個 " 活生生 " 的 AI NPC 知曉着,而玩家需要通過話術找到真相。這種參與感絕非是固定腳本的遊戲可以比拟的。
所以,盡管這項技術目前并沒有被應用于已面世的遊戲中,但它對遊戲行業的改變,或許比很多人想得都要深,值得期待。
除了 NVIDIA ACE 之外,飽受玩家歡迎的 NVIDIA DLSS 也正在 AI 的加持下不斷進步。作爲一項 GeForce RTX GPU 上利用 AI 提高幀率并改善圖像質量的功能,過去兩年以來,在 DLSS 的幫助下,電腦性能一般的玩家也可以通過開啓 DLSS 獲得更高幀數的畫面,電腦性能優異的玩家更是可以獲得極緻的視覺體驗。
而最新的 DLSS 3.5 不僅樹立全新遊戲标準,通過 AI 增強光線追蹤表現,備受期待的《黑神話:悟空》和《永劫無間》即将支持 DLSS 3.5 光線重建和全景光線追蹤技術,實現畫質和性能将進一步獲得大幅提升。
可以說,無論是生産力還是娛樂,NVIDIA 都在利用其技術優勢,幫助開發者提供充足、全面的開發工具,讓更多的人可以低門檻地快速使用 AI,并讓更多人有機會從成果中受益。
結語
人人都能自由使用 AI 的時代,正越來越近。
盡管今天 AI PC 産品定義還處于早期,但得益于 NVIDIA 的高起點,其提供的大算力正在成爲 AI PC 無數應用的前進的動力,AI PC 的形象正在逐漸清晰,并開始改變我們熟知的生産力關系。據統計,RTX AI PC 目前已經在全球範圍内擁有超過 1 億用戶和超過 500 款遊戲和應用支持 NVIDIA RTX 技術,并不斷聯手行業一起定義 AI PC 的新标準。
無論未來 AI PC 産品的走向如何,NVIDIA 顯然已經憑借全棧的生态布局取得了先發優勢。GeForce RTX 40 系 GPU 在 TensorRT 的加持下帶來的大幅性能提升,顯然已經使其成爲眼下 AI GC 藝術家最合适的選擇。曾經天馬行空的 AI 幻想,似乎正在變成一個可以期待的未來。