高通、三星、聯發科都“嫌棄”，手機GPU前途難料

最近幾天，聯發科的相關消息可真不少。一方面，他們剛剛推出了新的天玑 9200+ 移動平台，在跑分、遊戲性能等方面再次超越了競争對手。同時首發天玑 9200+ 的 iQOO Neo8 系列新機也已官宣，并且很快就将正式上市。

另一方面，日前更是有消息顯示，聯發科方面已經與電腦 GPU 設計大廠 NVIDIA 達成合作，雙方将共同開發基于 ARM 架構、可用于 Windows 生态（即 Windows on ARM）的 PC SoC 産品。與此同時，聯發科也将就此取得了 NVIDIA 的 GPU 授權，最快在 2024 年可能就會有 GeForce GPU 集成到天玑旗艦移動平台中。

如果你熟悉近年來的手機 SoC 領域，看到這則消息可能馬上就會意識到，在高通、蘋果早已堅持自研 GPU 多年，三星已與 AMD 簽訂長期 GPU 合作協議的背景下，如果聯發科真的在明年就在旗艦産品上實裝 NVIDIA GPU，那麽這也就意味着，以 PowerVR、ARM 爲代表，曾經紅極一時的傳統 " 低功耗移動 GPU" 廠商，實際上相當于被各大 SoC 廠商集體放棄，變相被逐出了高端手機市場。

爲什麽會這樣呢？縱觀各方面的因素，我們其實并不難找到這個問題的答案。

現在手機 GPU 已經太大，甚至大到了更接近 PC 的設計習慣

從硬件設計上來看，想必有許多朋友會習慣性地認爲，手機裏的 GPU 是一種簡單的、規模很小的設計，由于它們比 PC 上的 GPU 要簡陋很多，因此兩者之間在架構和設計思路上也存在着較大的技術鴻溝。

其實這樣的想法放到 10 年、20 年之前，可能是無比正确，但時至今日，情況已經發生了很大的改變。

例如以 GPU 中最關鍵的 ALUs 數量，也就是大家熟悉的 " 核心數 " 爲例。2008 年的初代高通骁龍 S1 平台所集成的 Adreno 200，核心數隻有 8 個、算力爲 2.1GFlops，而同期的 PC 主流顯卡 NVIDIA GeForce 9600GT 核心數量是 64 個，算力爲 208Gflops，兩者間的核心數量相差 8 倍，算力更是相差 100 倍。

但到了 2023 年，骁龍 8 Gen2 中的 Adreno 740 核心數量已經高達 2048 個、算力爲 3.482TFlops。相比之下，PC 上的 RTX4060 核心數量爲 3072、算力是 15.39Tflops。兩者的核心數量差縮小到了 1.5 倍，算力差距則不到 5 倍。

那麽這意味着什麽呢？簡單來說，這代表如今手機 SoC 裏集成的 GPU，其實已經是個相當程度的 " 龐然大物 " 了。特别是那些定位旗艦級的手機 GPU，它們的硬件複雜程度已然與 PC 顯卡差不太多了。

在這樣的前提下，對于以往一直習慣于 " 小核心 " 設計的 PowerVR 和 ARM 來說，這樣的 " 高端 GPU" 很可能已經超出了他們的設計能力。相比之下，早就習慣了幾千、幾萬核 GPU 的 PC GPU 大廠，面對未來的手機圖形芯片設計自然也就有了設計思路和習慣上的優勢。

圖形 API 的統一，讓移動圖形廠商優勢蕩然無存

在過去很長的一段時間裏，手機、或者說低功耗移動設備的 GPU，在編程方面其實一直是與 PC 顯卡 " 分道揚镳 " 的。低功耗設備多半使用的是專爲它們制定的 OpenGL ES 圖形規範，這是一種 " 簡略版 " 的 Open GL 接口。而 PC 顯卡則更多地使用 DirectX、Open GL 等，"PC 專用 " 的圖形 API。

這也就意味着，過去手機遊戲和 PC 遊戲之間，在編程、優化上存在着較大的技術分歧。同時當時的手機遊戲也往往會使用一些專爲移動設備制作的開發工具，它們與 PC 遊戲的開發工具也并不兼容。換句話說，假使用當時的 PC GPU 去跑當時的 " 手機遊戲 "，很可能是無法運行的，或者就算能運行、效果也不見得好。

但是，如今的情況已經完全不同。在微軟、谷歌、蘋果等多方的推動下，如今的 "PC GPU" 和 " 手機 GPU" 在最基礎的圖形 API 上，已經基本實現了統一。它們都兼容 DirectX，都使用相同版本的 Vulkan API，也都可以運行基于相同圖形和物理引擎，比如虛幻 5、PhsyX 所開發的 3D 内容。

如此一來，過往的 " 手機專用圖形 API"、" 手機專用遊戲引擎 "，實際上就相當于是被 " 消滅 " 掉了，大家都統一使用了相同的圖形 API、使用了相同的遊戲引擎。于是在這樣的情況下，傳統的 "PC GPU 廠商 " 實際上哪怕什麽也不做，就相當于已經具備了巨大的技術優勢，以及與遊戲引擎廠商的長期合作積累。而傳統的手機 GPU 廠商呢？他們什麽也沒剩下了。

關鍵功能的缺失，讓 " 手機 GPU" 注定因爲 " 落後 " 挨打

不知道大家有沒有注意過這樣一件事，那就是現階段的高端手機屏幕，普遍已經達到了 1.5K、2K 分辨率，它們的橫向像素分辨率則高達 1200P、1440P，甚至可能更高。

但現在大家玩的幾乎所有主流手遊渲染分辨率，很多都還停留在 720P 或者最多 900P 的水準。這也就意味着，大家最終看到屏幕上的遊戲畫面，實際上都是經過了 " 拉升放大 " 的結果，而并非真正的點對點渲染。因此遊戲畫面要麽變得模糊，要麽就會顯示出很多邊緣鋸齒。

爲什麽會這樣？說白了，還是因爲現有的手機 GPU 性能不夠，無法真正支撐遊戲運行在 " 高畫面特效 "、" 高幀率 "、" 高原生分辨率 " 的模式下。由于降特效或者幀率視覺上的損失太過于明顯，所以現在的手遊才會普遍運行在 " 非原生分辨率 " 下。

那麽這些問題要怎麽解決呢，是直接大幅提升 GPU 的算力嗎？雖然這樣做理論上可行，但也會帶來功耗、發熱的顯著增加。因此更加現實的解決方案，就是基于 AI、基于深度學習的畫面超分算法。也就是讓 GPU 用低分辨率渲染，但在顯示的時候通過 AI 來實現畫面的 " 無損放大 "，從而緩解分辨率不匹配所導緻的 " 不清晰 " 感。

然而縱觀業界不難發現，現在隻有四家廠商有類似的技術，分别是 NVIDIA 的 DLSS、AMD 的 FSR、Intel 的 XeSS，以及前不久高通方面剛剛公布的 "SGSR"。聯發科雖然此前也搞出了基于 AI 的畫面超分技術，但受制于 ARM 的 GPU 并不支持，所以他們隻能在 APU 裏運行相關功能，效率上自然也就不如上述四家直接在 GPU 上跑 " 超分 " 來得高。

或許也正因如此，當高通、三星一個借助自研、一個緊抱 AMD 大腿，都在手機 GPU 上實現了原生 AI 超分後，聯發科自然也就有了抛棄 " 不争氣 " 的 ARM GPU，換一個合作夥伴的理由。畢竟遊戲超分現在已普遍被認爲是能夠顯著提升幀率、降低功耗的關鍵圖形技術之一，特别是對于旗艦機型來說，它更是能夠讓遊戲畫面真正 " 點對點 " 的高幀率運行，這樣意義也實在太大了。

【本文圖片來自網絡】