GeForce RTX 5090 評測:解析 RTX Blackwell 架構的層層創新

多年來,NVIDIA 在數據中心 AI 加速器和 PC 圖形領域一直處於領先地位。當公司在今年拉斯維加斯的 CES 展會上宣佈即將推出基於 Blackwell GPU 架構的 GeForce RTX 50 系列顯卡時,幾乎沒有人懷疑 NVIDIA 會在本月晚些時候向玩家發貨時推出市場上最強大的產品。然而,有關新款 GeForce RTX 5090 的詳細信息和性能細節,直到今天的禁運解除才得以揭曉。

那麼,事不宜遲,讓我們來看看 NVIDIA 爲 PC 遊戲玩家、愛好者和創作者推出的新款 GeForce RTX 5090 Founders Edition 顯卡,然後深入瞭解其功能和預期表現。

GeForce RTX 5090 的內部構造:NVIDIA 的 RTX Blackwell 架構

我們不會深入技術細節,但可以肯定地說,Nvidia 從零開始構建了其 RTX Blackwell GPU 架構,以支持高級渲染技術,如具有幀生成和神經着色器的深度學習超級採樣,這些技術利用 AI 提升着色器的視覺效果和性能。此外,Blackwell 的第四代光線追蹤核心也能夠更高效地處理大型幾何體和標準幾何體,同時其第五代 Tensor 核心現在支持 FP4 精度,使 DLSS 4 和 AI 工作負載的吞吐量提高一倍。

在 Blackwell 中,着色器執行重新排序的性能提高了多達兩倍,Nvidia 的新 GPU 架構還配備了一個新的內存控制器,與 32GB 的 GDDR7 內存結合使用時,提供了 GDDR6 的兩倍帶寬,最高可達 1.8TBps(對於 RTX 5090),同時提高了功率效率。最後,雖然我的簡短列表並不詳盡,但 Nvidia 的 RTX Blackwell 架構的不同模塊可以進入更深的睡眠狀態,並比公司上一代 Ada 架構更快地從這些睡眠狀態中喚醒,具有先進的時鐘門控、功率門控和電壓軌道門控。實際上,Blackwell 的整個時鐘樹可以在 GPU 仍然活躍的情況下禁用,因此如果板上的其他部分(如內存)處於空閒狀態,可以節省額外的電力。這些只是 RTX Blackwell 的一些進步,但如果您想要更深入的瞭解,請訪問我的同事 Marco 在 HotHardware 的報道,獲取完整信息。

AI 增強和生成的幀是未來的發展方向,請加入其中

在遊戲社區中,這個話題引起了很多討論,所以讓我們直接面對它。Nvidia 對其 GeForce RTX 50 系列 GPU 做出了一些大膽的性能聲明,CEO 黃仁勳將其新的 549 美元 GeForce RTX 5070 與公司上一代旗艦產品 1599 美元的 GeForce RTX 4090 相提並論,指出它們提供了類似的性能。這裡的附加條件是,新的 RTX 5070 將通過不僅在其芯片架構中啓用的高級技術,還通過新的 AI 渲染技術(如具有多幀生成的 DLSS 4)提供這種級別的性能。

簡而言之,Nvidia 的上一代 DLSS 3 技術可以在遊戲引擎中渲染單個 AI 生成的幀,但現在通過 DLSS 4,神經網絡可以在傳統渲染的真實幀之間生成多達 3 個額外的幀。結合 Blackwell 上的高級顯示引擎幀節奏,這爲支持 DLSS 4 的 GeForce RTX 50 系列提供了巨大的性能提升,相對於舊版 GeForce RTX 40 硬件上的單幀生成。當然,純粹主義者會爭論“假幀”和在遊戲中與如此多的 AI 生成幀交互的固有延遲。儘管 Nvidia 的新 Reflex 2 技術旨在減輕幀到反應的延遲,但遊戲開發者必須在其遊戲引擎中支持 DLSS 4 和 Reflex 2。

在發佈時,Nvidia 迅速指出,市場上有 75 款遊戲將支持具有多幀生成的 DLSS 4,並且隨着時間的推移,這個列表將會增長,就像現在支持以前版本的 DLSS 的數百個遊戲一樣。然而,再次,社區中的一些負面純粹主義者會爭論說,沒有什麼能替代傳統渲染中的強大計算能力。這在表面上是正確的,但問題是,隨着具有光線追蹤和其他高級渲染效果的遊戲引擎變得更加複雜和計算密集,僅僅依靠硬件來解決問題,而不通過 AI 和其他算法方法來推進渲染技術,很快就會達到收益遞減的臨界點。

事實上,與所有主要的 PC 圖形公司(AMD、NVIDIA 和 Intel)的對話中,所有公司都指出 AI 輔助幀生成的未來是前進的方向。因此,這不是一個“是否”的問題,而是遊戲開發者和整個遊戲社區何時加入的問題。

GeForce RTX 5090 的高層次性能概況

從三個高層次的角度來看,Nvidia 新款 GeForce RTX 5090 的性能可以被清晰地分解——傳統的光柵性能、超分辨率和幀生成的性能,以及非遊戲應用中的 AI 推理和生成式 AI 性能,以及內容創作。

就內容創作而言,我在視頻渲染中使用 GeForce RTX 5090 的經驗是最終渲染的轉碼時間顯著減少。這是由於 GeForce RTX 5090 板載的額外編碼器;RTX 4090 有兩個編碼器,而 RTX Blackwell 5090 有三個支持 Nvidia 第九代 NVENC 的編碼器。說到這裡,讓我們快速檢查一下 AI 吞吐量。

ML Commons 最近發佈了廣受尊敬的 MLPerf AI 基準測試的 PC 客戶端版本。在這裡,我們看到 GeForce RTX 5090 比上一代 4090 同類產品快了 38% 以上。我還要指出,除了這個 Token 吞吐量的提升外,首次 Token 延遲時間也減少了約 25%。

接下來,讓我們深入瞭解最前沿的遊戲性能,從廣受歡迎的動作 RPG 遊戲《賽博朋克 2077》的超高畫質預設開始。

在這裡,我們看到 GeForce RTX 5090 Blackwell 的全部威力,最長的條形圖代表其在遊戲中以 4X 幀生成設置的最快 DLSS 4 渲染幀率。此設置實際上渲染了三個 AI 生成的幀以及一個單獨的放大幀,以最大化性能。如果我們比較 RTX 4090 的最快設置,即具有單 AI 幀生成的 DLSS,我們看到 RTX 5090 的性能提升超過 65%,幾乎是沒有幀生成的上一代 GeForce RTX 4090 性能的三倍。查看完全關閉幀生成的性能,RTX 5090 比 4090 快 22% 以上。而 AMD 當前最快的 Radeon GPU 在啓用 FSR 3 超分辨率(不包括幀生成,這在此遊戲標題中不可用於 Radeon)時甚至無法參與競爭。

一級方程式賽車模擬遊戲 F1 24 顯示了 GeForce RTX 5090 與上一代 RTX 4090 的性能差距較小,啓用幀生成時提升約 37%,而沒有 AI 幀生成時則提升 24%。該遊戲標題還展示了 AMD Radeon RX 7900 XTX 的最佳表現,因爲 F1 24 支持 AMD 流體運動幀生成技術,使 Radeon 能夠顯著提升位置,但仍無法與 RTX 5090 相匹敵。

最後,再次以現代、華麗且圖形豐富的遊戲標題《黑神話:悟空》結束,在其電影畫質預設下,所有 GPU 競爭者都面臨壓力。在這裡,新款 GeForce RTX 5090 在相似設置下啓用幀生成時比 RTX 4090 快約 33%,而如果關閉幀生成,差距縮小到約 28% 的優勢。即使啓用幀生成,市場上最快的 Radeon 顯卡在此遊戲標題中的這些設置下也無法達到可玩幀率。

NVIDIA GeForce RTX 50 發佈的關鍵要點和未來展望

可以說,Nvidia 的新款 GeForce RTX 50 系列引發了一些爭議,但更多的是關於價格方面的爭議,RTX 5090 的價格上漲了 25%,爲 1999 美元,而 GeForce RTX 4090 在發佈時的零售價爲 1599 美元。毫無疑問,2000 美元的顯卡對於許多玩家來說實在太貴了,但當你擁有市場上最強大、功能最豐富的產品,並且開發它需要進行嚴肅的工程投資時,你可以爲該產品定價,而你的主要競爭對手則無法做到。這就是這麼簡單。

不過,如果你只關注 GeForce RTX 5090 Founders Edition 的價格,我認爲你錯過了重點。Nvidia 對 GeForce RTX Blackwell 的工程投資也將在更低、更主流的價格點上獲得回報。

最終,這就是關鍵所在。社區中的人們將辯論 Nvidia 昂貴的新頂級顯卡的優點,但你無法否認 RTX Blackwell 帶來的高級渲染技術的優點,以及它們所實現的性能和視覺保真度。當 Nvidia CEO 黃仁勳指出公司即將推出的 549 美元 GeForce RTX 5070 將與上一代頂級 GeForce RTX 4090 一樣快時,他是有意強調公司在這系列 PC 顯卡、開發者工具和軟件中實現的 AI 輔助渲染技術的優點。

通過 AI 生成內容推進 PC 圖形是一種自然的演變,也是整個行業的發展方向,不僅僅是 Nvidia。然而,Nvidia 也再次處於 GPU 架構的前沿,擁有開闢這一創新新道路所需的工程和軟件支持。新款 GeForce RTX 5090 是目前市面上最快的 PC 顯卡,彰顯了公司在其多年前創立的產品類別和技術中的主導地位。