30系顯卡或有新提升 不排除支持DLSS幀生成功能
在CES 2025上,英偉達發佈基於Blackwell架構的GeForce RTX 50系列消費級顯卡。同時還帶來了DLSS 4,具備多幀生成功能,在每個傳統渲染的幀之間生成多達三個額外的幀,也是自2020年發佈DLSS 2.0以來對其AI模型的最大升級,DLSS光線重建、DLSS超分辨率和DLAA將由Transformer模型驅動,這是Transformer模型首次在圖形領域的實時應用。
在CES 2025期間,Digital Foundry採訪了英偉達應用深度學習研究副總裁Bryan Catanzaro,討論了DLSS 4的發佈及在超分辨率、光線重建和幀生成等多方面的改進。
DLSS Transformer模型取代了之前DLSS使用卷積神經網絡(CNN),用於超分辨率和光線重建,變得更加智能,實現了對場景的更深層次理解,從而生成提供更高穩定性、減少鬼影、運動細節更多以及場景邊緣更平滑的像素。同時英偉達也對幀生成進行了大幅度修改,放棄了以前基於光流加速器的模型。
Bryan Catanzaro表示,當打造DLSS 3時,爲了通過硬件加速來計算光流,但是沒有足夠的Tensor Core,也缺乏足夠好的算法,還沒有開發出一個能夠在Tensor Core運行的實時光流算法來滿足預期的計算量。光流加速器最初用於DLSS 3幀生成式有意義的,但是像光流這樣的算法的任何硬件實現的困難之處在於很難改進,直到採用完全基於人工智能的解決方案來替代,就像DLSS 4所做的那樣。
DLSS 4的幀生成功能更依賴於Tensor Core,但是使用了更少的顯存,效率也更高。當被問及新技術是否可以移植到GeForce RTX 30系列等舊硬件時,Bryan Catanzaro沒有否定這個可能性,認爲主要是優化和工程的問題,另外還有最終的用戶體驗。
當GeForce RTX 40系列推出幀生成功能時,Bryan Catanzaro曾解釋爲什麼是新款GPU獨佔,主要原因是有更好的光流硬件加速器,理論上上一代顯卡也能支持,但是改進可能不會那麼大。隨着新機制不再依賴光流硬件加速器,似乎又開啓了另一扇大門,然而新的幀生成功能對Tensor Core要求更高,但是舊的GPU架構配備的Tensor Core性能沒那麼好,不知道英偉達會如何實現這一目標。
此外,Bryan Catanzaro還強調了更新後Flip Metering與CPU解耦的重要性,這也是幀率提升的關鍵之一。