GeForce RTX 50系列GPU推广加速的同时,与之对应的DLSS 4,AI神经渲染和神经着色技术也得到快速普及。就在此刻,英伟达正式在Game Developers Conference 2025(GDC2025)上宣布NVIDIA RTX神经渲染技术得到了新的进展,这一次,微软DirectX也加入其中,宣布4月份DirectX预览版就会加入神经着色支持。意味着,将会有更多的游戏制作团队可以轻松通过DirectX调用GeForce RTX中的Tenor Core和对应的AI功能。



神经网络着色

在诸多更新中,神经网络着色(Neural Shading)被认为是图形编程的又一次重大更新。这一次升级由人工智能AI与传统渲染结合,可以同时提升游戏帧率、图像质量,并且减少系统资源使用,可谓一举多得。



神经网络着色自然也需要由我们在游戏中常见的着色器来实现。一直以来,着色器是GPU运行程序、控制图形渲染的方式,其复杂程度取决于所需的视觉效果和处理要求。最基本的形式中,着色器计算渲染游戏场景时,使用的光线、阴影、颜色过程,统称为着色过程,属于渲染管线的一部分。

最早的时候,图形在GPU上通过不可编程着色器进行处理,也称为固定功能管线。其中图形管线中的操作是预定义和可配置,但不可以编程。这是因为当时的着色器受到硬件设计限制,因此,当时的设计团队专门针对固定的模式之行一组预定义的操作。

从GeForce 3开始,NVIDIA引入了第一个可编程着色功能,即顶点着色器。随后,高阶着色语言HLSL(High-Level Shading Language)让像素着色成为了可能,再然后,DirectX 10引入了集合着色器,DirectX 11引入了计算着色器,DirectX 12则增加了包围体层次结构BVH让DirectX实现光线追踪,使得任何光线都能与场景几何体橡胶,并生成一系列不同的着色操作。



Blackwell发布后,开发者不再需要编写复杂着色器代码来描述对应的功能,取而代之的是AI模型来提供近似着色器代码所提供的结果。最新的DirectX 12、Vulkan Cooperative Vectors API也可以通过任何类型的着色器访问Tensor Core,从而获得神经网络技术的支持。NVIDIA和微软也共同合作创建了新的Cooperative Vectors API,从而解锁了游戏开发者在游戏中使用神经网络技术的能力,包括神经纹理压缩,提供了比压缩格式高7倍的显存压缩。



图形计算中的神经网络加速

神经网络着色器允许开发者以学习高效近似算法的方式训练神经网络,这些算法包含计算光线与表面之间的相互作用,有效的解压存储视频内存中的超压缩纹理,基于有限的真实数据预测间接光照,并近似模拟表面光散射,进而让游戏场景中的画面更为接近真实。

现在,CES 2025上承诺变成了现实,随着微软宣布DirectX图形API 中的HLSL均提供了对Tensor Core的支持,这让游戏通过神经网络渲染变得更具有普遍性,只要是在Windows上运行的游戏,都可以轻松调用对应的API实现神经网络渲染的使用,从而获得更好的体验。



RTX Kit进驻虚幻引擎5

英伟达也同步宣布了支持神经网络渲染技术的NVIDIA RTX Kit套件迎来重要更新,正式让虚幻引擎5支持RTX Mega Geometry技术和RTX Hair技术。

为了展示新的技术很能打。英伟达通过NVIDIA RTX Remix开源平台实现了《半条命2/半衰期2》中一个章节场景的完全RTX Demo展示,包含了前面提到的神经渲染增强,DLSS 4多帧生成,RTX神经辐射缓存,全景光线追踪,以及CES 2025上那个喜闻乐见、使用了RTX Skin的猎头蟹。



猎头蟹的重建也很有意思。如果按照传统的重建方式,很大概率由于素材的不匹配让猎头蟹面目全非。



在RTX Remix中,通过Remap in Remix技术,可以让模型更快的匹配更合适的素材,从而高效的实现游戏MOD重建工作。



而在过去30年中,游戏场景中的三角形数量呈现出了指数级增长,特别是虚幻引擎5这样的新游戏引擎,让游戏制作团队构建的三角形以亿为单位,在游戏大型开放世界中变得司空见惯。如果仅依靠传统光栅技术,是很难实现高帧率的复杂场景渲染和光线追踪的,现在RTX Mega Geometry技术正式加入到虚幻引擎5中,就让其成为了可能。

在虚幻引擎5这样的新一代游戏引擎中,海量的几何细节构建出了一个更为细致的虚拟世界,其中就会利用到细节层次(系统level-of-detail, LOD)以全保真度进行光线追踪几何体,而不再是进行光线追踪时,通过低分辨率的代理模型实现。这时候阴影、反射、间接照明质量都会向上提升一个层次。如果按照以往常规光线追踪方式,这些功能都是难以在实时运行的状态下实现的,Mega Geometry技术的引入就变得很有必要。换而言之,Mega Geometry的主要目标之一是让光线追踪与现代游戏引擎的细节层次系统无缝结合。





另外一个是RTX Hair,即线性扫掠球体(Linear Swept Spheres,LSS)。这项技术主要用于解决头发效果的毛糙感和效率。

为了节省计算成本,以往制作团队会寻找一种简单的方式来实现近似毛发的效果,不相交正交三角形条带(Disjoint Orthogonal Triangle Strips,DOTS)便是其中之一。它使用一组由三角形条带组成的网格,这些条带呈网格状的、不相交的模式排列,其中的三角形条带相互独立且不共享顶点。虽然这种方法的质量高于卡片方法,但不相交的排列方式会产生边缘伪影,导致渲染中出现明显的缺陷。



不相交正交三角形条带(Disjoint Orthogonal Triangle Strips,DOTS)

在Blackwell RT Core中首次引入了硬件光线相交测试的支持,从而推出了线性扫掠球体(Linear Swept Spheres,LSS)。LSS类似于条带的细分曲面,但它是通过空间中线线性断的方式扫描球体构建,每一段起始点和终点之间,球体半径可以不同,以支持不同灵活程度的发丝。对应的,LSS在Blackwell中还直接支持球体扫描,对于粒子系统而言非常有用。

英伟达表示,在头发渲染中,LSS的速度比传统DOTS快2倍,同时几何体占用的显存空间也缩减了5倍。



线性扫掠球体(Linear Swept Spheres,LSS)



《半条命2》RTX Demo免费

还有一大波游戏支持DLSS 4

RTX Remix beta发布一年以来,已经有超过3万名游戏MOD作者和数以百计的经典游戏加入了修改,并且超过100万游戏玩家玩过RTX Remix的游戏MOD,《传送门RTX》正是其中之一。





DLSS 4加入的RTX Remix可以让游戏不仅获得更好的画质,游戏帧率也随之显著提升。比如《传送门RTX》中,大量的游戏帧率提升来自DLSS 4,还有RTX神经辐射缓存等等。



现在即将发布的《半条命2/半衰期2》RTX Demo版由四个顶级游戏MOD团队组合成Orbifold Studios工作室合作完成,他们让《半条命2/半衰期2》同时具备全景光线追踪、DLSS 4多帧生成、NVIDIA Reflex、RTX Skin、RTX Volumetrics等多项技术,3月18日就可以免费玩到了。



重点是,这不是个例。英伟达还宣布,目前已经有超过100款应用和游戏正式支持DLSS 4。而DLSS 3实现100款游戏和应用支持用了2年时间,足以见得DLSS 4生态已经开始在游戏产业中产生更为重要的影响。





除了《半条命2》RTX Demo,以下几款游戏也将宣布支持DLSS 4技术。

《失落之魂》(Lost Soul Aside)

《解限机》(Mecha BREAK)

《影之刃零》(Phantom Blade Zero)

《星刃》(Stellar Blade)

《湮灭之潮》(Tides of Annihilation)

《兽猎突袭》(Wild Assault)



值得注意,集成了语音识别、文本语音转换、神经网络翻译、感情分析等多项功能的NVIDIA ACE也开始实装到游戏中。第一款游戏是来自蓝洞工作室的《InZOI》。



另外采用NVIDIA ACE中部分功能的游戏还包括《永劫无间》手游PC版,《白厄战境》等。



对于玩家而言,DLSS 4的升级体验也只能算是刚刚开始,随着技术的不断推广,更多游戏工作室将会加入到对GeForce RTX 50系列GPU新技术的支持中,DLSS 4生态将以更快的速度得到扩大。还是那句话,早点买GeForce RTX 50系列的显卡,是不会亏的。

ad1 webp
ad2 webp
ad1 webp
ad2 webp