NVIDIA RTX 4070 Ti 在 Octanebench 中以大致相同的 TFLOPs 击败 RTX 3090 Ti
可以最大限度地发挥 GPU 潜力的基准测试之一是Octanebench。它用于渲染目的,可以最大化图形卡的吞吐量,几乎不需要驱动程序优化。换句话说,您可以将其视为任何给定 GPU 的最佳案例场景。NVIDIA RTX 4070 Ti最近在 Octanebench 数据库中被发现(通过LaptopVideo2Go通过Videocardz),并且以 5% 的优势击败了旧的 RTX 3090 Ti。
NVIDIA RTX 4070 Ti 在第一个 Octanebench 总分中比 RTX 3090 Ti 快 5%
现在,由于我们正在处理最大化 GPU 理论吞吐量的基准测试,因此让我们首先看一下理论数字。RTX 3090 Ti 拥有 10,752 个主频为 1860 MHz 的 CUDA 内核,可产生 39.99 TFLOPs 的 FP32 性能。另一方面,RTX 4070 Ti 有 7680 个时钟频率为 2610 MHz 的 CUDA 内核,可产生 40.09 TFLOPs 的 FP32 性能。
现在 Octanebench 也可以考虑卡上的 RT 内核,其中 NVIDIA RTX 4070 Ti 有 60 个,而 3090 Ti 有 84 个。总而言之,RTX 3090 Ti 在纸面上非常接近 RTX 4070 Ti,有趣的是至少有一个基准可以充分利用这一点。
RTX 4070 Ti 得分为 725.3 分,而 RTX 3090 Ti 得分为 688.17 分(或快 5%)。然而,值得注意的是,这个分数是一个组合分数,结果经过大量汇总和加权。我注意到 RTX 4070 Ti 在信息通道测试中非常强大(可能是因为升级了 VRAM),与 RTX 3090 Ti 的 697 相比,它的得分为 953。然而,在直接闪电和路径追踪方面,它的得分大致相同与 RTX 3090 Ti 的 687 和 687 相比,得分分别为 705 和 696。
这看起来像是 NVIDIA 的一次相当不错的性能升级,并且从表面上看是 RTX 3090 Ti 的可靠替代品。然而,这就是比较失败的地方。有很多与此相关的警告。1) 这是渲染测试,不是游戏测试。游戏在很大程度上受驱动程序优化的影响,并且与峰值理论 FP32 性能仅具有部分相关性。2) 我们不知道这里使用的卡片是重度 OC 版还是原版。在得出任何结论之前,最好有一个更大的样本量。