Для полноценного понимания всех тонкостей AI-составляющей новых моделей линейки GeForce RTX целесообразно рассмотреть ключевые аспекты данных устройств.
Помимо видеокарты начального уровня GeForce RTX 5070 за 549 USD компания объявила о выходе еще трех моделей: GeForce RTX 5070 Ti за 749 USD, RTX 5080 за 999 USD и нового флагмана пятитысячной серии – видеокарты RTX 5090 за 1999 USD. Помимо вложений в основательное и активное продвижение этих новинок в AI-сфере, NVIDIA очевидно много потратила и на ощутимое совершенствование технических характеристик этих устройств.
Основным параметром, отвечающим за качество прорисовки кадров, является графический процессор, представленный в вышеупомянутых «видеоускорителях» чипами GB205-300 c тактовой частотой в 2,51 ГГц, GB203-300 на 2,45 ГГц, GB203-400 на 2,62 ГГц, и GB202-300 на 2,41 Ггц. В свою очередь, количество CUDA-ядер в моделях параллельных классов было увеличено в разы, особенно у RTX 5090: до 21760 (у RTX 4090 было 16384). Остальные модели оборудованы 10752, 8960 и 6144 CUDA-ядрами соответственно.
Несомненно, стоит обратить внимание и на видеопамять устройств. Примечательно, что базовая версия RTX сохранила свой прежний объем в 12 гигабайт, однако Ti-версия получила уже дополнительные 4 гигабайта, как и RTX 5080. Шина памяти представляет собой 512, 256, 256 и 192 Бита. Еще более значительным кажется то, что вся пятитысячная серия была переведена на стандарт памяти GDDR7, благодаря чему существенно выросла пропускная способность: до 1792 (у RTX 4090 данный показатель практически в два раза меньше – только 1008), 960, 896, и 672 гигабайт в секунду соответственно.
Не менее важным является и энергопотребление, выросшее за счет дополнительных ядер до 575 Вт у RTX 5090 – что на 125 Вт превосходит RTX 4090. В то же время RTX 5080 расходует более уместные 360 Вт, а RTX 5070 и ее Ti-версия – по 250 и 300 Вт соответственно. Заметим, что с учетом такого потребления электричества для работы данных видеокарт в оборудовании необходимо использовать соответствующие блоки питания и охлаждение, зачастую продвинутые их разновидности.
Подключение всех вышеперечисленных устройств GeForce RTX происходит через порт 2х16-пин 12V, за исключением RTX 5070, у которой установлен стандартный 16-пин и 12V разъем, так как дополнительное внешнее подключение питания не требуется.
Отдельно стоит отметить увеличенное количество RT-ядер, применяемых для трассировки лучей (к слову, наличие данного типа ядер и привело к новому названию видеокарт вместо GTX). В RTX 5070 были добавлены два RT-ядра (в сумме 48). RTX 5070 Ti теперь располагает 70 RT-ядрами, в свою очередь, RTX 5080 имеет 84 RT-ядра (вместо 76 у RTX 4080), а в новой флагманской модели используется 170 RT-ядер.
Изначально на презентации CES 2025 во время Q&A-сессии на площадке NVIDIA Дженсен Хуан заявил, что теперь видеокарты компании способны «предсказывать будущее» вместо того, чтобы заниматься «интерполяцией прошлого». Но после допуска журналистов к тестированию видеокарт стало уже достоверно известно, что это не совсем так.
На техническом уровне DLSS 4 практически идентична DLSS 3 или технологиям конкурентов, таким, как Lossless Scaling или FSR 3 от AMD: при передаче изображения рендерятся два кадра наперед, однако между ними посредством искусственного интеллекта добавляются дополнительные три сгенерированных кадра (вместо одного в DLSS 3). Создаются эти вспомогательные кадры при помощи технологии интерполяции, когда AI старается найти различия между двумя кадрами, которые были зарендерены видеокартой, чтобы добавить к ним анимации того, что могло произойти между ними. Кроме того каждый добавочный кадр при активированной DLSS 4 отдельно обрабатывается пятью новыми независимыми AI-моделями.
Алгоритм NVIDIA Convolution Neural Network из DLSS 3 был заменен в новой версии на «модель трансформера машинного зрения». Из различий: во-первых, была внедрена функция «самовнимания», когда модель может самостоятельно отслеживать важность различных пикселей в нескольких кадрах; во-вторых, была оптимизирована самореферентность системы, чтобы модель могла больше фокусироваться на проблемных областях, таких, как тонкие детали, которые могут временами мерцать (например, забор, плитка, листва деревьев и так далее).
Для полного понимания напомним, что изначально технология NVIDIA DLSS предназначалась для апскейлинга – когда, например, игра запускается в минимально поддерживаемом разрешении, но при содействии искусственного интеллекта каждый объект прорабатывается и дорисовывается до практически «комфортных» значений. Также при этом обеспечивалось дополнительное сглаживание картинки, что положительно сказывалось на эффективности использования видеопамяти (до 30% экономии ресурсов) и количестве кадров в секунду (прирост на 117% и более в зависимости от игры и остальных компонентов девайса). Но с каждой новой версий DLSS дополняется новым функционалом, таким, как вышеупомянутая технология интерполяции кадров.
Ключевая неблагоприятная особенность всевозможных технологий мультикадровой генерации посредством AI-интерполяции – это заметная задержка отклика системы. Во-первых, сказывается необходимость рендеринга двух кадров наперед. Генерирование даже одного вспомогательного кадра (а до этого полноценный анализ двух изначально сгенерированных кадров) и его последующая обработка пятью независимыми AI-моделями, естественно, влечет за собой дополнительную нагрузку на графический процессор и модули искусственного интеллекта, вследствие чего у системы уходит больше времени на любые последующие действия.
Не менее важно, что каждый дополнительный сгенерированный AI кадр появляется с таким же откликом, как и тот кадр, который он дополнил. Получается, если игровой процесс идет при частоте в 60 кадров в секунду, то кадры сменяются со скоростью в 16.6 миллисекунд. Однако при включенном DLSS 3 можно получить формально 120 кадров, но это не даст перемену кадров в 8.3 миллисекунды (как это было бы при обычном рендеринге кадров графическим процессором). Частота просто сохранится на отметке в 16.6. Применяя же DLSS 4, можно «насладиться» счетчиком кадров, показывающим 240 FPS, но опять же кадры по факту будут сменяться только каждые 16.6 миллисекунд вместо обычной (для данного FPS) задержки в 4.2 миллисекунды.
Резюмируя, количество и здесь не всегда означает преимущество. Кроме того, можно с уверенностью констатировать, что DLSS 4 не предлагает увеличение кадров в играх, а лишь содействует условной плавности картинки и уменьшению фризов. К примеру, Cyberpunk 2077 при настоящих 33 FPS так и останется не играбельным для многих вариантом, хотя и станет более плавным, сглаженным и без физов. Описать включение DLSS 4 можно как «ходьба по сугробам, когда снега нет», то есть медленное прохождение с плавно появляющимися последствиями.
Необходимо также осознавать, что AI может неоднократно дорисовывать, ломать суть дизайна объектов или добавлять так называемые шумы. Например, самым распространенным дефектом являются конденсационные следы в изображении неба, по которому пролетали птицы (возможно, искусственный интеллект принимает птиц за самолеты). Вследствие этого многие игроки начали называть вспомогательные кадры, сгенерированные DLSS 4, не иначе, как фейковыми.
Четвертая версия технологии DLSS, широко разрекламированная NVIDIA в ходе продвижения новых GeForce RTX серии 5000, больше напоминает продолжение функции сглаживания и плавности картинки, а не способ получить больше FPS в ситуациях, когда «естественных» кадров недостаточно. Это связано с тем, что увеличение кадров происходит только статистическое – из-за неизменной в добавленных кадрах скорости их смены.
Одновременно с этим – особенно нет смысла включать DLSS 4, когда графический процессор может поддерживать самостоятельно 60 FPS. Не менее важно учитывать качество вспомогательных кадров, сгенерированных AI.
В итоге пятитысячная серия видеоускорителей NVIDIA получила, по большей части, хоть и положительные, но не сильно значимые изменения в области видеопамяти и RT-ядер. Эти устройства, несмотря на снижение их стоимости относительно моделей предыдущей серии, продолжат оставаться востребованными прежде всего в промышленных системах.