fbpx

Evoq

Обзор видеоускорителя Nvidia GeForce RTX 3070: очень привлекательное по цене младшее решение из топового семейства Nvidia Ampere

Nvidia считает, что Ampere дает скачок производительности даже еще больший, по сравнению с Turing. Что касается скорости нового GPU, то при FP32-вычислениях он обеспечивает производительность более 20 терафлопс, а это больше, чем у RTX 2080 Ti. При этом GA104 сохранил все ключевые особенности старшего чипа GA102, и RTX 3070 отличается от RTX 3080 и RTX 3090 разве что применением типа памяти GDDR6, а не нового GDDR6X. Мы уже рассмотрели две дорогие, основанные на разных модификациях чипа GA102, а сегодня у нас в обзоре, пожалуй, самая интересная видеокарта из анонсированных — RTX 3070, имеющая самую доступную цену. Еще одна важная характеристика нового семейства GeForce RTX 30 — приемлемые цены, принесшие значительное улучшение соотношения цены и производительности по сравнению с предыдущим семейством GeForce RTX 20. Благодаря оптимизации и производству по более тонкому техпроцессу, игровые решения архитектуры Ampere примерно в 1,5-1,7 раза быстрее аналогичных Turing в традиционных задачах растеризации и до 2 раз быстрее при трассировке лучей.

Все сравнения с GeForce RTX 3070 Ti

  • Есть лишь одна оговорка — скоро выйдут консоли нового поколения с большим объемом памяти и быстрыми SSD, и в будущем некоторые мультиплатформенные или портированные с консолей игры могут начать требовать большего, чем 8 ГБ локальной видеопамяти.
  • В самой ожидаемой игре года будет применяться трассировка лучей для рендеринга отражений, теней, глобального затенения и рассеянного освещения, также заявлена и поддержка DLSS.
  • Предыдущие решения архитектуры Turing были революционными из-за аппаратной поддержки трассировки лучей и аппаратного ускорения задач искусственного интеллекта.
  • Это результаты тестов GeForce RTX 3070 Ti на производительность рендеринга в неигровых бенчмарках.
  • Как мы ранее неоднократно писали, в новом поколении GeForce RTX 30 улучшены технологии RT (расчет освещения с помощью трассировки лучей) и DLSS (интеллектуальная реализация антиалиасинга, обсчитываемая тензорными ядрами).

А вот синтетические Feature-тесты из набора 3DMark Vantage мы все еще оставили в полном составе, так как заменить их попросту нечем, хотя и они уже изрядно устарели. Постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам. Он продолжает постоянно меняться, добавляются новые тесты, а некоторые устаревшие постепенно убираются.

В отличие от Turing, Ampere ориентирован не на инновационные технологии, а сугубо на рост производительности. Так что сравнение графического процессора GA104 и кристаллов прошлого поколения следует начинать именно с TU104. Согласно ей устройство на 80-й позиции комплектуется флагманским GPU (GA102, пусть и урезанным в составе GeForce RTX 3080), а 70-й модели достался чип второго эшелона GA104.

⇡#Участники тестирования

Самое интересное в GeForce RTX 30, продаваемых под собственным брендом Nvidia — совершенно новый дизайн системы охлаждения с двумя вентиляторами, один из которых привычно выдувает воздух через решетку с торца платы, а второй протягивает воздух прямо сквозь видеокарту. Модели предыдущего поколения в свое время продавались дороже, да и сейчас RTX 2080 Ti не осталось смысла покупать по цене RTX 3070. О повышенном интересе покупателей именно к этой модели мы и не говорим — очень похоже, что она имеет все шансы стать бестселлером, если получится наладить стабильные поставки. Ведь она дает в 1,6-2,3 раза более высокую производительность в приложениях для создания 3D-контента по сравнению с RTX 2070, да и RTX 2080 Ti частенько обходит. Понятно, что в играх у новинки все прекрасно — даже по нескольким примерам игр с применением растеризации и трассировки лучей хорошо видно преимущество GeForce RTX 3070 перед той моделью, последователем дела которой она является — GeForce RTX 2070. Посмотрите на показатели RTX 3070 сами — практически все они вдвое выше, чем у модели RTX 2070 семейства Turing.

Совокупная оценка производительности

Пока 8 Гбайт еще достаточно для любых игр в разрешении вплоть до 4К, но, как раз за разом показывает практика, запас в этом деле надолго продлевает жизнь видеокарты. Герой тестирования сохраняет громадное преимущество по сравнению с продуктами AMD и видеокартами NVIDIA 10-й серии, но старшие модели на чипах Ampere все-таки лучше приспособлены к нагрузке такого рода. Действительно, уже пришло время, когда видеокарты класса GeForce RTX 2080 Ti больше не обеспечивают комфортный фреймрейт в современных требовательных играх при разрешении 4К.

Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP. Для анализа производительности новой видеокарты GeForce RTX 3070 мы выбрали несколько видеокарт из разных поколений компании Nvidia. Мы провели тестирование видеокарты GeForce RTX 3070 со стандартными частотами в нашем наборе синтетических тестов. В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае мосфеты схемы питания GPU AOZ5311NGI (Alpha&Omega Semiconductor) и мосфеты схемы питания памяти SM7342EKKP (Sinopower).

Разумеется, в разрешении 2.5К эта видеокарта легко потянет игры с максимальным качеством графики с трассировкой лучей даже без DLSS! Вероятно, так получается из-за того, что в 4K-разрешении основным фактором, ограничивающим производительность, является трассировка лучей, с которой Ampere справляется несколько лучше. Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. В 4K-разрешении вообще только старшие видеокарты линейки RTX 30 обеспечили приемлемую частоту кадров, хотя и ниже 60 FPS, но в реальных условиях можно использовать менее качественный вариант DLSS.

Тестирование: игровые тесты

Как правило, этот раздел актуален только для десктопных референсных видеокарт, так как для ноутбучных наличие тех или иных видеовыходов зависит от модели ноутбука. Для встроенных в процессор видеокарт, не имеющих собственной памяти, используется разделяемая – часть оперативной памяти. Они косвенным образом говорят о производительности GeForce RTX 3070 Ti, но для точной оценки необходимо рассматривать результаты бенчмарков и игровых тестов. GeForce RTX 3070 Ti обеспечивает хорошую производительность в тестах и играх на уровне 54.99% от лидера, которым является GeForce RTX 5090 D. Это устройство прекрасно выглядит и сделано весьма добротно, но его главным достоинством опять-таки является чрезвычайно эффективный и тихий кулер, который вдобавок ко всему позволил сделать видеокарту удивительно компактной для ее недюжинной производительности. RTX 3080 значительно прибавил в игровом быстродействии по сравнению с флагманскими видеокартами прошлого поколения, но таких чисел, которые фигурируют в рекламных материалах чипмейкера, мы все-таки не увидели.

GeForce RTX 3070 Ti: технические характеристики и тесты

Правда, нужно учитывать, что более низкое разрешение в любом случае даст меньшие задержки, чем применение Reflex в высоком разрешении. Применение Reflex SDK также позволяет повысить частоты GPU для быстрого расчета и вывода подготовленных кадров на экран чуть раньше обычного — в некоторых случаях, когда общая производительность ограничена скоростью центрального процессора. В случаях, когда производительность ограничена графическим процессором, Reflex SDK позволяет CPU начать передачу работы по рендерингу в GPU сразу перед тем, как он завершит предыдущий кадр, что значительно сокращает, а зачастую и вовсе устраняет очередь рендеринга. Причем, технология не является уникальной для Ampere, а работает на всех видеокартах, начиная с серии GTX 900.

  • Модели предыдущего поколения в свое время продавались дороже, да и сейчас RTX 2080 Ti не осталось смысла покупать по цене RTX 3070.
  • Но для сравнения производительности разных GPU в этой конкретной задаче тест отлично подходит.
  • Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума.
  • Это устройство прекрасно выглядит и сделано весьма добротно, но его главным достоинством опять-таки является чрезвычайно эффективный и тихий кулер, который вдобавок ко всему позволил сделать видеокарту удивительно компактной для ее недюжинной производительности.

⇡#GeForce RTX 3070 Founders Edition: печатная плата

Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения. Напомним, что обычно видеокарты останавливают свои вентиляторы в простое, при работе в 2D, если температура GPU опускается ниже примерно 60 градусов, и СО при этом становится бесшумной. Нагретый воздух остается в корпусе (при типовой установке видеокарты он выдувается вверх), и его должен подхватить вытяжной вентилятор в корпусе системного блока. Есть лишь одна оговорка — скоро выйдут консоли нового поколения с большим объемом памяти и быстрыми SSD, и в будущем некоторые мультиплатформенные или портированные с консолей игры могут начать требовать большего, чем 8 ГБ локальной видеопамяти.

Если сравнивать RTX 3070 с Radeon, то хотя графические процессоры AMD в этом тесте всегда были сильны, но у этой компании пока что просто нет GPU, схожего с GA104 по мощности. Что касается быстрейшей платы предыдущего поколения, то она также оказалась впереди — видимо, меньшая скорость текстурных выборок или ПСП сегодняшней новинки все же сильнее сказываются на результатах, по сравнению с остальными параметрами. Это довольно полезный тест, так как результаты в нем часто неплохо коррелируют с тем, что получается в игровых тестах. Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Один из самых интересных feature-тестов, так как подобная техника давно используется в играх.

Производительность в играх

Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, но они чуть ближе к истине, чем в прошлом подтесте этого же бенчмарка. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out. И модель RTX 3070 ничего не изменила, естественно, так как дело в драйверах, которые одинаковы для всех GPU. Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU.

Наш предыдущий опыт говорит также о влиянии программной оптимизации драйвера на результаты теста, и в этом смысле видеокартам AMD похвастать обычно нечем, но подождем новых решений архитектуры RDNA2. Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU в целочисленных вычислениях. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. С этим дела лучше всего обстоят у решений Nvidia, хотя видеокарты семейства RDNA чуть улучшили позиции конкурирующей компании. Хотя, судя по крайне высокой частоте кадров, вычисления в этом примере из SDK уже слишком просты для мощных видеокарт, и лучше рассматривать другие тесты.

⇡#Игровые тесты с трассировкой лучей

В самой ожидаемой игре года будет применяться трассировка лучей для рендеринга отражений, теней, глобального затенения и рассеянного освещения, также заявлена и поддержка DLSS. Пожалуй, мы бы хотели еще более активного их внедрения в игры, но это тормозится как парком старых GPU в существующих игровых системах, так и отсутствием поддержки трассировки в консолях нынешнего поколения. Мы еще раз отметим набор технологий RTX IO, который в будущем обеспечит быструю передачу и распаковку ресурсов на GPU, и повысит производительность системы ввода-вывода в десятки раз, по сравнению с привычными HDD и традиционными API. Улучшенные тензорные ядра хоть и не удвоили производительность при обычных условиях, но темп таких вычислений удвоился, а также появилась возможность удвоения скорости обработки так называемых разреженных матриц. Почти то же самое касается и RT-ядер — хотя их число и не изменилось, внутренние улучшения привели к удвоению темпа поиска пересечений лучей с геометрией. Основным нововведением Ampere является удвоение FP32-производительности для каждого мультипроцессора SM, по сравнению с семейством Turing, что привело к значительному повышению пиковой производительности.

По опыту предыдущих тестов мы знаем, что GeForce в этом тесте выступают не очень хорошо, и ожидаемые вскоре новинки AMD могут выиграть соперничество в этом тесте. Понятно, что RTX 3090 еще дальше впереди, мы не стали сравнивать новинку с ней в этой серии тестов, как и с RX 5700 XT, оставив лишь более мощную Radeon VII. В первом Direct3D11-тесте новая GeForce RTX 3070 ожидаемо отстала от RTX 3080, а вот RTX 2080 Ti немного отстала от новинки, что неплохо для последней. А сейчас рассмотрим более современные тесты, использующие повышенную нагрузку на GPU. Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере.

Как мы ранее неоднократно писали, в новом поколении GeForce RTX 30 улучшены технологии RT (расчет освещения с помощью трассировки лучей) и DLSS (интеллектуальная реализация антиалиасинга, обсчитываемая тензорными ядрами). Явно сказывается повышенная производительность RT-ядер в Ampere, а также удвоенный темп FP32-вычислений и улучшенное кэширование. Если с использованием CUDA как купить биткоин в казахстане для рендеринга эти две модели оказались равны, то включение аппаратного ускорения RTX дало прирост на RTX 3070 куда больший. Новая модель GeForce RTX 3070 ожидаемо уступила старшим представителям семейства, а вот сравнение с RTX 2080 Ti из прошлого поколения получилось весьма любопытным. Вот такие математически-интенсивные нагрузки с большим влиянием кэширования лучше всего подходят для новой архитектуры Ampere, в этом тесте новые GPU не оставляют шансов и конкурентам и предшественникам.

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно любопытный. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Если рассматривать RTX 3070 по сравнению с топовым решением из предыдущего поколения Turing, то разница в этот раз в пользу RTX 2080 Ti. Производительность рендеринга в этом тесте больше всего зависит от оптимизации драйвера и командного процессора GPU.

Leave a Comment

Your email address will not be published.