Сравнение карт nvidia gtx 970. Разрядность шины, бит. Число шейдерных потоковых процессоров

Внедрение архитектуры Maxwell компания NVIDIA начала в сегменте бюджетных решений с выпуском GeForce GTX 750 Ti и GeForce GTX 750, которые удачно проявили себя на фоне предшественников. Эти графические решения продемонстрировали отличное сочетание производительности и энергоэффективности без перехода на новый техпроцесс. Такой старт укрепил уверенность в потенциале новых флагманов, на счет которых ранее не было особого оптимизма. Переход на 20-нм техпроцесс производства задержался, а нынешнее поколение графических процессоров уже достигло того предела, когда вопрос охлаждения стал краеугольным камнем. Maxwell изменил все. Представленные сегодня видеокарты GeForce GTX 980 и GeForce GTX 970 вновь это продемонстрировали.


В соответствии с маркировкой новый GPU GM204 станет заменой GK104, но при этом представленные графические решения призваны сменить GeForce GTX 780 и GeForce GTX 780 Ti, которые базируются на GK110. Так что не исключен вариант появления в будущем и какого-то GM210 в рамках последующей серии. Нынешние решения вызывают еще вопрос по поводу своей принадлежности к девятисотой серии, ведь представителей восьмисотой серии в настольном сегменте не было. Однако такие видеокарты были в сегменте графики для ноутбуков. У нас не так давно как раз был обзор топового решения с GeForce GTX 880M . Очевидно, что переход сразу к серии GTX 900 связан с поддержанием последовательной нумерации мобильных видеокарт.

GM204 напоминает усложненную версию GM107. Процессор насчитывает четыре графических кластера GPC по четыре крупных мультипроцессорных блока SMM в каждом. У GM107 был один кластер на пять SMM. GK104 насчитывал четыре кластера по два мультипроцессора SMX в каждом.


SMM оперирует 128 потоковыми процессорами (CUDA cores), сгруппированными в четыре массива обработки данных, каждый из которых имеет свою управляющую логику со своими планировщиками, диспетчерами, регистрами и внутренним буфером инструкций. Внутри SMM общими являются текстурные модули (в количестве 8 штук) с выделенным текстурным кэшем. Есть общее хранилище данных на 96 КБ. Обработка геометрии осуществляется движком Polymorph Engine.


Аналогичные блоки обработки геометрии присутствовали у GPU Kepler. У GK104 их было лишь 8, а у GK110 уже 15. Одно это сравнение говорит о возросшем потенциале в обработке сложной геометрии и тесселяции, которая заметно бьет по итоговой производительности в DirectX 11. По этому критерию обещано преимущество в два-три раза при сравнении вычислительного потенциала GM204 и GK104. Общее количество потоковых процессоров составляет 2048, что меньше количества вычислительных блоков у GeForce GTX 780 и GeForce GTX 780 Ti. Но в данном случае реализована другая организация этих вычислительных единиц внутри GPU с более гибким распределением задач. Текстурных блоков 128, что соответствует их числу у старого GK104, но против 240 блоков у GeForce GTX 780 Ti маловато.

На стороне новинок высокие тактовые частоты. Старший видеоадаптер GeForce GTX 980 работает при базовой частоте 1126 МГц и Boost Clock 1216 МГц. Это рекордные показатели для нынешних видеокарт.

GeForce GTX 970 от старшего брата отличается по частотам и количеству вычислительных блоков. У него отключены три SMM, поэтому потоковых процессоров только 1664, а текстурных блоков 104. Базовая частота понижена до 1051 МГц при Boost Clock 1178 МГц, что тоже заметно выше частот нынешних флагманов. Отметим еще, что указанная частота Boost является средним значением. В зависимости от условий эксплуатации и нагрузки она может быть выше или меньше. Сама технология GPU Boost корректирует частоты так, чтобы не выйти за определенные лимиты по мощности и температуре. С учетом энергоэффективности нового GPU в игровом режиме можно ожидать заметно более высоких значений Boost относительно указанных значений. Так что частотное преимущество относительно старых решений будет даже выше, чем при сравнении официальных данных по базовой частоте.

GM204 оснащен скоростным кэшем L2 объемом в 2 МБ. Количество блоков ROP возросло до 64. А вот работа с внешней памятью реализована через четыре 64-битных контроллера, т.е. общая разрядность шины составляет 256 бит. На фоне существующих флагманов с 384-битной шиной это выглядит узким местом. Частично компенсируется архитектурными улучшениями в подсистеме передачи данных. Используется новый метод сжатия данных в буфере кадра. А эффективная частота памяти GDDR5 установлена на высоком значении в 7010 МГц. По внутренним тестам компании NVIDIA эффективность ПСП у GeForce GTX 980 на 17-28% выше чем у GeForce GTX 680 (в зависимости от приложения). При этом частота памяти у новинки выше лишь на 16,7%.

Компания делает акцент на том, что новые решения проектировались с прицелом на разрешения выше стандарта Full HD. Поэтому новые GeForce GTX 980 и GeForce GTX 970 оснащены внушительным объемом памяти в 4 ГБ. С этой же целью их оснастили интерфейсом HDMI нового стандарта 2.0, который поддерживает передачу данных в разрешении 4K при частоте 60 Гц. При подключении по DisplayPort через Multi-Stream Transport возможен вывод изображения на четыре дисплея 4K. Сам же видеоадаптер умеет работать с еще большим разрешением 5120x3200 при 60 Гц.

Видеоадаптер GeForce GTX 980 GeForce GTX 970 GeForce GTX 780 Ti GeForce GTX 780 GeForce GTX 770
Ядро GM204 GM204 GK110 GK110 GK104
Количество транзисторов, млн. шт 5200 5200 7100 7100 3500
Техпроцесс, нм 28 28 28 28 28
Площадь ядра, кв. мм 398 398 561 561 294
Количество потоковых процессоров 2048 1664 2880 2304 1536
Количество текстурных блоков 128 104 240 192 128
Количество блоков рендеринга 64 64 48 48 32
Базовая частота ядра, МГц 1126 1051 875 863 1045
Boost Clock, МГц 1216 1178 926 900 1085
Шина памяти, бит 256 256 384 384 256
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Частота памяти, МГц 7010 7010 7010 6008 7010
Объём памяти, МБ 4096 4096 3072 3072 2048
Поддерживаемая версия DirectX 12 12 11.1 11.1 11.1
Интерфейс PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0
Уровень TDP, Вт 165 145 250 250 230

Серьезное преимущество новинок — низкое энергопотребление и нагрев. Заявленные значения в 165 и 145 Вт являются привычными для решений среднего уровня. Топовые графические ускорители с таким TDP выглядят очень привлекательно. По соотношению производительность на единицу мощности NVIDIA обещает для GeForce GTX 980 двукратный рост относительно GeForce GTX 680.

Среди нововведений в Maxwell — поддержка новой технологий просчета освещения и новые методы полноэкранного сглаживания. В играх уже давно используются разные алгоритмы моделирования глобального освещения. Среди них один из последних методов HBAO+, который изначально был разработан тоже NVIDIA. Но все они в той или иной степени лишь симулируют сложное отражение света от объектов. Воссоздать реалистичную картину с взаимным влиянием отраженного света от разных поверхностей, формирующим сложную картину бликов и теней, современным видеокартам пока не по силам. Новый алгоритм VXGI (Voxel Global Illumination) поднимает данную технологию на качественно новый уровень. 3D-сцена разбивается на отдельные воксели, для каждого из которых идет просчет отраженного света с учетом множества параметров. На выходе получается изображение приближенное к кинематографичному уровню.



Сцена с простыми геометрическими фигурами может быть еще более наглядной. На нижнем изображении отлично видно сложное взаимовлияние света, отраженного от поверхности цветных фигур.


VXGI позволяет моделировать сложное преломление и рассеяние света с отражениями в реальном времени при динамическом изменении параметров геометрии и освещения. Очень перспективная технология. На данный момент ее поддержка уже внедрена в движок Unreal Engine 4. Учитывая популярность прошлой версии движка, можно ожидать самого широкого применения VXGI в ближайшем будущем.

Одним из новых представленных методов сглаживания называется DSR (Dynamic Super Resolution). Работает он так — изображение рендерится в более высоком разрешении, а потом выводится с масштабированием до разрешения экрана. По сути ничего нового в этом нет. Уже год, как Battlefield 4 предлагает похожий метод, позволяя регулировать уровень масштабируемости от 100 до 200%. Такой метод в сравнении с обычным просчетом субпикселей очень ресурсоемкий. В упомянутом Battlefield производительность падает кардинально.

Пример сглаживания краев объектов при помощи DSR изображен ниже (правая часть изображения).


DSR может работать совместно с любым обычным методом сглаживания и в любом игровом приложении. Можно автоматически запускать это сглаживание через приложение GeForce Experience.

Другой метод сглаживания MFAA (Multi-Frame Antialiasing) является новой вариацией MSAA, используя вместо фиксированного гибкий метод выбора сэмплов. Позиции выборок меняются так, чтобы из соседних кадров формировалась итоговая выборка идентичная стандартному 4x MSAA. В итоге 4x MFAA дает изображение максимально близкое к 4x MSAA, но на 30% быстрее.


Не забыт метод сглаживания TXAA, который поддерживают все ближайшие проекты от Ubisoft. Продолжается развитие технологий симуляции физических эффектов. В играх Batman: Arkham Knight и Project CARS мы увидим привычную систему частиц и симуляцию турбулентности, реализованную с помощью NVIDIA PhysX. В Far Cry 4 будет реалистичная имитация шерсти животных, реализованная при помощи технологии NVIDIA Hairworks.


В этой же игре будет поддержка HBAO+, TXAA и продвинутая симуляции солнечных лучей. Мягкие тени будут реализованы по технологии PCSS (Percentage-Closer Soft Shadows). Особенностью визуализации таких реалистичных теней являются регулируемые параметры размытия в зависимости от расстояния до них. PCSS еще будет реализовано в Assasin"s Creed: Unity.


Новая часть Assasin"s Creed обещает порадовать и широким применением тесселяции, которая будет повсеместно задействована для улучшения геометрии и объема элементов окружения — от брусчатки и черепицы до барельефов и статуй.


Еще один важный проект, который обещает поразить красивой картинкой — перенесенный на следующий год The Witcher 3: Wild Hunt. В игре будет широкое применение PhysX не только для увеличения количества частиц, но и для симуляции более реалистичных разрушений и визуализации тканей. Отображение пышной шевелюры героя будет осуществляться при помощи технологии HairWorks — ответ на AMD TressFX.


Некоторые визуальные эффекты PhysX реализованы в Warface. В популярную многопользовательскую игру War Thunder обещают добавить продвинутую систему разрушений самолетов с использованием PhysX и симуляцию воды на базе технологии WaveWorks.

Представлена технология Turf Effect, которая позволяет визуализировать реалистичную динамическую траву с достоверной физикой. Практической реализации пока нет.

Кроме вполне ожидаемой поддержки всех спецификаций DirectX 11.2 новинки получили поддержку новых возможностей DirectX 12.

Что касается технической реализации конечных продуктов, то за основу взят дизайн плат от GeForce GTX 780/780 Ti, но с некоторым упрощением системы питания. Система охлаждения тоже позаимствована у старых флагманов. Если они пристойно справлялись с горячим GK110, то GM204 легко охладят и при более низких оборотах и шуме.


Наше практическое знакомство с новой серией начнется с младшего GeForce GTX 970 в исполнении MSI. В ближайшее время выйдет обзор и по GeForce GTX 980.

Каждый год производители видеокарт выпускают новые модели с улучшенными характеристиками и производительностью. Несмотря на это, предыдущие поколения видеоускорителей не теряют свою актуальность многие годы. Ярким примером видеокарты, вышедшей в 2014 году, но все еще пользующейся большим спросом, является Nvidia Geforce GTX 970.

Модель пополнила ряды видеокарт, которые без особых проблем справляются с современными задачами по запуску требовательных игр и программ.

Чтобы убедиться в актуальности видеокарты, нужно рассмотреть характеристики GTX 970 более подробно.

Объем памяти видеоускорителя – 4096 Мб GDDR5, частотой 1750 МГц и пропускной способностью памяти 224,3 Гбайт/с. Разрядности шины памяти составляет 256 бит.

Эта модель работает на основе микроархитектуры Maxwell и чипа GM204 с 28-нанометровым техпроцессом. Базовая частота GPU составляет 1050 МГц. Частота в режиме ускорения – 1178 МГц. Число установленных в видеоускорителе транзисторов – 5,2 млрд., текстурных блоков – 104.

Этих показателей мощности видеокарты вполне достаточно для того, чтобы справиться с запуском современных игр, требовательных к железу программ для обработки видео и изображений.

Обзор GTX 970

Рассмотрев технические параметры видеоускорителя, нужно определить оптимальный блок питания и процессор для GTX 970, максимально раскрывающие его потенциал.

В качестве чипа отличным выбором станут модели от компании Intel. Для получения максимальной производительности в играх подойдут чипы Intel Core i5 и выше.


Энергопотребление GTX 970 составляет 145 Вт. Для оптимальной работы компьютера в связке с этой видеокартой мощным процессором и большим объемом ОЗУ будут модели блоков питания от 400 Вт и более.

Нормальная рабочая температура видеокарты Nvidia GTX 970 составляет 80-85 градусов. Иногда этот показатель может доходить до 95 градусов, что не является поводом для беспокойства за целостность видеоускорителя. При увеличении этого показателя стоит задуматься над сменой заводской термопасты на новую.

На GTX 970 имеется 3 разъема – два DVI и один HDMI.

Какой блок питания нужен для GTX 970

При выборе блока питания следует обратить внимание на модель Corsair CX600 с объемом 500 Вт. Его мощности хватит для комфортной работы ПК в связке GTX 970 с процессором Intel Core i7 и объемом ОЗУ от 8 ГБ.

Как разогнать видеокарту

За увеличение производительности видеоускорителя отвечает разгон GTX 970. Он позволяет повысить количество FPS в играх и увеличить скорость работы с требовательными программами. Также благодаря этому возможен процесс майнинга на Geforce GTX 970.

Для обеспечения разгона необходимы три программы:

  1. Funmark – софт для проведения стресс-теста.
  2. MSI Afterburner – утилита позволяет увеличивать показатели видеокарты.
  3. GPU-Z – софт предназначен для мониторинга показателей.

В программе Afterburner нужно увеличить два показателя: Memory Clock, который отвечает за ядро графического процессора видеоускорителя, и Core Clock, ответственный за частоту памяти GPU.

Показатель Memory Clock нужно повысить до 1050-1100 MHz, в то время как Core Clock – до 2500 MHz. Увеличивать эти пункты необходимо постепенно, не более 50 MHz за один раз.

Следующий этап – это проведение стресс-теста через программу Funmark. Этот тест позволит выявить неполадки в работе видеокарты. В случае их обнаружения рекомендуется понизить показатели или вернуть их к стандартным.

Финальным аккордом разгона является мониторинг всех показателей в утилите GPU-Z.

Этих показателей увеличения производительности будет достаточно для комфортной работы видеоускорителя. С такими показателями мощности возможен майнинг криптовалюты на видеокарте Nvidia Geforce 970.

Какие игры потянет GTX 970

Для получения полной картины о видеокарте необходимо произвести ее тестирование в «боевых условиях». Тесты в играх GTX 970 показывают следующие результаты.

TES V: Skyrim. В игре, выпущенной в 2011 году, видеокарта показывает себя просто идеально. Минимальный показатель FPS на самых низких настройках составит 133 кадра в секунду. При запуске Skyrim в 2K разрешении это показатель понизился до 100 FPS, что совершенно не критично.

Grand Theft Auto 5. Запуск игры производится на ультра-настройках в формате FullHD. Средний показатель FPS составил 44 кадра в секунду, минимальный – 39 FPS в крупных экшен-сценах с обилием NPC.

Metro: Last Light. При запуске игры на максимальных настройках количество FPS находилось на стабильном показателе в 42 кадра. Заметных просадок, фризов или лагов не наблюдалось даже в самых тяжелых сценах с большим количеством перестрелок.

Battlefield 1. В режиме кампании на высоком качестве графики игра выдавала стабильные 40 FPS без фризов или лагов. В режиме онлайн-сражений этот показатель составлял 35-40 кадров, в зависимости от того, что происходит на экране в этот момент.

The Witcher 3. В формате FullHD и на высоких настройках количество кадров составляло 50. Показатель уменьшался в больших городах до 42. В остальном никаких просадок во время игры замечено не было.

Watch Dogs 2. Одна из самых требовательных игр на сегодняшний день из-за своей не самой лучшей оптимизации для ПК. При запуске WD 2 на средних настройках количество кадров составляло стабильные 30 пунктов. При увеличении качества графики до высоких этот показатель падал до 24 FPS, в некоторых местах появлялись небольшие фризы.

Assassin’s Creed: Origins. В новой игре от компании Ubisoft Geforce 970 показал себя очень неплохо. При среднем качестве графики в формате FullHD показатель FPS не понижался ниже отметки в 25 кадров. Такой результат является отличным показателем, ведь эта игра – одна из самых требовательных на рынке.

Dishonored 2. Видеоускоритель от Nvidia хорошо справился с запуском игры в FullHD на средне-высоких настройках. Минимальный показатель кадров составил 27. Никаких просадок, фризов или лагов во время игрового процесса обнаружено не было.

Rise of the Tomb Raider. Игра о приключениях знаменитой Лары Крофт запускалась на высоких графических настройках. Среднее количество FPS составило 33 кадра в секунду.

На основе этих тестов можно сделать вывод, что видеокарта, несмотря на год своего выпуска, все еще является отличным решением для современных игровых проектов.

Сравнение производителей

За выпуск GTX 970 на рынок отвечают несколько крупных компаний производителей. Чтобы определиться с выбором подходящего, нужно произвести сравнительный анализ модели.

Производитель Gigabyte GTX 970 Asus GTX 970 strix Palit Geforce GTX 970 Zotac Geforce GTX 970 MSI GTX 970 Gaming 4G
GPU GM204 GM204 GM204 GM204 GM204
Охлаждение DirectCU II DirectCU II DirectCU II DirectCU II DirectCU II
Техпроцесс 28 нм 28 нм 28 нм 28 нм 28 нм
Число транзисторов 5,2млрд, шт 5,2млрд, шт 5,2млрд, шт 5,2млрд, шт 5,2млрд, шт
Количество блоков растеризации 64 64 64 64 64
Площадь кристалла (мм2) 398 398 398 398 398
Число потоковых мультипроцессоров 1664 1664 1664 1664 1664
Объем видеопамяти (Мбайт) 4096 4096 4096 4096 4096
Тип видеопамяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Частота GPU (МГц) 1190 1114 1152 1076 1170
Предельная температура процессора (°С) 100 100 100 100 100
DirectX 12 12 12 12 12
Ширина шины 256 бит 256 бит 256 бит 256 бит 256 бит
Эффективная частота памяти 7000 Мбайт 7000 Мбайт 7000 Мбайт 7000 Мбайт 7000 Мбайт
Пропускная способность(Гбайт/c) 224 224 224 224 224
Цена GTX 970, руб. 21470 20605 22910 21611 23850

В среднем, стоимость видеокарты Nvidia Geforce GTX 970 в рублях составляет 21 000 руб. Основные отличия между производителями заключаются в частоте процессора.

Обновление драйверов

Скачать драйвера для видеокарты Nvidia Geforce GTX 970 пользователи могут на официальном сайте производителя. Обновление видеодрайверов позволяет увеличивать производительность в современных играх и программах.

Чтобы не пропускать выход новых версий, которые появляются каждые 2-3 месяца, можно установить специальную утилиту Geforce Expirience. Она оповещает пользователей о выходе новых драйверов и может в автоматическом режиме произвести обновление.

19 сентября компания NVIDIA представила второе поколение графических процессоров на архитектуре Maxwell и две видеокарты на его основе – GeForce GTX 980 и GeForce GTX 970 . К первой волне вполне справедливо можно отнести GM107 и GeForce GTX 750 Ti , и вот теперь настал черёд топовых продуктов с намного более высоким уровнем производительности. Поскольку подготовить материал про GeForce GTX 980 к официальному анонсу по не зависящим от нас причинам мы не успели, то знакомство с новыми видеокартами сразу же начнём с оригинальной модели, представленной видеокартой MSI GeForce GTX 970 Gaming .

Что касается флагманской модели NVIDIA GeForce GTX 980, то её, как и все архитектурные особенности с нововведениями, мы изучим уже в следующей статье в эталонном исполнении.

1. Обзор видеокарты MSI GeForce GTX 970 Gaming 4 Гбайт (GTX 970 GAMING 4G)

технические характеристики и рекомендованная стоимость

Технические характеристики видеокарты MSI GeForce GTX 970 Gaming приведены в таблице в сравнении с эталонными вариантами NVIDIA GeForce GTX 980, NVIDIA GeForce GTX 780 Ti, NVIDIA GeForce GTX 780 и AMD Radeon R9 290X.




упаковка и комплектация

Видеокарта MSI GeForce GTX 970 Gaming запечатана в яркую коробку, выполненную из толстого картона. На лицевой стороне рядом с силуэтом дракона размещены логотип серии Gaming, название модели видеокарты и объём видеопамяти, а также название системы охлаждения.


Обратная сторона коробки расскажет потенциальному покупателю о ключевых особенностях новинки, спецификациях, системных требованиях и поддерживаемых технологиях NVIDIA.


Внутри основной оболочки находится дополнительная из тонкого картона. В её центральном отсеке, в мягком вспененном полиэтилене, зафиксирована видеокарта, таким образом надёжно защищённая от всевозможных перипетий пересылки.

В отдельной плоской коробке находятся аксессуары. В их числе компакт-диск с драйверами и утилитами, инструкция по установке и рекламный буклет, переходник DVI-to-D-Sub, кабель-переходник для подключения дополнительного питания и сертификат качества.


Бонусов нет, но у нас, по сути, предрелизный образец видеокарты, так что можно надеяться на комплектацию продуктов MSI какими-то дополнительными аксессуарами, в числе которых раньше нередко были игры или сувениры.

Выпускается видеокарта в Китае. Гарантийный срок равен трём годам. Что касается стоимости, то в розничной продаже на момент подготовки статьи данной модели ещё не было, но нас заверили, что цена MSI GeForce GTX 970 Gaming не будет существенно отличаться от рекомендованной NVIDIA стоимости на GeForce GTX 970 ($329, 14990 руб.).

дизайн и особенности печатной платы

Дизайн новейшей MSI GeForce GTX 970 Gaming в сравнении с предшественницей в лице, например, MSI GeForce GTX 780 Ti Gaming разительно преобразился. Теперь видеокарта внешне выглядит более лёгкой, благодаря пластиковому, а не металлическому кожуху самой совершенной системы охлаждения MSI – Twin Frozr V. Но в стиле, на наш взгляд, продукт от этого только выиграл и стал ещё более привлекательным.




Всю лицевую сторону видеокарты закрывает кулер с двумя вентиляторами с очень интересными лопастями, о которых мы расскажем в разделе с описанием системы охлаждения. Сверху видны выходящие из радиатора тепловые трубки, а обратная сторона печатной платы ничем не закрыта. Размеры MSI GeForce GTX 970 Gaming составляют 269х130х37 мм.

Видеокарта оснащена выходами DVI-I и DVI-D (оба Dual-Link), HDMI версии 1.4a/2.0 и DisplayPort версии 1.2, совмещёнными с решёткой для частичного выброса нагретого видеокартой воздуха за пределы корпуса системного блока.


И всё же основная масса нагретого видеокартой воздуха будет оставаться внутри корпуса системного блока. Впрочем, как мы с вами совсем скоро убедимся, это несущественный минус в случае данной конкретной видеокарты MSI.

На MSI GeForce GTX 970 Gaming установлены два разъёма для объединения до четырёх видеокарт в различные режимы SLI, а также два разъёма для дополнительного питания, один из которых восьмиконтактный.


Максимальный уровень энергопотребления видеокарты заявлен на отметке 148 ватт, что всего на 3 ватта больше, чем указано в спецификациях эталонных NVIDIA GeForce GTX 970. Мощность рекомендованного блока питания для системы с одной такой видеокартой составляет 500 ватт.

Несмотря на массивность, система охлаждения крепится к печатной плате всего четырьмя винтами по периметру графического процессора, поэтому снять её не составило никакого труда. Под ней видны радиатор на силовых цепях и теплораспределительная пластина на микросхемах памяти и отдельных элементах питания.


Теперь отворачиваем с печатной платы и их. На MSI GeForce GTX 970 Gaming используется печатная плата оригинального дизайна. Сразу же бросается в глаза двустороннее расположение микросхем памяти и пустующие контактные площадки под них. Нет смысла сомневаться, что вскоре нас ждут и восьмигигабайтные версии этой модели видеокарты.


Печатная плата и её электронная «начинка» выполнены в полном соответствии американскому военному стандарту Military Class IV. В системе питания видеокарты используются экономичные конденсаторы Hi-c CAP с повышенной до 93% энергетической эффективностью, твердотельные дроссели SFC (Solid State Choke) с увеличенной на 30% стабильностью по максимальным токам, на 20% энергоэффективностью и работающие при до 35градусов Цельсия более низкой температуре, а также твердотельные конденсаторы Solid CAP с алюминиевым сердечником, ультранизким ESR-сопротивлением и гарантированным десятилетним сроком службы.



На питание графического процессора отведено шесть фаз, ещё две – расположенные справа от графического процессора – задействованы для питания видеопамяти и силовых цепей.


Система питания усилена дополнительными твердотельными конденсаторами, распаянными на обратной стороне печатной платы напротив графического процессора.


На MSI GeForce GTX 970 Gaming установлен графический процессор GM204 архитектуры Maxwell, относящийся к ревизии А1. Судя по маркировке, кристалл площадью 398 кв.мм выпущен в Тайване на 30 неделе текущего года (середина июля).


Он включает в себя 1664 унифицированных шейдерных процессора, 104 текстурных блока и 64 блока растровых операций (ROPs). Эталонные версии GeForce GTX 970 в 3D-режиме должны функционировать на частоте 1050 МГц, а в режимах высокой нагрузки способны автоматически разгоняться до 1178 МГц. Однако у MSI GeForce GTX 970 Gaming графический процессор разогнан на 8,6% и функционирует на частотах 1140-1279 МГц. Столь «нескромный» заводской разгон GPU оставляет нам надежду на хороший оверклокерский потенциал видеокарты, ведь производители, как правило, осторожничают при производственном разгоне видеокарт. Добавим, что при переходе в 2D-режим частота GPU снижается до 100 МГц против 324 МГц на серии GeForce GTX 780, а также что качество ASIC графического процессора нашего экземпляра видеокарты равно 62,3%.


На видеокарте установлены четыре гигабайта видеопамяти стандарта GDDR5, размещённые всего в восьми микросхемах на лицевой и обратной стороне печатной платы. Чипы выпущены компанией Samsung Semiconductor и имеют маркировку K4G41325FC-HC28 .


Номинальное время доступа таких микросхем составляет 0,28 нс, а их теоретическая эффективная частота равна 7000 МГц. В этом случае в MSI обошлись без заводского разгона памяти и ограничили её частоту 7012 МГц в полном соответствии со спецификациями NVIDIA. Тем не менее, при 256-битной шине обмена с видеопамятью её теоретическая пропускная способность сравнительно высока и составляет 224,4 Гбайт/с. В 2D-режиме частота памяти снижается до 648 МГц.

Последняя доступная на момент подготовки статьи версия утилиты GPU-Z уже практически полностью знакома со спецификациями GeForce GTX 970.


А вот считать BIOS видеокарты ей оказалось не под силу, поэтому сегодня мы его в статье не опубликуем.

системы охлаждения – эффективность и уровень шума

Практически одновременно с анонсом новых графических процессоров NVIDIA компания MSI представила следующее поколение оригинальных систем охлаждения для своих видеокарт – Twin Frozr V. Как это было с Twin Frozr IV, наверняка нас ждут сразу несколько версий кулеров под одним названием, предназначенных для видеокарт разных классов. Но на MSI GeForce GTX 970 Gaming, скорее всего, установлена топовая версия данного охладителя. По заверениям разработчиков, на проектирование и реализацию новой модели Twin Frozr ушло 18 месяцев, а её преимущество над версией Twin Frozr IV Advanced может достигать 10 градусов Цельсия в пике нагрузки.

В его основе лежит никелированный радиатор с медным основанием, медными тепловыми трубками и алюминиевыми рёбрами.


Всего тепловых трубок четыре – две диаметром 6 мм и ещё две диаметром 8 мм. Трубки, чередуясь друг с другом, выходят из основания в разные стороны, практически равномерно пронизывая радиатор.


Сопряжение пластин радиатора с тепловыми трубками выполнено пайкой, как и подобает системам охлаждения высшего класса.


Тонкие алюминиевые пластины расставлены на тепловых трубках с расстоянием чуть более 1 мм. Говоря объективно, серьёзных нововведений в радиаторе мы не увидели, поэтому посмотрим, что за интересные радиаторы установлены на Twin Frozr V.

Система охлаждения оснащается двумя 100 мм вентиляторами Torx Fans, оригинальным производителем которых является компания Power Logic (маркировка PLD10010S12HH). Реальный размер крыльчаток равен 94 мм. Отличительной особенностью данного типа вентиляторов являются лопасти разного типа, которые не только чередуются друг с другом, но и имеют разный угол атаки.


Благодаря такой форме лопастей и их увеличенному количеству, разработчикам удалось добиться повышения воздушного потока при 5-процентном снижении уровня шума. Кроме конструктивных изменений в вентиляторах, оптимизирован и их алгоритм работы. Вентиляторами поддерживается технология Zero Frozr, заключающаяся в их полной остановке в режимах невысокой нагрузки или 2D-режиме. Судя по мониторингу, вентиляторы начинают вращаться по достижении графическим процессором температуры 60 градусов Цельсия. Причём, стартуют вентиляторы очень мягко, без резкого всплеска оборотов, как это бывает. Добавим, что в основе вентиляторов лежат подшипники скольжения с увеличенным сроком службы.

На силовых транзисторах и микросхемах памяти, расположенных с лицевой стороны печатной платы, установлены, соответственно алюминиевый радиатор и теплораспределительная пластина с термопрокладками.


Приятным бонусом в Twin Frozr V, наверняка порадующим любителей моддинга, является подсветка логотипа серии Gaming в верхней части кожуха кулера.


Выглядит она просто здорово! Впрочем, смотрите сами:


Но, разумеется, во главу угла мы ставим вовсе не дизайнерские изыски нового кулера, а его эффективность и уровень шума. Их изучением мы сейчас и займёмся.

Для проверки температурного режима работы видеокарты MSI GeForce GTX 970 Gaming в качестве нагрузки мы использовали пять циклов теста весьма ресурсоёмкой игры Aliens vs. Predator (2010) при максимальном качестве графики в разрешении 2560х1440 пикселей с анизотропной фильтрацией уровня 16х и MSAA-сглаживанием степени 4x:



Для мониторинга температур и всех прочих параметров применялись программа MSI Afterburner версии 4.0.0 и утилита GPU-Z версии 0.7.9. Все тесты проводились в закрытом корпусе системного блока, конфигурацию которого вы сможете увидеть в следующем разделе статьи, при средней комнатной температуре 20 градусов Цельсия.

Проверку эффективности работы кулера на MSI GeForce GTX 970 Gaming мы начали при автоматической регулировке скорости вентиляторов.



Автоматический режим


Кроме повышенной до 1316 МГц частоты в boost-режиме, по графику мониторинга хорошо видно, что температура графического процессора плавно увеличивалась до 60 градусов Цельсия и только после этого в работу включились вентиляторы системы охлаждения. Их старт оказался совершенно незаметен на фоне тихого системного блока, что не удивительно, поскольку скорость достигла всего лишь 960 об/мин или 41% мощности и затем стабилизировалась на этой отметке. Учитывая, что весь температурный тест видеокарты так и был пройден при данной скорости вентиляторов, а температура не поднялась выше 63 градусов Цельсия, результат иначе как превосходным не назовёшь. Если вспомнить предыдущие результаты тестирования топовых видеокарт, то их кулеры на скорости около 1000 об/мин или чуть выше функционировали только в 2D-режиме, а здесь же мы видим такую же скорость при высокой 3D-нагрузке. Разумеется, данный результат был достигнут не исключительно за счёт переработки системы охлаждения MSI или её вентиляторов. Секрет успеха кроется в первую очередь в высокой энергоэффективности нового графического процессора Maxwell и его низком уровне тепловыделения. Однако нельзя не отметить и тот факт, что в MSI не преминули воспользоваться этим и, вкупе с грамотно построенным радиатором, разработали такой алгоритм работы вентиляторов, при котором оказалась достигнута и высокая эффективность охлаждения, и крайне низкий уровень шума.

При максимальных оборотах двух вентиляторов кулера MSI GeForce GTX 970 Gaming пиковая температура графического процессора едва превысила отметку 51 градус Цельсия.



Максимальная скорость


На наш взгляд, такой уровень охлаждения уже избыточен для MSI GeForce GTX 970 Gaming, тем более что при максимальных 2300 об/мин вентиляторы отчётливо слышно, хотя шумными их назвать вряд ли можно даже при максимальной скорости.

Что касается уровня шума, то измерить его по нашей стандартной методике не представлялось возможным, поскольку у MSI GeForce GTX 970 Gaming теперь новый «хитрый» разъём подключения вентиляторов, запитать который в отведённое на тестирование видеокарты время нам не удалось. Но стоит отметить, что при автоматической регулировке скорости вентиляторов видеокарта работает очень и очень тихо, а в 2D-режиме и вовсе бесшумна. Писка дросселей во время работы видеокарты мы также не выявили.

оверклокерский потенциал

С такой эффективной системой охлаждения и скромным уровнем тепловыделения видеокарта MSI GeForce GTX 970 Gaming просто была обязана продемонстрировать хороший оверклокерский потенциал. И наши ожидания были в полной мере оправданы. Графический процессор с номинальных 1140 МГц удалось разогнать ещё на 16,2% или 185 МГц по базовой частоте. В свою очередь, частоту видеопамяти без потери стабильности и дефектов изображения мы увеличили на 14,8% или на 1040 МГц.


В результате итоговые частоты видеокарты составили 1330-1469/8052 МГц


Более того, по данным мониторинга в 3D-режиме частота графического процессора держалась у отметки 1501 МГц!



Полтора гигагерца по GPU, представляете!? Такие частоты на всех прежних видеокартах достигались, как минимум, при очень эффективном жидкостном охлаждении, а чаще всего экстремальном. Здесь же у MSI GeForce GTX 970 Gaming мы достигли их не просто на воздушном кулере, а ещё и при полной тишине, так как скорость вентиляторов после разгона видеокарты не превысила 1060 об/мин. Температура графического процессора после разгона видеокарты уже на первом цикле теста достигла отметки 65 градусов Цельсия и больше не повышалась на протяжении всего теста. Можно резюмировать, что MSI GeForce GTX 970 Gaming обладает отличным оверклокерским потенциалом и оснащена тихой и очень эффективной системой охлаждения.

2. Тестовая конфигурация, инструментарий и методика тестирования

Тестирование производительности видеокарт было проведено в закрытом корпусе системного блока на системе следующей конфигурации:

Системная плата: Intel Siler DX79SR (Intel X79 Express, LGA 2011, BIOS 0594 от 06.08.2013);
Центральный процессор: Intel Core i7-3970X Extreme Edition 3,5/4,0 ГГц (Sandy Bridge-E, C2, 1,1 В, 6x256 Kбайт L2, 15 Мбайт L3);
Система охлаждения CPU: Phanteks PH-TC14PЕ (2xCorsair AF140 , 900 об/мин);
Термоинтерфейс: ARCTIC MX-4 ;
Видеокарты:

NVIDIA GeForce GTX 980 4 Гбайт 1127-1216/7012 МГц;
MSI GeForce GTX 970 Gaming 4 Гбайт 1140-1279/7012 МГц и 1330-1469/7012 МГц;
ASUS STRIX GTX 780 OC Edition 6 Гбайт 889-941/6008 МГц;
EVGA GeForce GTX 770 Superclocked ACX 2 Гбайт 1111-1163/7012 МГц;
AMD Radeon R9 290X 4 Гбайт 1000/5000 МГц;

Оперативная память: DDR3 4x8 Гбайт G.SKILL TridentX F3-2133C9Q-32GTX (XMP 2133 МГц, 9-11-11-31, 1,6 В);
Системный диск: Intel SSD 730 480GB (SATA-III, BIOS vL2010400);
Диск для программ и игр: Western Digital VelociRaptor (SATA-II, 300 Гбайт, 10000 об/мин, 16 Мбайт, NCQ) в коробке Scythe Quiet Drive 3,5";
Архивный диск: Samsung Ecogreen F4 HD204UI (SATA-II, 2 Тбайт, 5400 об/мин, 32 Мбайт, NCQ);
Звуковая карта: Auzen X-Fi HomeTheater HD ;
Корпус: Antec Twelve Hundred (передняя стенка – три Noiseblocker NB-Multiframe S-Series MF12-S2 на 1020 об/мин; задняя – два Noiseblocker NB-BlackSilentPRO PL-1 на 1020 об/мин; верхняя – штатный 200-мм вентилятор на 400 об/мин);
Панель управления и мониторинга: Zalman ZM-MFC3 ;
Блок питания: Corsair AX1200i (1200 Вт), 120-мм вентилятор;
Монитор: 27" Samsung S27A850D (DVI-I, 2560х1440, 60 Гц).

Из эталонных продуктов для оценки производительности MSI GeForce GTX 970 Gaming в тестирование включены NVIDIA GeForce GTX 980 4 Гбайт, о которой мы обстоятельно расскажем уже в следующей статье про видеокарты, и AMD Radeon R9 290X 4 Гбайт на своих номинальных частотах.




Из оригинальных видеокарт мы включили в тесты ASUS STRIX GTX 780 OC Edition и EVGA GeForce GTX 770 Superclocked ACX.




На наш взгляд, поскольку сейчас рынок заполнен именно оригинальными видеокартами с повышенными частотами, то и новую MSI GeForce GTX 970 Gaming будет справедливее сравнивать именно с такими видеокартами без занижения частот до уровня эталонных продуктов предыдущего поколения. Добавим, что значение «Power Limit» на всех видеокартах было выставлено на максимум.

Для снижения зависимости производительности видеокарт от скорости платформы, 32-нм шестиядерный процессор при множителе 48, опорной частоте 100 МГц и активированной функции Load-Line Calibration был разогнан до 4,8 ГГц при повышении напряжения в BIOS материнской платы до 1,380 В.



Технология Hyper-Threading активирована. При этом 32 Гбайт оперативной памяти функционировали на частоте 2,133 ГГц с таймингами 9-11-11-20_CR1 при напряжении 1,6125 В.

Тестирование, начатое 20 сентября 2014 года, было проведено под управлением операционной системы Microsoft Windows 7 Ultimate x64 SP1 со всеми критическими обновлениями на указанную дату и с установкой следующих драйверов:

чипсет материнской платы Intel Chipset Drivers – 10.0.22 WHQL от 05.08.2014 ;
библиотеки DirectX End-User Runtimes, дата выпуска – 30 ноября 2010 года ;
драйверы видеокарт на графических процессорах NVIDIA – GeForce 344.11 WHQL от 18.09.2014.
драйверы видеокарт на графических процессорах AMD – AMD Catalyst 14.x Beta (14.300.1005.0) от 27.08.2014.

Кстати, с новой бетой драйверов Catalyst производительность AMD Radeon R9 290X пусть и слегка, но стабильно подросла практически во всех тестах.

Производительность видеокарт была проверена в двух разрешениях: 1920х1080 и 2560х1440 пикселей. Для тестов использовались два режима качества графики: «Quality + AF16x» – качество текстур в драйверах по-умолчанию с включением анизотропной фильтрации уровня 16х, и «Quality + AF16x + MSAA 4х(8х)» с включением анизотропной фильтрации уровня 16х и полноэкранного сглаживания степени 4x или 8x, в случаях, когда среднее число кадров в секунду оставалось достаточно высоким для комфортной игры. В отдельных играх, в силу специфики игровых движков, были использованы иные алгоритмы сглаживания, что будет указано далее в методике и на диаграммах. Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр. Если же данные настройки в играх отсутствовали, то параметры изменялись в панели управления драйверов Catalyst или GeForce. Там же была принудительно отключена вертикальная синхронизация (V-Sync). Кроме указанного, никаких дополнительных изменений в настройки драйверов не вносилось.

Видеокарты были протестированы в двух графических тестах и четырнадцати играх, традиционно обновлённых до последних версий на дату начала подготовки материала. Последние патчи получили такие игры, как Company of Heroes 2, Total War: Rome II, Thief и GRID Autosport. Вот как выглядит слегка обновлённый список тестовых приложений (игры расположены в порядке их официального выхода):

3DMark (2013) (DirectX 9/11) – версия 1.3.708, тестирование в сценах «Cloud Gate», «Fire Strike» и «Fire Strike Extreme»;
Unigine Valley Bench (DirectX 11) – версия 1.0, максимальные настройки качества, AF16x и(или) MSAA 4x, разрешение 1920х1080;
(DirectX 11) – версия 1.1.0, встроенный тест (битва при Sekigahara) на максимальных настройках качества графики и использовании в одном из режимов MSAA 8x;
Sniper Elite V2 Benchmark (DirectX 11) – версия 1.05, использовался Adrenaline Sniper Elite V2 Benchmark Tool v1.0.0.2 BETA максимальные настройки качества графики («Ultra»), Advanced Shadows: HIGH, Ambient Occlusion: ON, Stereo 3D: OFF, Supersampling: OFF, двойной последовательный прогон теста;
Sleeping Dogs (DirectX 11) – версия 1.5, использовался Adrenaline Action Benchmark Tool v1.0.2.1 , максимальные настройки качества графики по всем пунктам, Hi-Res Textures pack установлен, FPS Limiter и V-Sync отключены, двойной последовательный прогон теста с суммарным сглаживанием на уровне «Normal» и на уровне «Extreme»;
Hitman: Absolution (DirectX 11) – версия 1.0.447.0, встроенный тест при настройках качества графики на уровне «Ultra», тесселяция, FXAA и глобальное освещение включены.
Crysis 3 (DirectX 11) – версия 1.2.0.1000, все настройки качества графики на максимум, степень размытости – средняя, блики включены, режимы с FXAA и с MSAA4x сглаживанием, двойной последовательный проход заскриптованной сцены из начала миссии «Swamp» продолжительностью 110 секунд;
Tomb Raider (2013) (DirectX 11) – версия 1.1.748.0, использовался Adrenaline Action Benchmark Tool, настройки качества на уровне «Ultra», V-Synс отключён, режимы с FXAA и с 2xSSAA сглаживанием, технология TressFX активирована, двойной последовательный проход встроенного в игру теста;
BioShock Infinite (DirectX 11) – версия 1.1.25.5165, использовался Adrenaline Action Benchmark Tool с настройками качества «Ultra» и «Ultra+DOF», двойной прогон встроенного в игру теста;
Metro: Last Light (DirectX 11) – версия 1.0.0.15, использовался встроенный в игру тест, настройки качества графики и тесселяции на уровне «Very High», технология Advanced PhysX включена, тесты с- и без SSAA-сглаживания, двойной последовательный проход сцены «D6».
Company of Heroes 2 (DirectX 11) – версия 3.0.0.15370, двойной последовательный прогон встроенного в игру теста при максимальных настройках качества графики и физических эффектов;
Total War: Rome II (DirectX 11) – версия 2.0.0.0, настройки качества на уровне «Extreme», V-Synс отключён, SSAA сглаживание активировано, двойной последовательный проход встроенного в игру теста;
Batman: Arkham Origins (DirectX 11) – версия 1.0 (update 8), настройки качества на уровне «Ultra», V-Synс отключён, все эффекты активированы, все функции «DX11 Enhanced» задействованы, Hardware Accelerated PhysX = Normal, двойной последовательный проход встроенного в игру теста;
Battlefield 4 (DirectX 11) – версия 111433, все настройки качества графики на «Ultra», двойной последовательный проход заскриптованной сцены из начала миссии «TASHGAR» продолжительностью 110 секунд (для видеокарт на GPU AMD использовался API Mantle);
Thief (DirectX 11) – версия 1.6 build 4158.14, настройки качества графики на максимальный уровень, технологии «Paralax Occlusion Mapping» и «Tessellation» активированы, двойной последовательный проход встроенного в игру бенчмарка (для видеокарт на GPU AMD использовался API Mantle);
GRID Autosport (DirectX 11) – версия 1.101.7026, использовался встроенный в игру тест на трассе «Сан-Франциско» (десять машин), настройки качества графики на максимальный уровень по всем пунктам, тесты с- и без MSAA8x сглаживания.

Если в играх реализована возможность фиксации минимального числа кадров в секунду, то оно также отражалось на диаграммах. Каждый тест проводился дважды, за окончательный результат принималось лучшее из двух полученных значений, но только в случае, если разница между ними не превышала 1%. Если отклонения прогонов тестов превышали 1%, то тестирование повторялось ещё, как минимум, один раз, чтобы получить достоверный результат.

3. Результаты тестов производительности

На диаграммах результаты двух видеокарт на графических процессорах NVIDIA теперь уже предыдущего поколения – ASUS STRIX GTX 780 OC Edition и EVGA GeForce GTX 770 Superclocked ACX – выделены светло-зелёной гаммой, а на графическом процессоре AMD – Radeon R9 290X – традиционной красной. Чтобы выделить результаты героини сегодняшней статьи MSI GeForce GTX 970 Gaming мы «залили» их тёмно-бирюзовым цветом, а видеокарта из будущей статьи – NVIDIA GeForce GTX 980 – выделена на диаграммах тёмно-синим.

Изучение и анализ результатов начнём с полусинтетических бенчмарков.

3DMark (2013)


Производительность MSI GeForce GTX 970 Gaming в 3DMark находится на сравнительно высоком уровне. Мало того, что она более чем на 40% опережает модельного предшественника в лице GeForce GTX 770 (в оригинальном исполнении, отметим, и на повышенных частотах), так ещё и GeForce GTX 780 не является в этом тесте сколь-либо серьёзным конкурентом MSI GeForce GTX 970 Gaming. Кроме того, новинка демонстрирует одинаковую производительность с однопроцессорным флагманом AMD – Radeon R9 290X. Отставание видеокарты MSI от NVIDIA GeForce GTX 980 на номинальной частоте составляет около 10-12%, но практически полностью компенсируется впечатляющим разгоном графического процессора и видеопамяти MSI GeForce GTX 970 Gaming. Так что пока всё идёт очень неплохо для новинки.

Unigine Valley Bench

Второй полусинтетический бенчмарк продемонстрировал нам несколько иную картину.



Если в режиме без использования сглаживания MSI GeForce GTX 970 Gaming по-прежнему быстрее ASUS STRIX GTX 780 OC, то при активации MSAA8x последняя отыгрывает позицию за счёт более широкой шины обмена с памятью и её пропускной способности. В то же время, разница с остальными видеокартами сегодняшнего тестирования в этом тесте осталась прежней. Нельзя не отметить, что AMD Radeon R9 290X при использовании сглаживания проявила себя весьма уверенно.

Total War: SHOGUN 2 – Fall of the Samurai

Игровые тесты открывает старый-добрый Total War: SHOGUN 2 – Fall of the Samurai.


В трёх тестовых режимах из четырёх видеокарты на графических процессорах NVIDIA расположились как «по росту». MSI GeForce GTX 970 Gaming обеспечивает 30-процентный прирост производительности в сравнении с разогнанной на заводе GeForce GTX 770, до 14% быстрее ASUS STRIX GTX 980 OC и на 8-17% быстрее AMD Radeon R9 290X. То есть предшественник и возможные конкуренты побиты, осталось только много не проиграть новому флагману NVIDIA, и это MSI GeForce GTX 970 Gaming в полной мере удаётся, поскольку её максимальное отставание от GeForce GTX 980 не превышает 14% и перекрывается отменным разгоном.

Sniper Elite V2 Benchmark


Не отличаются от предыдущей игры результаты тестирования видеокарт в Sniper Elite V2. Разве что, AMD Radeon R9 290X здесь выглядит скромнее и способен конкурировать только с GeForce GTX 770.

Sleeping Dogs

А вот в игре Sleeping Dogs расстановку сил можно назвать «классической» для сегодняшнего теста.


В наиболее ресурсоёмком режиме MSI GeForce GTX 970 Gaming оставляет позади EVGA GeForce GTX 770 SC на 27%, опережает ASUS STRIX GTX 780 OC на 6-7% и не уступает AMD Radeon R9 290X. Разогнав MSI GeForce GTX 970 Gaming до частот 1330/8072 МГц можно получить такой же уровень производительности, как и у эталонной NVIDIA GeForce GTX 980, хотя на номинальных частотах разница между этими видеокартами составляет от 4 до 14%.

Hitman: Absolution


Hitman: Absolution – одна из двух с половиной игр тестирования, где заметно подешевевшая в последние месяцы AMD Radeon R9 290X выигрывает у MSI GeForce GTX 970 Gaming. Более того, флагманская однопроцессорная видеокарта AMD способна конкурировать с NVIDIA GeForce GTX 980 (в самом ресурсоёмком режиме). Тем не менее, нельзя не отметить заметное превосходство MSI GeForce GTX 970 Gaming над EVGA GeForce GTX 770 SC, её равенство с ASUS STRIX GTX 780 OC и отменную масштабируемость при разгоне, благодаря чему, даже эталонная GeForce GTX 980 не выглядит чрезмерно быстрой.

Crysis 3

В Crysis 3 мы можем видеть несколько иные результаты.


Преимущество MSI GeForce GTX 970 Gaming над GeForce GTX 770 с заводским разгоном здесь скромнее, чем во всех предыдущих тестах и на пике достигает лишь 18%. При этом новинка во всех режимах качества и разрешениях немного проиграла ASUS STRIX GTX 780 OC и заметно отстала от AMD Radeon R9 290X. Правда, разгон MSI GeForce GTX 970 Gaming кардинально исправляет ситуацию и наравне с NVIDIA GeForce GTX 980 выводит её на суммарное первое место в тесте. Конечно же, GeForce GTX 980 тоже отлично разгоняется, но об этом мы вам расскажем уже в следующей статье.

Tomb Raider (2013)

Зато в Tomb Raider новая MSI GeForce GTX 970 Gaming возвращает себе более чем 30-процентное преимущество над EVGA GeForce GTX 770 SC и небольшую прибавку в скорости в сравнении с ASUS STRIX GTX 780 OC.


На этом же уровне производительности идёт эталонная AMD Radeon R9 290X, за что ей честь и хвала (при такой-то низкой нынешней стоимости). NVIDIA GeForce GTX 980 быстрее MSI GeForce GTX 970 Gaming на 10-12%, но легко достижима при разгоне новинки.

BioShock Infinite

Встроенный в игру BioShock Infinite тест в очередной раз отметился низким минимальным FPS на видеокартах с графическими процессорами NVIDIA, в отличие от AMD.


Однако по среднему числу кадров в секунду GeForce GTX и, в частности, MSI GeForce GTX 970 Gaming являются лидерами тестирования, а AMD Radeon R9 290X находится где-то между EVGA GeForce GTX 770 SC и ASUS STRIX GTX 780 OC.

Metro: Last Light

Активированная технология Advanced PhysX не оставляет шансов AMD Radeon R9 290X и одновременно выводит в лидеры разогнанную MSI GeForce GTX 970 Gaming.


Иначе выглядит ситуация без использования Advanced PhysX.


Тем не менее, MSI GeForce GTX 970 Gaming не уступает AMD Radeon R9 290X, значительно быстрее GeForce GTX 770 в лице разогнанной на заводе видеокарты EVGA и чуть быстрее ASUS STRIX GTX 780 OC. Опередить эталонную GeForce GTX 980 для разогнанной MSI GeForce GTX 970 Gaming не составляет особого труда.

Company of Heroes 2

С видеокартами на графических процессорах AMD в игре Company of Heroes 2 бороться очень непросто, что и продемонстрировала нам сегодня Radeon R9 290X.


Зато здесь очень хорошо видна эволюция видеокарт на графических процессорах NVIDIA, когда от EVGA GeForce GTX 770 SC до NVIDIA GeForce GTX 980 или разогнанной MSI GeForce GTX 970 Gaming результаты всех видеокарт расположились практически равными ступеньками.

Total War: Rome II


В Total War: Rome II новая MSI GeForce GTX 970 Gaming на 39-54% быстрее EVGA GeForce GTX 770 SC и на 3-16% быстрее ASUS STRIX GTX 780 OC, как и с AMD Radeon R9 290X. Отставание от эталонной NVIDIA GeForce GTX 980 составляет 9-17%, но вновь почти полностью компенсируется разгоном Gaming-видеокарты.

Batman: Arkham Origins


Результаты тестирования видеокарт в игре Batman: Arkham Origins вписываются в общий тренд тестирования.

Battlefield 4

Вот и расстановку сил между видеокартами, продемонстрированную ими в игре Battlefield 4, вполне можно назвать классической для сегодняшнего тестирования.



Thief

Такую же картину мы можем наблюдать и в Thief.



GRID Autosport

Погонять в GRID Autosport можно на любой из видеокарт тестирования, но на GeForce GTX 980 или разогнанной MSI GeForce GTX 970 Gaming это будет комфортнее всего.


Разница в производительности видеокарт в этой игре в большей части такая же, как и в предыдущих тестах.

Дополним построенные диаграммы итоговой таблицей с результатами тестов с выведенными итоговыми средним и минимальным значением FPS по каждой видеокарте.



Далее переходим к сводным диаграммам.

4. Сводные диаграммы

Прежде всего, посмотрим на разницу в производительности между MSI GeForce GTX 970 Gaming и EVGA GeForce GTX 770 SC на номинальных для них частотах, ведь как это видно по индексам моделей, это очевидная смена поколений. На диаграммах за начальную точку отсчёта приняты результаты видеокарты EVGA, а показатели MSI представлены в процентных отклонениях от неё.



Рекомендованная стоимость анонсированной больше года назад GeForce GTX 770 на тот момент составляла 399 долларов США. Теперь, с выходом GeForce GTX 970, рекомендуемой NVIDIA в розницу по цене 329 долларов США, геймеры могут получить в среднем по всем нашим тестам от 33 до 35% производительности плюсом. Здорово, не правда ли? И это без учёта всех остальных достоинств нового продукта.

Мало того, что MSI GeForce GTX 970 Gaming легко разделалась с одной из самых быстрых заводских GeForce GTX 770, так ещё и ASUS STRIX GTX 780 OC с шестью гигабайтами видеопамяти для неё не является крепким орешком, в чём мы с вами убедимся по двум следующим сводным диаграммам.



Только в одном режиме Hitman: Absolution, Crysis 3 и Batman: Arkham Origins новинка не смогла одолеть грозного соперника. Во всех же остальных тестах MSI GeForce GTX 970 Gaming оказывается впереди и в среднем выигрывает от 6 до 11% в разрешении 1920х1080 пикселей и от 3,8 до 9,3% в разрешении 2560х1440 пикселей.

Похожим образом складывается противостояние MSI GeForce GTX 970 Gaming с AMD Radeon R9 290X.



Правда в этом противоборстве MSI GeForce GTX 970 Gaming уступила ещё и в игре Company of Heroes 2, но не критично много. Впрочем, на данный момент заметно подешевевшая Radeon R9 290X имеет преимущество по рыночной стоимости, так что данное сравнение выглядит не совсем корректно.

Не забыли мы и про сравнение MSI GeForce GTX 970 Gaming с эталонной NVIDIA GeForce GTX 980.



Налицо дружное отставание новинки во всех игровых тестах и общий 9-12% проигрыш. Так, между прочим, отметим, что GeForce GTX 980 по рекомендованной стоимости на 67% дороже, чем GeForce GTX 970 ($549 против $329).

Как вы наверняка помните, графический процессор MSI GeForce GTX 970 Gaming нам удалось разогнать на 16,2%, а частоту видеопамяти поднять на 14,8%. Такой разгон позволил серьёзно увеличить производительность видеокарты во всех тестах, и следующая пара сводных диаграмм тому подтверждение.



В среднем по всем тестам производительность видеокарты выросла на 12-14%, благодаря чему, MSI GeForce GTX 970 Gaming выходит на уровень производительности эталонной версии NVIDIA GeForce GTX 980 и даже чуть выше.



Блестящий результат!

5. Энергопотребление

Измерение энергопотребления системы с различными видеокартами осуществлялось с помощью многофункциональной панели Zalman ZM-MFC3 , которая показывает потребление системы «от розетки» в целом (без учёта монитора). Измерение было проведено в 2D-режиме, при обычной работе в Microsoft Word или «интернет-сёрфинге», а также в 3D-режиме. В последнем случае нагрузка создавалась с помощью четырёх последовательных циклов вступительной сцены уровня «Swamp» из игры Crysis 3 в разрешении 2560х1440 пикселей при максимальных настройках качества графики, но без использования сглаживания MSAA.

Давайте сравним уровень энергопотребления систем с протестированными сегодня видеокартами.



Система с видеокартой MSI GeForce GTX 970 Gaming оказалась наиболее экономичной среди других участников сегодняшнего тестирования. Уровень её энергопотребления в целом достигал отметки в 472 ватта, а в среднем держался у 450 ватт. Примечательно, что куда более слабая видеокарта из предыдущего поколения EVGA GeForce GTX 770 SC в составе системы потребляет больше на 30 ватт, так что и в плане энергопотребления очевиден серьёзный шаг вперёд. В сравнении с GeForce GTX 780 и Radeon R9 290X новая GeForce GTX 970 выглядит ещё более убедительно по этому показателю, выигрывая у систем с данными видеокартами от 81 до 87 ватт в пике нагрузки. Впечатляет и эталонная NVIDIA GeForce GTX 980, конфигурация с которой потребляет едва больше, чем с MSI GeForce GTX 970 Gaming. При разгоне последней энергопотребление системы возрастает всего на 21 ватт в пике нагрузки.

Заключение

Есть такая всем известная русская поговорка «ложка дёгтя в бочке мёда», когда какая-нибудь мелочь портит что-то большое и исключительно хорошее. Так вот сегодня у нас сплошная «бочка мёда» без всяких там ложек чёрных субстанций, и имя ей – MSI GeForce GTX 970 Gaming. Видеокарта обладает беспрецедентно высоким для своего класса уровнем производительности, обеспечивая ощутимый прирост к заменяемой собой модели из предыдущего поколения GeForce GTX 770 и делает это при более низкой рекомендованной стоимости на старте продаж. Впечатляющий оверклокерский потенциал нового графического процессора GM204 архитектуры Maxwell и подстать ему высокочастотная память способны вывести и выводят видеокарту MSI на уровень производительности флагманской GeForce GTX 980, а в некоторых графических режимах позволяют опередить её. При этом стоимость GeForce GTX 970 куда более демократична, нежели у GeForce GTX 980, и, скорее всего, именно данная модель будет пользоваться наибольшим спросом. Безусловно, здесь нужно отдать должное инженерам MSI, оснастившим свою видеокарту не только высококачественной элементной базой с долговечными компонентами, но и самым совершенным кулером MSI Twin Frozr V, обеспечивающим эффективное охлаждение при крайне низком уровне шума. Прежде таких результатов на воздушном охлаждении при столь высоких частотах практически топовых видеокарт достичь не удавалось. Отметим и сравнительно низкий уровень энергопотребления новинки, и более скромные требование к мощности блоков питания. В общем, остаётся только дождаться появления таких видеокарт в широкой продаже, чтобы стать счастливым обладателем одной из таких вот «бочек мёда».

Благодарим компанию MSI ,
персонально Бориса Волка,
за предоставленную на тестирование видеокарту
.


Gainward GeForce GTX 970 Phoenix Результаты тестирования Одной страницей

Продолжаем компенсировать отсутствие обзоров некоторых актуальных видеокарт на нашем сайте. GeForce GTX 970 периодически присутствовала в разных тестированиях по отдельным играм. Настало время для резюмирующего обзора. Мы опишем общие особенности GeForce GTX 970 и рассмотрим конкретную модель в исполнении компании Gainward. Будут проведены тесты при рекомендованных частотах, с заводским разгоном и при максимальных частотах, которых нам удалось достичь на этой карте. Производительность GeForce GTX 970 мы сравним с некоторыми флагманскими решениями и соперниками от AMD.

Видеокарта GeForce GTX 970 является младшим решением на базе графического процессора GM204 архитектуры Maxwell второго поколения, являясь по сути урезанной версией GeForce GTX 980. С этой картой связана неприятная история, когда в официальные спецификации вносились правки уже после выпуска продукта. Сам продукт при этом никоим образом не менялся, просто изначально NVIDIA не раскрыла все его технические особенности.

В полной версии GM204 оперирует 2048 потоковыми процессорами CUDA-cores и 128 текстурными блоками, которые организованы в два кластера по 8 блоков SMM в каждом. В GeForce GTX 970 отключено 3 SMM из 16, что дает 1664 активных CUDA-ядер и 104 текстурных блока. Без изменений осталась 256-битная шина памяти. Но, как оказалось позже, GeForce GTX 970 немного упрощена и по части ROP - их 56 вместо 64. Попутно отрезаны связанные с ними блоки кэш-памяти L2, и вместо 2 МБ в активе младшей карты 1792 КБ. Один из восьми 64-битных контролеров памяти лишился выделенной области кэш. Он работает с последним сегментом памяти. В результате из 4 ГБ видеобуфера у GeForce GTX 970 3,5 ГБ работают на максимальной пропускной, а последние 512 МБ выступают в роли добавочного сегмента, и скорость работы с ним значительно меньше. Если упрощать, то можно говорить о 3,5 ГБ эффективной памяти и 0,5 ГБ вспомогательной, которая не всегда используется.

Общая организация такой структуры изображена на блок-схеме. Для наглядности можно привести более привычную блок-схему ядра GM204, которую вы могли видеть в разных обзорах. На ней мы удалили деактивированные блоки.

Вместе с некоторыми упрощениями в GeForce GTX 970 удалось добиться высокой энергоэффективности и TDP на уровне 145 Вт. Частота Boost у ядра заявлена на среднем уровне 1178 МГц при базовом значении 1051 МГц. Эффективная частота чипов памяти 7 ГГц. Относительно GeForce GTX 980 младшая карта слабее на 23% по основным вычислительным блокам, по ROP разница 14%. Чуть ниже и частота GPU. Для лучшей наглядности сравним характеристики этих двух видеокарт в одной таблице.

Архитектура

Кодовое имя GPU

Количество транзисторов, млн.

Техпроцесс, нм

Площадь ядра, кв. мм

Количество текстурных блоков

Количество блоков ROP

Частота ядра, МГц

Шина памяти, бит

Тип памяти

Объём памяти, Мбайт

Интерфейс

Уровень TDP, Вт

Теперь взглянем на конкретную модель Gainward GeForce GTX 970 Phoenix.

Видеокарта поставляется в большой коробке. Комплектуется переходником питания, адаптером DVI/D-Sub и диском с программным обеспечением.

Gainward GeForce GTX 970 Phoenix - массивное устройство с системой охлаждения, которая занимает более двух слотов. Кулер использует два вентилятора. Пластиковый корпус накрыт декоративными элементами красного и серебристого цветов.

У карты два разъема питания, которые находятся ближе к центру. При этом сама плата полноформатная. Gainward защищен гарантийной пломбой на одном из винтов. По этой причине мы не имели возможность разобрать Phoenix и детально изучить плату.

Для вывода изображения реализовано четыре интерфейсных разъема: HDMI, два DisplayPort, DVI.

Оценить конструкцию кулера можно без разбора. Пластиковый корпус снимается отдельно. Под ним виден крупный радиатор с тремя медными тепловыми трубками.

В радиаторе есть «окно» под разъемы питания. В районе узла питания имеется ребристый радиатор на транзисторах.

Обдув осуществляется двумя вентиляторами Apistek диаметра 92 мм. Они прикручиваются к пластиковому съемному корпусу.

Рабочие частоты ядра у Gainward GeForce GTX 970 Phoenix выше рекомендованного уровня. Базовое значение 1152 МГц при Boost Clock 1304 МГц. Частоты памяти остались на стандартном уровне в 7012 МГц.

Частота Boost определяется ограничениями по мощности и температурным лимитом. Если они не превышены, частоты выше заявленного уровня Boost Clock. По мере нагрева или превышения ограничений по мощности частота может снижать до более низких значений. У нашего тестового экземпляра пиковый Boost достигал уровня 1367 МГц. Понижения относительно максимума небольшие, в некоторых приложениях лишь на 12-25 МГц, в некоторых играх больше. Например, во время прохождения бенчмарка Metro Last Light частота ядра иногда падала почти до 1300 МГц, но не ниже заявленного Boost Clock.

Уровень шума весьма умеренный. Температура держалась в пределах 75 °C.

Разгон осуществлялся через утилиту MSU Afterburner. Базовая частота была повышена до 1277 МГц, что позволило достичь Boost до 1505 МГц после небольшого повышения напряжения. Память удалось разогнать до уровня 8100 МГц.

Для сохранения стабильности пришлось поднять скорость вентиляторов, что уже чревато появлением определенного гула. Если вопрос шума крайне критичен, то без повышения напряжения при меньшем разгона видеокарта вполне сможет работать на том же уровне шума, что и в номинале.

Нас также интересует производительность самой простой версии GeForce GTX 970. По итогам изучения других обзоров можно прийти к выводу, что частота Boost во многом зависит от охлаждения и эксплуатационных условий, даже если технические характеристики у разных видеокарт одинаковы. В итоге мы подобрали такую базовую частоту, чтобы пиковое значение не превышало 1230 МГц. При этом понизили лимит мощности, что дало снижения Boost ядра до 1177 МГц в самых тяжелых моментах. В более простых играх результирующее значение Boost было ближе к максимуму.

При таких настройках видеокарта Gainward заменит референсную версию в нашем сравнении.

Характеристики участников тестирования

В тестирование добавлен старый флагман в лице GeForce GTX 780 Ti. Этот видеоадаптер оснащается меньшим объемом памяти, зато может похвастать 384-битной шиной. Интересно сравнить его возможности с GeForce GTX 970 в современных играх. Ранее мы делали сравнение флагманских карт двух поколений NVIDIA и AMD в отдельном обзоре , но младшая модель на GM204 в него не попала. Для наглядности добавлены результаты GeForce GTX 980 Ti. Эта самая мощная серийная карта. Ее уровень по умолчанию выше. Но интересно, каков будет разрыв с предельно разогнанной картой GeForce GTX 970.

Среди конкурентов от AMD топовые решения на базе процессора Grenada(Hawaii) - Radeon R9 390X и Radeon R9 290X, плюс Radeon R9 Fury.

В разгоне протестирован только графический ускоритель Gainward GeForce GTX 970, все остальные участники тестировались при рекомендованных частотах.

Технические характеристики всех участников указаны в таблице. По частотам приведены официальные данные для Boost. На диаграммах производительности указаны базовые и пиковые значения частот GeForce.

GeForce GTX 980 Ti

Gainward GeForce GTX 970 Phoenix

GeForce GTX 780 Ti

Архитектура

Кодовое имя GPU

Количество транзисторов, млн.

Техпроцесс, нм

Площадь ядра, кв. мм

Количество потоковых процессоров

Количество текстурных блоков

Количество блоков ROP

Частота ядра, МГц

Шина памяти, бит

Тип памяти

Эффективная частота памяти, МГц

Объём памяти, Мбайт

Интерфейс

Уровень TDP, Вт

Тестовый стенд

  • процессор: Intel Core i7-3930K @4,4 ГГц
  • материнская плата: ASUS Rampage IV Formula
  • память: Kingston KHX2133C11D3K4/16GX, 1866 МГц, 4x4 ГБ
  • жесткий диск: Hitachi HDS721010CLA332, 1 TБ
  • блок питания: Seasonic SS-750KM
  • операционная система: Windows 7 Ultimate SP1 x64
  • драйвер GeForce: NVIDIA GeForce 359.06
  • драйвер Radeon: AMD Radeon Crimson Edition 15.11

Тесты проводились в разрешении 2560x1440. На диаграммах слева указывается минимальный fps, справа указан средний fps. Список тестов не очень большой, поэтому описание методики тестирования не выносилось в отдельный блок статьи. Все описания и необходимые примечания идут перед результатами.


Gigabyte Geforce GTX 970 WindForce SuperOC 4096 МБ 256-битной GDDR5 PCI-E
Параметр Значение Номинальное значение (референс)
GPU Geforce GTX 970 (GM204)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц 1178-1380 1050-1178
Частота работы памяти (физическая (эффективная)), МГц 1750 (7000) 1750 (7000)
Ширина шины обмена с памятью, бит 256
Число вычислительных блоков в GPU/частота работы блоков, МГц 13/1178-1380 13/1050-1178
Число операций (ALU) в блоке 128
Суммарное число операций (ALU) 1664
Число блоков текстурирования (BLF/TLF/ANIS) 104
Число блоков растеризации (ROP) 64
Размеры, мм 300×105×35 270×100×36
Количество слотов в системном блоке, занимаемые видеокартой 2 2
Цвет текстолита черный черный
Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»), Вт 159/68/21 147/62/22
Выходные гнезда 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2 1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Поддержка многопроцессорной работы SLI
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Дополнительное питание: количество 8-контактных разъемов 1 Нет
Дополнительное питание: количество 6-контактных разъемов 1 2
Максимальное разрешение 2D: DP/HDMI/Dual-Link DVI/Single-Link DVI
Максимальное разрешение 3D: DP/HDMI/Dual-Link DVI/Single-Link DVI 3840×2400/3840×2400/2560×1600/1920×1200

Комплектация локальной памятью

Картa имеeт 4096 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 4 Гбит (по 4 на каждой стороне PCB).

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) . Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры и (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia - , также известная, как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 970 GTX 970 )
  • Geforce GTX 980 со стандартными параметрами (сокращенно GTX 980 )
  • Geforce GTX 770 со стандартными параметрами (сокращенно GTX 770 )
  • Radeon R9 290X со стандартными параметрами (сокращенно R9 290X )
  • Radeon R9 290 со стандартными параметрами (сокращенно R9 290 )

Для анализа производительности новой модели видеокарты Geforce GTX 970 нами были выбраны эти решения по следующим причинам. Geforce GTX 980 также является новейшей моделью компании Nvidia на базе того же графического процессора GM204, но в полной конфигурации, и будет интересно оценить разницу между ними. А из предыдущего семейства для сравнения была взята модель Geforce GTX 770, которая является предшественницей рассматриваемой новинки в этом же сегменте, и основана на графическом процессоре GK104, схожем по позиционированию с GM204, но с предыдущей архитектурой Kepler.

От конкурирующей компании AMD для нашего сравнения мы выбрали две видеокарты, основанные на одинаковом графическом процессоре - Hawaii, но отличающиеся по скорости. Плата Radeon R9 290 является главным ценовым конкурентом для Geforce GTX 970, и мы сравним их с рыночной точки зрения, ну а Radeon R9 290X будет тем решением, к которому нужно стремиться новинке в идеале, хотя эта видеокарта AMD заметно дороже и потребляет куда больше энергии.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Мы отказались от устаревших тестов DirectX 9, так как все мощные решения отличаются в них не слишком показательными результатами, будучи серьёзно ограничены ПСП, филлрейтом или текстурированием. К тому же, некоторые из видеокарт некорректно работают в таких приложениях, а Nvidia и вовсе давно перестала заниматься оптимизацией D3D9-приложений.

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail - «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга - до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» - от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в тесте зависит от количества и эффективности блоков TMU, влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, с выпуском видеочипов на базе архитектуры GCN компания AMD вырвалась вперед по производительности, и сейчас платы Radeon являются лидерами в этих сравнениях, что говорит о значительно более высокой эффективности выполнения ими этих программ. Такой вывод подтверждается и сегодняшним сравнением - представленная недавно видеокарта Nvidia проиграла обоим конкурентам от AMD, в том числе своему главному сопернику в лице Radeon R9 290.

В первом нашем тесте новая видеоплата модели Geforce GTX 970 оказалась явно побыстрее своего ценового аналога из предыдущего поколения в виде GTX 770, но преимущество не очень большое. Результат объясним более эффективным исполнением данной задачи новым GPU и заметно большей скоростью заполнения, так как скорость текстурирования у GTX 970 не слишком высока. Отставание в 16% от GTX 980 говорит в пользу упора в производительность блоков TMU и ALU.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В изменившихся условиях новая видеокарта Geforce GTX 970 также опережает аналогичную модель из предыдущего поколения - GTX 770, оказываясь между последней и GTX 980. От своего более производительного собрата на GM204 она отстаёт на 15-18%, а отставание от главного ценового конкурента в виде Radeon R9 290 лишь увеличилось - в подобных вычислениях чипы компании AMD явно сильны, так как они предпочитают попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза - такой режим называется «High».

Диаграмма очень похожа на предыдущую (также без включения суперсэмплинга), и в этот раз новая Geforce GTX 970 оказалась ближе к GTX 980, чем к GTX 770. Новинка продолжает заметно опережать модель предыдущего поколения от Nvidia, а старшей проигрывает уже чуть меньше - 14%. Похоже, что новый графический процессор Nvidia в пиксельных шейдерах справляется с работой лучше предыдущих решений.

Ну а если брать сравнение с видеокартами AMD, то в этом случае все примерно так же, как и было ранее в прошлом тесте. Новинка GTX 970 уступает и Radeon R9 290X и R9 290, хотя подобралась к своему ценовому конкуренту несколько ближе. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Оба графических решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают явно эффективнее, по сравнению с конкурирующими платами Geforce, но новый чип GM204 слегка изменил ситуацию в лучшую сторону - представленная ранее вторая из топовых плат Geforce GTX 970 на втором чипе архитектуры Maxwell стала заметно быстрее предшествующей Geforce GTX 770 и в самых сложных условиях отстаёт от соперничающей с ней Radeon R9 290 лишь на 10%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест - Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП, особенно в случае быстрейших решений. В случае теста Mineral, новая модель Geforce GTX 970 оказалась заметно быстрее платы GTX 770 из предыдущего поколения, которую заменила в линейке компании Nvidia. А от старшей GTX 980 она отстаёт всего лишь на 12%.

Мало того, даже сравнение Geforce GTX 970 с конкурирующей с ней платой от компании AMD, оказывается в пользу первой! Обновление архитектуры Nvidia с Kepler до Maxwell привело к тому, что их новый чип в таких тестах даже имеет преимущество перед конкурирующими решениями от AMD. В этом математическом тесте конкурирующая с новинкой по цене видеокарта Radeon R9 290 оказалась чуть-чуть, но всё же позади, что можно назвать отличным результатом для второй платы на чипе GM204.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Да и во втором нашем математическом тесте из RigthMark мы видим примерно такие же результаты видеокарт относительно друг друга - разница между тестами получилась несущественной. Так, новая Geforce GTX 970 всё так же сильно опережает GTX 770, отставая от GTX 980 на те же 12%. Да и Radeon R9 290 всё так же, хоть и чуть-чуть, но всё же отстаёт от новинки производства Nvidia. В тестах пиковой математической производительности новый видеочип Nvidia показывает себя просто отлично!

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления - в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах Nvidia и AMD обусловлена отличиями в геометрических конвейерах чипов этих компаний, и она весьма заметна. Если в предыдущих тестах с пиксельными шейдерами платы AMD справлялись с работой не хуже, а то и лучше решений Nvidia, то первые же тесты геометрии показывают, что в таких задачах платы Nvidia весьма конкурентоспособны.

Свежая модель видеокарты Geforce GTX 970 опережает аналогичную GTX 770 из предыдущего поколения чуть ли не вдвое, а отставание от GTX 980 на таком же чипе составляет уже привычные 15-16%. Видеокарты Radeon в этот раз сильно отстают, и это можно объяснить тем, что геометрическая производительность у графических процессоров компании AMD хуже, чем у Nvidia. Особенно отличился новый GM204, который справляется с работой заметно быстрее чем даже GK110. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia, но разница невелика и ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними.

Плата Nvidia на базе урезанного графического процессора архитектуры Maxwell более чем в полтора раза быстрее аналогичной модели предыдущего поколения, от GTX 980 отстаёт на 13-14%, ну а оба решения конкурента (Radeon R9 290X и R9 290) остаются далеко позади.

К сожалению, «Hyperlight» - второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 - stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и эта ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:

Тут мы видим примерно то же самое, что и в тесте Galaxy - вторая видеоплата на чипе GM204 всё так же быстрее GTX 770, хотя разница между ними уже сократилась, а отставание от Geforce GTX 980 снизилось до 6-9%. Возможно, в тяжёлом режиме что-то изменится:

В таких условиях результаты разных видеокарт компании Nvidia изменились, и разница между GTX 980 и GTX 970 увеличилась до 10-13%. Новая Geforce GTX 970 хоть и быстрее подобной же платы из прошлого поколения в виде Geforce GTX 770, но отставание последней уже явно меньше. В любом случае, новинка показала себя очень неплохо, она весьма эффективно справляется с различными программами на основе геометрических шейдеров.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» - нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно хорошо заметно в простом режиме. Новая топовая видеокарта компании Nvidia в нём показывает скорость выше, чем аналогичная по рыночному позиционированию плата GTX 770 из предыдущего поколения, а в лёгком режиме явно упирается в ПСП. Отставание от старшей GTX 980 составило 6-9%.

Главный ценовой конкурент новинки в виде Radeon R9 290 в этот раз немного опережает плату от Nvidia, особенно в лёгком режиме. Разница в остальных двух режимах не слишком велика, а в самом сложном она составляет лишь 4%. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась, решения компании AMD в тяжелых режимах потеряли явно больше, чем платы Geforce, и значительно. Новая видеоплата Geforce GTX 970 показала скорость выше, чем оба конкурента (за исключением самого лёгкого режима, где она упёрлась в пропускную способность памяти). Если же сравнивать новинку с решением этой же компании из предыдущего поколения, то GTX 970 опережает плату GTX 770 с хорошим запасом. Ну а отставание от GTX 980 составляет привычные 6-8%.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не слишком похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели всех Geforce в этом тесте сильно ухудшились, и хотя новая модель Nvidia Geforce GTX 970 чуть быстрее GTX 770, но разница мизерная, а старшей модели GTX 980 новинка проигрывает и вовсе до 19%. Если сравнивать её с конкурентами, то обе платы серии Radeon R9 290 смогли показать лучшую производительность в этом тесте. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и больше всего пострадали видеокарты Nvidia. В выводах меняется не слишком многое, но новая модель Geforce GTX 970 отстаёт от GTX 980 уже целых 17-23%, да и в сравнении её с предшественницей из серии Geforce GTX 700, новинка проигрывает - дело явно в недостаточной скорости текстурирования. А уж стоящей те же деньги Radeon R9 290 новинка от Nvidia уступила в этом тесте и вовсе чуть ли не вдвое.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов видеокарты модели Geforce GTX 970 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Увы, но разница в скорости между GTX 970 и GTX 770 в пользу решения предыдущего поколения, что легко объяснимо теоретически - у новинки меньше блоков TMU. Если сравнивать GTX 970 с GTX 980, то рассматриваемая сегодня модель на основе урезанного чипа GM204 в текстурировании уступает 16%, что меньше теоретической разницы.

Что же касается сравнения скорости текстурирования новой топовой видеоплаты Nvidia с аналогичным по цене решением конкурента, то тут новинка также уступает своему главному сопернику по ценовой нише - Radeon R9 290, причём очень сильно. Всё-таки сравнительно малое количество текстурных блоков в GM204 высокой частотой работы GPU не перекрыть. Feature Test 2: Color Fill

Вторая задача - тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, иногда - с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), поэтому тест измеряет пропускную способность и/или производительность ROP, и в этот раз похоже на второе. Результат у рассматриваемой сегодня топовой платы Geforce GTX 970 намного (более чем в полтора раза) лучше, чем у GTX 770, а старшей GTX 980 новинка уступила тоже немало - 17%.

Если сравнивать скорость заполнения сцены новой видеокартой Geforce GTX 970 с видеокартами AMD, то рассматриваемая нами сегодня плата в этом тесте показывает скорость заполнения сцены, превышающую ту, на которую способны и идентичная по цене Radeon R9 290 и даже более дорогая Radeon R9 290X - всё-таки оптимизации по эффективности сжатия данных буфера кадра и большое количество блоков ROP сделали своё дело. Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX 970 оказалась почти на 40% быстрее своего аналога на базе графического процессора архитектуры Kepler, хотя и уступила 17% плате GTX 980 на основе такого же чипа GM204, но в полноценной его версии.

Новинка немного (13%) проигрывает и своему сопернику по цене в виде AMD Radeon R9 290, что объясняется тем, что графические процессоры производства компании AMD в этой задаче работают весьма эффективно, ну а теперь и новые платы на базе графического процессора GM204 подобрались к Radeon на близкое расстояние. Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны бы являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны были проявиться именно тут, но нет - все платы Nvidia показали не слишком высокую (и одинаковую!) скорость. В результате, новая модель Geforce GTX 970 показала результат примерно на одном уровне с GTX 770 и GTX 980 - тут что-то явно не так.

Сравнение с платами Radeon в этом тесте приводит к понятным выводам - несмотря на меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности, по сравнению с конкурирующими решениями Nvidia, обе платы Radeon в этом тесте работают весьма эффективно и обгоняют все три платы Geforce, представленные в сравнении. Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация серьёзно изменилась, в этот раз новая модель Geforce GTX 970 работает заметно лучше - новинка на 23% быстрее своего предшественника в лице GTX 770, и на 14% отстаёт от старшего варианта GTX 980.

Сравнение новинки Nvidia с конкурирующими видеокартами компании AMD в этот раз куда более позитивное, ведь обе платы от компании-соперника показывают чуть худшие результаты, новинка опережает Radeon R9 290 на 5%, и даже более дорогая модель в виде Radeon R9 290X также совсем чуть-чуть отстала. В итоге: платы на чипах AMD лучше выполняют синтетический тест имитации тканей из тестового пакета 3DMark Vantage, а за Nvidia остаётся тест с расчётом частиц, хотя в обеих задачах используются геометрические шейдеры. Feature Test 6: Perlin Noise

Ну и последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise - это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом случае производительность решений не полностью соответствует теории, но она близка к тому, что мы видели в других математических тестах. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. Главным отличием стало то, что результат новинки Geforce GTX 970 теперь ниже, чем у Radeon R9 290.

Видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше конкурента, особенно в тех случаях, когда выполняется интенсивная «математика». Вторая модель компании Nvidia из семейства Geforce GTX 900 в этом тесте показала неплохой результат, обогнав Geforce GTX 770 аж на 42% и отстав от GTX 980 лишь на 13% (при несколько большей теоретической разнице), но этого не хватило, чтобы догнать Radeon R9 290, являющийся главным соперником новинки по цене. Разница между ними оказалась порядка 10%, в пользу решения AMD.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать анонсированное сегодня решение компании Nvidia в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление - одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно уже приблизительно одинаковая, отличия наблюдались только у видеокарт на основе GPU предыдущих архитектур. Судя по нашим предыдущим тестам, результаты в задаче порой зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти и производительности блоков ROP.

В данном случае скорость видеокарт всё же зависит больше всего именно от математической производительности. Новая плата от компании Nvidia в этом тесте немного впереди своей предшественницы в лице Geforce GTX 770, и уступает GTX 980 лишь 12%, что объяснимо теорией. Если сравнивать Geforce GTX 970 с прямым ценовым конкурентом в лице Radeon R9 290, то рассматриваемая сегодня плата калифорнийской компании отстаёт от него ещё немного больше.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) - симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом тесте чаще всего наблюдается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. И во втором DX11-тесте расклад сил между решениями двух разных компаний получился совершенно иной.

Решения компании Nvidia в этот раз явно сильнее, чем платы соперника, а Geforce GTX 970 удивила большим отставанием от старшей модели - она аж на 27% медленнее старшей сестры GTX 980. Похоже, что сказываются серьёзно урезанные возможности по геометрической и математической производительности.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других - для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 - Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость плат не так уж важна, так как эта задача давно стала слишком легкой и производительность упирается в ПСП или филлрейт. Сегодняшний герой обзора незначительно превосходит предшествующую модель Geforce GTX 770, уступая GTX 980 более 20%, а схожее с новинкой по цене решение конкурента в виде Radeon R9 290 явно быстрее всех.

Во втором подтесте с более сложными попиксельными расчетами новинка всё так же быстрее модели Geforce GTX 770, уступает GTX 980 на полноценном GM204 около 17%, и снова заметно отстаёт от конкурирующей Radeon R9 290. Всё-таки эффективность выполнения математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler, хотя Maxwell и улучшил позиции решений Nvidia.

В подтесте с применением лёгкой степени тесселяции, новая плата Nvidia почти наравне с моделью предыдущего поколения Geforce GTX 770, а топовая GTX 980 на 18% быстрее. Если сравнивать новинку с единственной платой производства AMD, то она всё так же серьёзно уступает, так как в этом тесте тесселяции разбиение треугольников весьма умеренное и скорость не упирается в производительность блоков обработки геометрии.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK - PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте в тяжелых режимах применяется более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит совершенно другие выводы. Все представленные в материале современные решения достаточно хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость. И хотя в лёгких условиях графический процессор AMD в составе Radeon R9 290 отлично работает, даже опережая калифорнийских конкурентов, которые явно во что-то уперлись, то в тяжёлых режимах платы Nvidia выходят вперёд с большим запасом. В самых сложных режимах представленная в прошлом месяце Geforce GTX 970 показывает скорость заметно лучше, чем единственная Radeon.

Что касается сравнения плат Nvidia различных поколений между собой, то рассматриваемая сегодня модель Geforce GTX 970 тоже наращивает преимущество с ростом геометрической нагрузки, как и должно быть по теории. В итоге она опережает предшествующую плату Geforce GTX 770 в самом сложном режиме почти вдвое! Да и старшая модель на топовом чипе Maxwell не так уж сильно обгоняет рассматриваемую новинку - разница между ними составляет лишь 7-10%.

Рассмотрим результаты еще одного теста - демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции - в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарта Radeon R9 290 показывает высокий результат, даже превосходящий скорость анонсированной недавно платы Geforce GTX 970, но уже на следующих ступенях геометрической нагрузки производительность платы Radeon снижается весьма серьёзно, и новинка Nvidia выходит вперёд.

Преимущество новой платы Nvidia на видеочипе GM204 в таких тестах доходит до двух раз. Интересно, что если сравнить Geforce GTX 970 с GTX 770, то разница между их производительностью доходит до полутора раз, что трудно объяснить одной лишь возросшей скоростью обработки геометрии. Вполне возможно, что дело ещё и в том, что GM204 заметно эффективнее работает в режиме смешанной нагрузки, быстро переключаясь от исполнения графических задач к вычислительным и обратно. От старшей модели GTX 980 новинка отстаёт лишь на 11-16%, что близко к теории.

Проанализировав результаты синтетических тестов новой видеокарты Nvidia Geforce GTX 970, основанной на графическом процессоре GM204 с урезанными функциональными блоками, а также рассмотрев результаты других моделей видеокарт от обоих производителей дискретных видеочипов, можно сделать вывод о том, что рассматриваемая сегодня видеокарта вполне сможет составить конкуренцию не только сопернику по цене от компании AMD в виде Radeon R9 290, но и может стать одной из самых удачных видеокарт в своём ценовом сегменте. Она совсем немного (порядка 7-15%) уступает старшей модели GTX 980, а стоит намного дешевле её.

Новая видеокарта компании Nvidia показывает довольно высокие результаты в «синтетике», близкие к показателям Radeon R9 290. Вообще, у этих решений разные сильные стороны, в некоторых тестах сильнее более сложный графический процессор AMD, в том числе из-за большей пропускной способности памяти и эффективного исполнения пиксельных шейдеров, а в других быстрее уже графический процессор архитектуры Maxwell. Конечно, ситуация в реальных игровых приложениях может отличаться от итогов синтетических тестов, но Geforce GTX 970 в любом случае станет сильным конкурентом для Radeon R9 290 и в играх.

При этом, Geforce GTX 970 ещё и потребляет энергии меньше, чем даже Radeon R9 285, не говоря о Radeon R9 290. В смысле энергоэффективности обе новые модели компании (Geforce GTX 970 и GTX 980) выглядят потрясающе - инженеры Nvidia добились высочайшей эффективности нового GM204. С рыночной же точки зрения всё будет зависеть от цен в магазинах и сравнения производительности в игровых приложениях.

И как раз для того, чтобы сделать выводы по реальному положению дел, в следующей части нашего материала мы определим производительность новинки Nvidia в игровых проектах, сравнив её с конкурентами и оценив, в том числе и оправданность розничной цены решения с учётом скорости рендеринга Geforce GTX 970 и Radeon R9 290 в нашем наборе игровых приложений.




Top