Какие игры потянет процессор amd a8 3800. LlanParty от AMD. Обзор платформы Llano. Чипсеты и материнские платы

Перед вами вторая часть материала, посвященного выводу на рынок «настольной» платформы AMD Lynx и «гибридных» процессоров AMD Llano со встроенным видеоядром.

Нет надобности по второму кругу разъяснять «что к чему», ведь о «теории» (архитектуре новых процессоров AMD A6 и A8, «южных» мостов FCH A75 и A55, позиционировании подобных систем на рынке) было рассказано в прошлый раз. Теперь перейдем к практике – исследованию разгонного потенциала и тестированию производительности. Для начала скажу пару слов о том, что и как будет изучаться в этой статье.

Во-первых, речь пойдет о разгоне. Тут все просто – задачу можно сформулировать так: «выжать из процессора все возможное». Однако необходимо учитывать ряд нюансов. «Выжимание» будет проводиться с прицелом на повседневное использование. Это означает, что цель - отнюдь не снятие «скриншота CPU-z» на нестабильной системе, будут учтены только полностью работоспособные режимы.

Для разгона будет применяться воздушное охлаждение: работающий в составе стенда кулер Noctua NH-D14 с высокооборотными вентиляторами является одной из лучших по производительности моделей, предлагаемых на рынке. Если учесть, что процессоры A6 и A8 предназначены для «домашних» компьютеров не самого высокого уровня – им придется работать в связке с гораздо менее производительными СО; так что тут все честно. К тому же (забегая вперед) на практике выяснилось, что возможностей кулера с бо-о-ольшим запасом хватает для разгона исследуемого процессора, и, к примеру, «вода» мало бы что изменила.

Второй вопрос – собственно производительность. На мой взгляд, новые процессоры можно тестировать двумя способами: «как CPU» и «как APU». Поясню.

В случае «как CPU» необходимо выявить возможности вычислительной части и сравнить их с показателями других процессоров. Смысл в том, что новый A6 или А8 может использоваться и без «встроенной» графики, просто как типичный четырехъядерник. К счастью, за несколько лет у меня накопилось достаточно данных, полученных в «универсальных» тестах, чтобы провести такое сравнение. Причем можно организовать как «чистое» сопоставление архитектур на равной частоте, так и практический тест «все процессоры на максимальных частотах», который позволяет выявить возможности систем после разгона. Именно это и будет проделано чуть ниже.

Но эта часть теста в данном исследовании не является основной. Я уже писал, что с выводом на рынок новых APU AMD не стремилась создать просто «еще один процессор». Главная цель – занять принципиально новую рыночную нишу «гибридных» процессоров с достаточно производительной графической составляющей, чего нет у конкурентов (читай – Intel). По предварительным данным AMD это удалось: старшие процессоры нового семейства могут «тянуть» многие игры без дискретной видеокарты. Факт, который требует изучения: стоит проверить, на что способен новый APU как «система на кристалле».

Тесты двух типов («процессорные» и «графические») помогут максимально полно выявить потенциал новых APU по сравнению с конкурирующими решениями. Но начну я по логике изложения именно с разгона.

Тестовый стенд

Поскольку в нескольких тестах будут приводиться результаты самых разных CPU, протестированных в разное время, необходимо указать в данном разделе сразу несколько использованных для этого стендов.

Процессоры Intel Core i7 980 X Extreme и Intel Core i7-920 тестировались в составе следующего стенда:

  • Материнская плата: ASUS Rampage III Extreme, BIOS 0402;
  • Процессоры: Intel Core i7 980 X Extreme (3333 МГц, LGA1366, Gulftown), Intel Core i7-920 (2667 МГц, LGA1366, Bloomfield);
  • Системы охлаждения процессора: Intel DBX-B Thermal Solution; Cooler Master Hyper N620, Ice Hammer IH-4500;
  • Оперативная память: Corsair TR3X6G1600C7 DDR3-1600, 7-7-7-20, 3x2 Гбайта, трехканальный режим;
  • Корпус: открытый стенд.

Процессоры AMD Phenom II X6 и AMD Phenom II X4 тестировались в составе следующего тестового стенда:

  • Материнская плата: ASUS M4A89GTD PRO/USB3, BIOS 1207;
  • Процессор: AMD Phenom II X6 1090T (3200 МГц, AM3, Thuban), AMD Phenom II X4 965 (3400 МГц, AM3, Deneb);
  • Система охлаждения процессора: Ice Hammer IH-4500;
  • Оперативная память: Corsair TR3X6G1600C7 DDR3-1600, 7-7-7-20-41-2T, 2x2 Гбайта, двухканальный режим;
  • Видеокарта: ATI Radeon HD 5870, ASUS EAH5870 reference;
  • Жесткий диск: Western Digital WD1001FALS, 1000 Гбайт;
  • Блок питания: Cooler Master Real Power M1000, 1 кВт;
  • Корпус: открытый стенд.

Процессоры Intel Core i7-870 и Intel Core i3-550 тестировались в составе следующего тестового стенда:

  • Материнская плата: ASUS P7P55D;
  • Процессор: Intel Core i7-870 (базовая частота 2930 МГц), Intel Core i3-550 (базовая частота 3200 МГц);
  • Жесткий диск: Western Digital WD1001FALS, 1000 Гбайт;
  • Блок питания: Cooler Master Real Power M1000, 1 кВт;
  • Корпус: открытый стенд.

Процессоры Intel Sandy Bridge Core i5-2400 и Core i7-2600 тестировались в составе следующего тестового стенда:

  • Материнская плата: MSI P67A-GD65, BIOS v. 1.3B6;
  • Процессоры: Intel Core i5-2400 (базовая частота 3100 МГц), Intel Core i7-2600 (базовая частота 3400 МГц);
  • Система охлаждения процессора: Noctua NH-D14 (2 x Scythe Slip Stream SY1225SL12SH; ~950-1800 об/мин);
  • Оперативная память: Corsair TR3X6G1600C7 DDR3-1600, 7-7-7-20, 2x2 Гбайта, двухканальный режим;
  • Видеокарты: ASUS Radeon HD 5870, reference;
  • Жесткий диск: Western Digital WD1001FALS, 1000 Гбайт;
  • Блок питания: Cooler Master Real Power M1000, 1 кВт;
  • Корпус: открытый стенд.

Процессоры Intel Sandy Bridge Core i3-2100 и Core i5-2500K тестировались в составе следующего тестового стенда:

  • Материнская плата: ASUS Maximus IV Gene-Z, BIOS v. 0208;
  • Процессоры: Intel Core i3-2100 (базовая частота 3100 МГц), Core i5-2500K (базовая частота 3300 МГц);
  • Система охлаждения процессора: Noctua NH-D14 (2 x Scythe Slip Stream SY1225SL12SH; ~950-1800 об/мин);
  • Оперативная память: Corsair TR3X6G1600C7 DDR3-1600, 7-7-7-20, 2x2 Гбайта, двухканальный режим;
  • Блок питания: Cooler Master Real Power M1000, 1 кВт;
  • Корпус: открытый стенд.

Процессор AMD A8-3800 тестировался в составе следующего тестового стенда:

  • Материнская плата: ASUS F1A75V PRO, BIOS v. 0820;
  • Процессор: AMD A8-3800 (базовая частота 2400 МГц);
  • Система охлаждения процессора: Noctua NH-D14 (2 x Scythe Slip Stream SY1225SL12SH; ~950-1800 об/мин);
  • Оперативная память: Corsair TR3X6G1600C7, Geil GET34GB1800C8DC;
  • Жесткий диск: Western Digital WD10EALX, 1000 Гбайт;
  • Блок питания: Cooler Master Real Power M1000, 1 кВт;
  • Корпус: открытый стенд.

Программное обеспечение:

  • Windows 7 Ultimate x64;
  • ATI Catalyst v. 10.11. для видеокарты Radeon HD 5870.

Инструментарий и методика тестирования

Первая часть теста («процессорная») проводилась с использованием следующих приложений и бенчмарков:

  • SiSoft Sandra Professional 2010 – общая производительность процессора (арифметический тест, общая скорость криптографии).
  • Cinebench 11.5 x64 – рендеринг сцены, учитывался общий рейтинг процессора.
  • Fritz Chess Benchmark – количество операций в секунду (kiloNods).
  • SuperPi Mod 1.5 – учитывалось время, необходимое для вычисления 1 миллиона знаков числа Пи после запятой (SuperPi 1M)
  • WinRar x64 3.91– учитывалось время упаковки/распаковки папки с разнородными файлами общим объемом 617 Мбайт. В настройках программы был активирован режим многопоточности (multithreading).
  • x264 HD Benchmark v3.0 – стандартный алгоритм. На графиках представлены минимальное и максимальное значения, полученные в ходе тестирования.

Вторая часть тестирования («графическая») проводилась с помощью следующих игр и бенчмарков:

  • Crysis Warhead – FBWH Benchmarking Tool, демо – ambush;
  • Crysis 2 – FRAPS;
  • FarCry 2 – вcтроенный бенчмарк; демо – Ranch Small;
  • Metro 2033 - вcтроенный бенчмарк; демо – Frontline;
  • Lost Planet 2 – бенчмарк-версия игры, Test B;
  • Formula 1 2010 – встроенный бенчмарк;
  • Dragon Age 2 – FRAPS;
  • Assassin’s Creed: Brotherhood – FRAPS.

Все тесты проводились в разрешениях 1280 x 1024, 1680 x 1050 и 1920 x 1200. Настройки каждой игры приведены после соответствующего графика.

Разгон

Итак, для начала проверим, на что способна вычислительная часть нового APU AMD.

Как я уже писал ранее, CPU-ядра процессоров A6 и А8 в конструктивном плане представляют собой хорошо известный AMD Phenom II x4, но без кэш-памяти третьего уровня и с увеличенным вдвое cache L2. Хотя то же самое можно сказать иначе. В комментариях к предыдущей части читатели меня поправили: скорее данный CPU похож на Athlon II x4 с увеличенным cache L2. Хотя суть от этого не меняется, ключевой момент здесь – это новый 32 нм техпроцесс для уже привычных ядер Stars (K10).

В связи с этим интересно выяснить, улучшился ли разгонный потенциал нового CPU по сравнению с привычными 45 нм Athlon и Phenom. «Переезд» на 32 нм техпроцесс может здорово их «взбодрить».

Для примера можно взять ситуацию с переходом от 45 нм Intel Core i5/i7 (Bloomfield/Lynnfield) к 32 нм Core i5/i7 (Sandy Bridge). Пусть новые процессоры Intel в чистом виде (читай – на равных частотах) ненамного превосходят CPU предыдущего поколения, дополнительное преимущество обеспечивает разница в частоте после разгона. Если раньше «нормой» считалось разогнать «камень» до 4000 МГц (чуть более удачный экземпляр – 4200-4300 МГц) то теперь нередки результаты около 5000 МГц, а «типичная частота» повысилась до 4500-4600 МГц (речь идет, разумеется, о Intel Core i5-2500K и Core i7-2600K).

Частота 45 нм процессоров AMD после разгона достигала величин порядка 4000 МГц. Встречаются удачные экземпляры, которые могут взять на 100-300 МГц больше, но некоторые Phenom и Athlon не дотягивают и до этой планки, демонстрируя результат 3800-3900 МГц. Посмотрим, что изменилось с освоением новых технологических норм. Но сначала необходимо определится с инструментарием, а заодно проверить новые процессоры на совместимость с нынешним софтом (нередко программное обеспечение «не успевает» за выводом на рынок нового «железа», что вызывает различные проблемы).

Для проверки стабильности было решено использовать привычный тест Linpack с графической оболочкой Linx версии 0.6.4. Объем используемой оперативной памяти составил 2048 Мбайт, 20 прогонов теста. Дальнейшие опыты показали, что это приложение хорошо подходит для выявления стабильной частоты при разгоне. В отличие от процессоров Sandy Bridge, которые рекомендуется дополнительно проверять с помощью теста Prime95 (для выявления мелких ошибок, которые может пропустить Linpack), здесь это не обязательно.

Проблемой стал поиск программы для мониторинга температуры процессора. В идеале для проведения полноценных экспериментов по разгону необходима утилита, отслеживающая температуры всех ядер процессора в отдельности (четырех вычислительных и графического). Однако на практике оказалось, что эти требования неосуществимы. Обычно используемая мною Real Temp последней версии попросту отказалась запускаться, сообщив, что «процессор не поддерживается». Другая известная утилита – Core Temp давненько не обновлялась и показывает полную «абракадабру»: отрицательные температуры, которые изменяются каждую секунду.

Большие надежды возлагались на SpeedFan, последняя версия (4.44 final) которого вышла буквально на днях. Эта программа сумела считать правдоподобные данные. Температуры процессора и материнской платы в покое составляют порядка 30-32 градусов. К сожалению, ни о каком раздельном мониторинге температур отдельных ядер не может быть и речи.

В итоге для проведения настройки системы и мониторинга температур было решено воспользоваться фирменными утилитами ASUS, которые уже были адаптированы под стендовую материнскую плату F1A75 PRO.

Программа PC Probe II позволяет управлять основными напряжениями, а также регулировать обороты вентиляторов. Кроме того, во вкладке Sensor отображаются те же температуры, что и в SpeedFan.

Программа TurboV Evo отлично подходит для разгона системы без перезагрузок. Здесь можно регулировать частоту системной шины, напряжения питания процессора и памяти.

При переходе к расширенным настройкам (More Settings) появляется возможность регулировки множителя APU.

В дальнейшем разгон проводился, как с использованием возможностей данной программы (для «прикидочных» прогонов Linpack и небольших изменений настроек после загрузки системы), так и привычным способом, при помощи изменения параметров в BIOS Setup.

Первый вопрос, который мне понадобилось прояснить, - возможность разгона тестового процессора с увеличением множителя. Дело в том, что когда первые инженерные экземпляры APU A6 и A8 попали в руки журналистов несколько месяцев назад, оказалось, что множитель у них жестко заблокирован. Тогда в новостях сообщалось о «недоработках» в BIOS первых материнских плат на сокете FM1, которые будут исправлены к моменту релиза платформы Lynx. Необходимо проверить, так ли это.

Тестируемый процессор AMD A8-3800 работает на штатной частоте 2400 МГц, что задано как 24 х 100 (множитель APU х частота шины). Базовое напряжение питания составляет 1,2125 В.

Из-за работы системы энергосбережения частота ядра может снижаться до 800 МГц, есть и «промежуточное» значение 1400 МГц. По данным CPU-z напряжение питания может составлять 0,966 В, 1,032 В, 1,212 В в зависимости от режима.

При «авторазгоне» данного процессора (технология TurboCore) частота может повышаться до 2700 МГц (27 х 100). Перед разгоном я отключил все эти функции, они могут влиять на частоту процессора и мешать при проведении собственно разгона и тестировании производительности.

Начав увеличивать множитель, я вначале подумал, что процессор демонстрирует отличные способности к разгону. Система оказалась стабильна на частоте 3500 МГц (35 х 100) даже без увеличения напряжений! На деле все хуже – при переходе к тестам не было замечено возрастания производительности после увеличения частоты таким способом. Можно провести простейшую проверку, воспользовавшись тестом SuperPi 1M.

Очевидно, что реальная частота (вопреки данным, приводимым в BIOS и на основном экране утилиты CPU-z) перестает увеличиваться при множителе выше 27 единиц. Это неудивительно, что-то подобное наблюдалось при разгоне «заблокированных» Sandy Bridge. Хотя множитель таких процессоров и считается жестко фиксированным, его все-таки можно увеличить на несколько единиц с помощью «зарезервированных» под работу технологии Turbo Boost значений. Здесь – то же самое. Множитель блокирован, но его можно увеличить на три единицы, как раз до значения, которое этот параметр приобретает при «авторазгоне» (технология Turbo Core).

Для процессоров А6 и A8 максимальные значения множителя будут составлять:

Модели с числовым индексом, оканчивающимся на 00 (3600, 3800), поддерживают технологию Turbo Core, так что у них есть резерв в три единицы по множителю. Модели старшей серии (3850, 3650) сами по себе обладают более высоким множителем, но «резерва» у них нет, их можно разгонять, только увеличивая частоту системной шины.

Остановившись на множителе 27, предельном для тестируемого процессора A8-3800, я принялся увеличивать частоту шины. Дело пошло бодро при штатных настройках всех напряжений, пока система не «уперлась» при частоте шины 112 МГц. 112 х 27 = 3024 МГц, что, разумеется, не может считаться хорошим результатом. Для тестирования производительности мне было необходимо добраться как минимум до значения 3200 МГц (именно на такой частоте были получены результаты для многих процессоров ранее) при частоте памяти 1600 и задержках 7-7-7-20.

Напряжение питания CPU было поднято до значения 1,475 В. Также были увеличены и все второстепенные напряжения (на один-два шага вверх – стандартная практика для повышения стабильности системы при разгоне). Вдобавок все настройки подсистемы питания, которыми располагает материнская плата, были установлены в «экстремальный» режим.

  • VRM Frequency – 400 KHz;
  • Phase Control – Manual Ajustment – Ultra Fast;
  • Duty Control – Extreme;
  • CPU Current Capability - 120%.

Однако все эти меры ни к чему не привели. После длительных поисков и «перелопачивания» BIOS проблема все же была выявлена. Плата ASUS несмотря на то, что был активирован полностью «ручной» режим, почему-то захотела «помочь» мне и отрегулировала тайминги оперативной памяти по своему усмотрению.

Перед началом разгона я выставил множитель DRAM в положение 13.33. С базовой частотой шины, равной 100 МГц, это дает результат DDR3-1333 МГц. Используемые модули Corsair TR3X6G1600C7 «по паспорту» держат частоту 1600 МГц при задержках 7-7-7-20, и у меня нет повода сомневаться в их возможностях (я использую эти «планки» уже второй год, и они выдерживают даже небольшой разгон при штатном напряжении и «таймингах»). Таким образом, возможностей модулей должно хватить, по крайней мере до частоты системной шины 120 МГц (120 х 13.33 = 1600).

После того как система отказалась загружаться на частоте более 112 МГц по шине, я снизил множитель DRAM до 8 (DDR3-800), чтобы уж точно убрать возможные помехи для оверклокинга. Однако разгон от этого только ухудшился! Оказалось, что материнская плата самостоятельно изменила тайминги на 5-5-5-15, а модули Corsair совершенно не предназначены для работы в таких условиях даже при низкой частоте.

Пришлось вручную прописать задержки CL8 (8-8-8-24) и дело пошло на лад. Но для преодоления барьера в 112-115 МГц приходилось использовать значения множителя DRAM равные 8 и 10.66, что давало слишком низкую итоговую частоту памяти. Это чрезвычайно странно, поскольку возможностей модулей должно хватать для работы с множителем 13.33 на частоте системной шины 120.

Пробившись несколько часов, я так ничего и не достиг. В итоге было решено, что виной всему именно память, и модули были заменены на Geil GET34GB1800C8DC, штатная частота которых составляет 1800 МГц при задержках 8-8-8-28. Дело пошло на лад.

После многих прикидок и перезапусков системы на различных настройках получилось подобрать режим, максимально близкий к требуемому для сравнительного тестирования производительности.

С максимальным множителем 27 и частотой системной шины 119 МГц удалось получить итоговый результат 3213 МГц. Частота оперативной памяти при этом составила 1587 МГц (множитель 13.33), что предельно близко к необходимым 1600 МГц (разница ~1%).

К сожалению, используемые модули Geil хоть и помогли достижению такого результата (с «планками» Corsair он был бы недостижим) – очень плохо подходят для работы при низких задержках. Они «заточены» под достижение максимальных частот, а вот тайминги при этом необходимо использовать достаточно «мягкие». Мне удалось выставить только CL8 (8-8-8-24) вместо требуемых 7-7-7-20, на которых Corsair работали во всех остальных тестовых системах.

Получается, подсистема памяти в данном случае будет работать чуть медленнее, чем на других стендах. Пусть разница совсем невелика, но в некоторых тестах процессору A8 можно мысленно накинуть результат на пару-тройку процентов больше, памятуя, что этот CPU работает в чуть худших условиях.

Теоретически данный процессор можно разогнать и сильнее. Достижима частота системной шины 122 МГц, что обеспечивает результат 3294 МГц при множителе APU 27 единиц. Но в таком случае любую память (что Corsair, что Geil) приходится использовать со «смешным» множителем DRAM, равным 8. Итог понятен: DDR3- 967 МГц и значительное падение результатов всех синтетических тестов.

Достаточно прогнать SuperPi, чтобы понять, насколько вариант CPU 3200 МГц + DRAM 1600 МГц получается производительнее, чем CPU 3300 МГц + DRAM 1000 МГц. «Максимальной рабочей частотой» данного процессора на применяемом тестовом стенде можно считать все те же 3213 МГц, процесс «выжимания» которых был описан выше.

После изучения материалов зарубежных коллег выяснилось, что во многих случаях новые процессоры AMD удавалось разогнать сильнее с повышением частоты системной шины до 130-140 МГц. Для используемого мной тестового стенда данный результат оказался недостижим.

Я длительное время пытался обнаружить проблему. Например, считается, что при разгоне шины растет и частота всех производных (в том числе интерфейса SATA), что может приводить к неработоспособности жестких дисков. Однако подключение диска к отдельному разъему SATA, работающему с контроллером ASmedia, не смогло решить проблему.

Возможно, вину за столь неуверенный разгон процессора следует возложить на видеоядро, которое также разгоняется вместе с шиной. Его номинал составляет 600 МГц, что задано как 100 х 6 (множитель IGP, который не поддается регулировке на данной материнской плате). При разгоне шины до 122 МГц «графика» будет работать уже на частоте 732 МГц. В моем случае (шина 119 МГц) его частота составляет 714 МГц. Это немало, но некоторым удавалось запустить iGPU на частотах далеко за 800 МГц.

Также я по очереди значительно повышал второстепенные напряжения, пытаясь найти то, которое сдерживает разгон – безрезультатно.

Либо мне попался на редкость неудачный экземпляр процессора, либо все дело в «недописанном» BIOS материнской платы ASUS, который вызывает ошибки при работе системы с памятью.

Я бы не назвал процессоры AMD A6-A8 хорошо подходящими для разгона. Даже при поднятии системной шины до 130-135 МГц старшая модель A8-3850 c множителем 29 разгонится только до частоты 3,8 – 3,9 ГГц. Это куда ниже, чем предельные частоты 32 нм процессоров Intel. Младшие же модели с пониженным множителем не доберут еще 200-400 МГц частоты.

Ну что же, с архитектурой новейших APU Llano и системной логики для них мы разобрались. Переходим к практической части нашего материала — тестированию производительности. По правде говоря, тема APU AMD в одном материале вряд ли будет исчерпана, поэтому мы решили сосредоточить своё внимание на основных, с нашей точки зрения, вещах:

  • Производительности x86-части нового APU в современных приложениях в сравнении с конкурентами;
  • Производительности встроенной графической части нового APU в современных играх и бенчмарках в сравнении с конкурентами;
  • Производительности системы с APU после разгона;
  • Производительности системы с APU в режиме Dual Graphics.

⇡ Участники тестирования:

AMD A8-3800 APU

  • Материнская плата Gigabyte A75-D3H.

  • Оперативная память 4 Гбайт SuperTalent DDR-3 2000 MHz (при использовании встроенного в APU графического ядра оставалось доступно лишь 3,5 Гбайт);
  • Графический ускоритель: встроенный Radeon HD 6550D или Radeon HD 6690D2 (HD 6550D + Radeon HD 6670 GDDR-5);

Intel Core i3-2100 CPU

  • Материнская плата Intel DH6B7L;
  • Графический ускоритель: встроенный Intel HD 2000 (850-1100 MHz)
  • Жёсткий диск Seagate 750 Гбайт.

Intel Core i3-2105 CPU

  • Материнская плата Intel DH67BL;
  • Оперативная память 4 Гбайт SuperTalent DDR-3 2000 MHz;
  • Графический ускоритель: встроенный Intel HD 3000 (850-1100 MHz)
  • Жёсткий диск Seagate 750 Гбайт.

⇡ Список тестовых пакетов

  • Everest Ultimate;
  • 7-Zip x64;
  • Cinebench R11.5 x64 xCPU;
  • Fritz Chess Benchmark;
  • Super Pi 1M XS;
  • Super Pi 32M XS;
  • WinRAR 4.0 x64;
  • wPrime 32M;
  • wPrime 1024M;
  • X264 HD Benchmark;
  • Cyberlink MediaEspresso 6;
  • 3DMark Vantage Perf. Overall Score;
  • Heaven 2.5 DX10/11, 1680x1050, 1920x1080 Average FPS;
  • S.T.A.L.K.E.R.: COP, DX10/11, 1680x1050, 1920x1080 Med. Detail, avg FPS;
  • Far Cry 2 DX10, 1680x1050, 1920x1080 Opt. Detail, avg FPS;
  • Mafia II DX10, 1680x1050, 1920x1080 Med. Detail, avg FPS.

⇡ Разгон

Скажем сразу, что из-за сырости первой версии BIOS материнской платы Gigabyte A75-D3H выжать максимально возможные частоты нам не удалось — чувствуется, что система способна на большее. Тем не менее компьютер с A8-3800 стабильно работал на повышенных относительно номинала частотах, если точнее, то CPU вместо штатных 2,4 ГГц (2,7 ГГц в режиме Turbo CORE) функционировал на частоте 3,19 (3,49 ГГц в режиме Turbo CORE), в свою очередь память после разгона работала на частоте 1772 МГц с таймингами 8-8-8-20-2Т. Графическое ядро мы смогли разогнать с 600 до 850 МГц, все игры в таком режиме проходились без артефактов.

К сожалению, нам не удалось выполнить рекомендации AMD по установке максимальной частоты памяти в 1866 МГц, поскольку тестовая материнская плата не могла стартовать в таком режиме даже после поднятия напряжения и ослабления таймингов. Судя по всему, в будущих версиях BIOS подобная проблема будет решена.

⇡ Производительность

В первую очередь давайте посмотрим как обстоят дела в борьбе с продуктами конкурента. Для сравнения мы выбрали процессоры Core i3-2100 и Core i3-2105. Они различаются лишь поколениями интегрированной графики. В первом случае графический контроллер относится к семейству HD 2000, во втором — HD 3000. Именно поэтому в 2D-тестах будет выступать лишь один CPU — Core i3-2100, ну а в 3D мы оценим возможности обоих представителей Intel. Поехали.

Синтетический Everest показывает серьёзный отрыв продуктов Intel по части работы с памятью. Определённо, интегрированный КП разработки синего гиганта работает в разы эффективнее. Это, без сомнения, должно отразиться на скорости работы приложений, жадных до ПСП.

Практически все тесты, за исключением разве только программы, использующей для оценки производительности шахматный алгоритм, показывают перевес CPU Intel. И архивация данных, и уж тем более кодирование видеопотока на Core i3 происходит гораздо быстрее. Особое внимание обратите на результаты, полученные при включении на Core i3 блока Quick Sync. Скорость кодирования видео в программе Media Espresso почти в три раза выше, чем при кодировании силами APU AMD. Впрочем, не стоит забывать, что на стороне AMD аппаратная поддержка OpenCL и DirectCompute, так что в вопросах сжатия аудио и видео потока точку ставить рано.

А вот графическая производительность, как и ожидалось, у APU AMD на голову выше, чем у конкурирующего продукта Intel. Использование более мощного контроллера Intel HD 3000 ситуацию не сильно спасло — APU AMD существенно быстрее.

Теперь давайте посмотрим, как отразился разгон на результатах производительности APU AMD A8-3800, и подведём итоги.

В нашем списке тестовых пакетов присутствуют как синтетические тесты, так и реальные приложения. Нужно сказать, что разгон CPU и оперативной памяти приносит ощутимые плоды. Так, во многих случаях результаты производительности увеличиваются на 40 и более процентов. Стоит учесть, что как только изготовители материнских плат устранят недостатки BIOS, коих, судя по плате Gigabyte, немало, мы можем ожидать ещё лучших результатов.

Нельзя не отметить и пользу от разгона интегрированного графического ядра, благодаря которому в некоторых случаях мы получаем вполне приемлемую частоту смены кадров в режиме Full HD. Весьма неплохо, особенно учитывая тот факт, что перед нами интегрированная в процессор графика, да и детализация в играх не самая низкая — средняя.

В свою очередь использование видеокарты Radeon HD 6670 в качестве пары для AMD A8-3800 APU дает ощутимую прибавку в производительности. Теперь уже все протестированные нами игры демонстрируют приличную частоту смены кадров. Обратите внимание, что в OpenGL-тесте Cinebench R11 x64 установка внешней видеокарты в пару интегрированной результатов не дала (1,4% прирост можно считать погрешностью измерений), налицо программное ограничение в драйверах, которые не позволяют активировать Dual Graphics в OpenGL и DX9. Впрочем, для нас это сюрпризом не является. Надо сказать, что компания AMD вряд ли захочет менять эту ситуацию к лучшему, ведь основной ее целью сейчас является продвижение DX11-приложений.

⇡ Энергопотребление

Измерение энергопотребления происходило в трёх режимах: офисная работа (рабочий стол, Word, Excel), воспроизведение HD видео (720P) и игра в Far Cry 2 при максимальном качестве в разрешении 1680x1050. Результаты тестов показали, что APU A8-3800 от AMD оказывается немного экономичнее своего конкурента в лице Core i3-2100, разница в пользу AMD составляет от 6 до 13% в зависимости от нагрузки.

⇡ Выводы

По нашему мнению, новейшие APU Llano и созданная для них платформа — существенный шаг вперёд для компании AMD, да и для всей индустрии в целом. Нельзя не отметить, что характер вычислений постепенно меняется и производительности x86-процессоров явно не достаточно для решения всех задач. Именно поэтому инженеры AMD сделали ставку на интегрированное графическое ядро, вычислительные блоки которого можно гибко использовать для разных задач, будь то научные расчёты или кодирование видео силами GPU. Традиционное преимущество процессоров Intel в плане производительности x86-ядер никуда не делось — два физических и два виртуальных ядра Core i3-2100 в большинстве случаев легко расправляются с четырёхядерным процессором AMD A8-3800 APU. Но как только дело доходит до игр, тут уж детище AMD отыгрывается по полной программе, предлагая своему владельцу много большую производительность в сравнении с аналогом на базе Core i3-2100. Ещё одним плюсом платформы Lynx является умеренное энергопотребление, по крайней мере это касается системы с протестированным нами APU A8-3800.

Ну что же, можно смело поздравить AMD с вполне удачным запуском настольных APU, время покажет, насколько компания оказалась права в своём видении характера вычислений будущего.

Благодарим компании Ф-Центр и ApitComp за предоставленные для тестирования процессоры Intel.

Страница 2 из 3

Тестирование APU Llano A8-3800

Теперь можно перейти непосредственно к герою нашего обзора - APU Llano A8-3800. Модельный ряд А8 подразумевает две модели, отличающиеся только тактовой частотой и количеством TDP. Нашему испытуемому достались 2,4 ГГц частоты и 65 Вт. Вполне неплохо для настольных и мобильных компактных систем. Жертвуя производительность за энергопотребление, инженеры АМД не ошиблись – в условиях малых корпусов гораздо важнее экономить питание, чем гнаться за мощностью. Опять же, высокая производительность подобным системам не требуется, а если кому-то и захочется, то это можно считать своего рода извращением.

Основными конкурентами APU Llano A8-3800 будут, как ни странно, младшие модели Core i3. Хотя производитель и заявлял вслух о соперничестве с Core i5, но это только слова: если мобильные системы еще как-то выносят такое сравнение, то для настольных ПК продукт от Интел остается вне конкуренции – тактовые частоты существенно выше. Поэтому только двухъядерные Core i3 сегодня будут участвовать в этом забеге, тем более что ценовой сегмент у них и APU Llano A8-3800 одинаков.

Чтобы получить полную картину производительности, сравнивать на тестовом стенде сегодня мы будем Core i3-2100 с нашим испытуемым. Естественно, тактовая частота у него выше, чем у нашего героя, но именно этот процессор позволит получить объективную картину исследования. Конкуренцию мы подбирали действительно самую медленную – для чистоты эксперимента.

Все исследования было решено разделить на две группы тестов: в системе с дискретной HD 6970 и без таковой. Первый вариант подразумевает отключение встроенного графического ядра. Посмотрим же, как себя проявит APU Llano A8-3800 в системе с физической видеокартой.

SYSmark 2012

Скандально известная утилита SYSmark 2012 на сей раз представляет немалый интерес. Несмотря на все претензии АМД к этому софту и его разработчикам, именно она отвечает всем требованиям бенчмарка и замерам общей производительности. Тест использует множество приложений, и результаты позволяют всесторонне оценить работу процессора. АМД обвиняет разработчиков в дискриминации своей продукции, ведь в набор софта не входят те, которые можно ускорить ресурсами APU Llano. Справедливости ради стоит заметить, что подобных приложений насчитывается крайне мало, так что объективность тестирования сомнению не подлежит.

Результаты замеров общей производительности для героя обзора неутешительны: серьезное отставание бросается в глаза и разочаровывает, особенно если вспомнить о большем количестве ядер у АМД. Однако стоит учесть, что интеловский процессор поддерживает Hyper-Threading и имеет более высокие тактовые частоты.

SYSmark 2012 предлагает несколько тестовых сценариев. Офисную работу имитирует Office Productivity, 3D Modeling подразумевает создание трехмерного изображения, Media Creation работает с видеокодеками. Результаты нам демонстрируют заметное отставание Llano A8-3800, лишь в трехмерном моделировании графический процессор проявляет себя во всей красе. Преимуществ в остальном четыре ядра так и не дали.


Энергопотребление

Энергопотребление A8-3800 является сильным местом новинки. Во-первых, 65 Вт, заявленные производителем – уже неплохо. Во-вторых, система отключения блоков процессора от питания позволяет экономить энергию.


В простое система с Llano потребляет энергии меньше интеловского соперника, как и ожидалось. Под нагрузкой же ситуация меняется, однако по показателям можно судить о том, что новый процессор малотребователен. Да возрадуются этому десктопчики и нетбуки!

Apple iTunes

Кодирование/декодирование аудиофайлов – еще один тест, на сей раз выполненный с помощью Apple iTunes. Как видим, Llano уступает значительно сопернику, даже учитывая, что задействованы 4 ядра, а не два.


Кодирование видео x264 HD

В пику аудио, тест x264 HD на определение скорости кодирования видео показал неплохой потенциал A8-3800. Отчасти это зависит от кодека x264, прекрасно работающего с процессорами от АМД и использующего для обработки все ядра.


Определение поведения процессора в игровой нагрузке – приоритетная задача для тестов. Не секрет, что игровая производительность зависит не от процессора, а от мощности графической подсистемы. Поэтому тесты предполагают процессорозависимость и средние настройки – для того, чтобы минимально задействовать видеокарту: тестируется все же не она. По результатам мы снова видим отставание Llano A8-3800, правда, уже не столь значительное. Учитывая все те же тактовые частоты – это хороший прогресс, обеспечиваемый кэш-памятью второго уровня ядер.

Dirt 3

StarCraft 2

Компании AMD никогда не удавалось превзойти Intel по объёмам продаж процессоров. Однако это совершенно не значит, что данная компания играет в мире x86-процессоров сугубо второстепенную роль. Есть немало примеров того, как шаги, предпринимаемые AMD в развитии микроархитектуры собственных x86-процессоров, перерастают в глобальные рыночные тенденции и впоследствии принимаются и Intel. Так, именно компания AMD разработала и первой внедрила в конечных продуктах 64-битные расширения архитектуры x86, которые сегодня являются её неотъемлемой частью. AMD была и той компанией, которая указала на выгоды интеграции процессора с северным мостом набора логики и первой перенесла контроллер памяти в процессор. Если покопаться в истории, подобных эпизодов можно вспомнить немало. Все они говорят о том, что «второй игрок» процессорного рынка - это не аутсайдер, он располагает немалым инженерным и технологическим потенциалом.

Несколько лет тому назад этот потенциал был дополнительно усилен приобретением компании ATI, благодаря которому в распоряжении AMD оказались передовые графические технологии. Используя их, компания AMD вновь выступает с идеями глобальных нововведений, имя которым Fusion. Суть Fusion заключается в объединении традиционных вычислительных ядер с графическим ядром, содержащим большое количество потоковых процессоров, хорошо подходящих для параллельных вычислений.

Центральными процессорами с интегрированным графическим ядром сегодня никого не удивишь. Подобные продукты компания Intel поставляет уже очень давно. Но AMD предлагает иной подход к использованию симбиоза вычислительных и графических ядер. По замыслу инженеров компании, графическое ядро должно не просто заниматься выводом изображения на монитор. Оно должно быть вовлечено в процесс обычной работы процессора. Архитектура современных графических ядер такова, что они способны превосходно справляться с параллельной обработкой больших массивов данных. Поэтому целый ряд задач, таких как обработка изображений и видео, криптографические алгоритмы и некоторые научные алгоритмы, может эффективно решаться вычислительными средствами графического ядра. Конечно, это требует специальной оптимизации существующего программного обеспечения, но получаемый в итоге прирост производительности не оставляет никаких сомнений в том, что идея Fusion смысла не лишена.

С первыми продуктами, сделанными в рамках концепции Fusion, мы уже хорошо знакомы. Известные под кодовыми именами Ontario и Zacate процессоры семейств «E» и «C» хорошо зарекомендовали себя в недорогих настольных и мобильных системах, построенных на базе платформы Brazos. Однако они ориентируются в первую очередь на использование в компактных и экономичных системах, а потому имеют сравнительно невысокую производительность и достаточно ограниченную сферу применения. Очевидно, что для полноценного внедрения Fusion компании AMD необходимы общеупотребительные и массовые платформы и процессоры, обладающие достаточной для этого рыночного сегмента производительностью. Именно поэтому вслед за платформой Brazos AMD выпускает две свежие Fusion-платформы: мобильную Sabine и десктопную Lynx. Обе эти платформы основаны на новых процессорах серии «A» с кодовым именем Llano, которые и должны будут отстаивать честь Fusion в среднем секторе рынка.

В этой статье мы познакомимся с первыми процессорами Llano для настольных компьютеров и попробуем оценить, насколько востребована та революционная гибридная архитектура, которую пытается насадить AMD.

Llano: что внутри?

Llano - это Fusion

Глобально, концепция Fusion предполагает сращивание на аппаратном и программном уровне традиционных процессорных ядер и ядер графических. Поэтому любые APU (Accelerated Processor Unit), спроектированные в соответствии с заложенными в Fusion принципами, имеют типовую структуру, с которой мы уже познакомились на примере Ontario и Zacate. Также как и эти энергоэффективные APU, процессоры Llano содержат в себе вычислительные x86-ядра, графическое ядро и северный мост. Однако сходство между Llano и Zacate существует лишь на поверхностном уровне.

Более высокий статус процессоров Llano, которые ориентируются на использование в системах среднего уровня, потребовал от инженеров AMD интеграции в эти APU более производительных, чем в Zacate, составляющих. Вычислительные x86-ядра в Llano базируются на полноценной микроархитектуре Stars, а не на упрощённой Bobcat. Число таких ядер в составе APU может быть не только два, но и три или четыре. Графическое ядро Llano содержит 320 или 400 потоковых ядер, что в 4-5 раз больше, чем у процессоров для платформы Brazos. А встроенный в APU северный мост поддерживает скоростную двухканальную память и имеет полноценный интерфейс PCI Express для подключения внешних видеокарт.

При этом, несмотря на то, что Llano - это уже второй процессор в семействе Fusion, в нём нет практически никаких принципиально новых составляющих. Проще говоря, весь новый APU собран из старых деталей с минимальными нововведениями. Не вдаваясь в подробности, новинке можно дать такую характеристику: это гибрид процессора Athlon II X4, графического ядра Radeon HD 5570 и чипсета AMD 870, собранный в едином корпусе и на едином полупроводниковом кристалле. Конечно, такое описание несколько условно, на самом деле в Llano есть и небольшие добавки, и оригинальные технические решения, но ничего принципиально нового в этом APU всё-таки нет.

Впрочем, уже то, что сразу несколько столь сложных блоков оказались совмещены на едином полупроводниковом кристалле - это уже достаточно серьёзный шаг вперёд. Он стал возможен благодаря использованию технологического процесса с нормами производства 32 нм, который наконец-то успешно освоен мощностями производственного партнёра AMD - компании GlobalFoundries. Таким образом, в ассортименте у AMD появляются процессоры, выполненные по современному техпроцессу, освоенному Intel уже примерно год назад.



Полупроводниковый кристалл Llano


Сложность полупроводниковых кристаллов Llano возросла до уровня 1,45 млрд. транзисторов. По этой характеристике новые гибридные процессоры AMD немного обошли интеловские Sandy Bridge. Но площадь полупроводникового кристалла у Llano и Sandy Bridge похожа - 228 против 216 кв. мм. Это значит, что эти процессоры должны быть сравнимы по себестоимости, если, конечно, пренебречь тем, что в Sandy Bridge вложены гораздо более серьёзные трудозатраты инженерной команды.

Однако подобие Llano и Sandy Bridge по характеристикам полупроводниковых кристаллов ровным счётом ничего не значит. Распределение «транзисторного бюджета» в этих процессорах отличается кардинально. Если интеловский продукт - это просто процессор с интегрированным графическим ядром, на долю которого отводится не более 20 % площади кристалла, то в Llano на мощности графического ядра сделан очень серьёзный упор. А потому на кристалле занимает оно не менее чем четыре x86-ядра в сумме.



Лучшей иллюстрации того, что же может предложить пользователям Llano, и желать не приходится. Компания AMD делает ставку на то, что у неё в данный момент получается делать лучше всего - на графическое ядро. Процессорные же ядра отошли на второй план, а потому успех нового процессора будет тесно связан с успехом концепции Fusion в целом. Если AMD действительно удастся добиться переноса основной нагрузки на потоковые процессоры GPU, то Llano, вне всяких сомнений, превзойдёт все конкурирующие решения. Только сейчас говорить об этом явно преждевременно - основная масса программного обеспечения работает по старинке, целиком полагаясь на традиционные x86-ядра.

CPU-ядра Husky

Вычислительные x86-ядра, на которых строится процессор Llano, имеют новое кодовое имя Husky. Однако действительно нового в них немного. Они имеют ту же самую микроархитектуру K10 «Stars», которая используется во всех Socket AM3 процессорах. Многообещающая же микроархитектура Bulldozer в гибридные процессоры AMD придёт лишь в следующем году. Так что пока ожидать от Llano чудес производительности (по крайней мере, в традиционных применениях), явно не приходится.

Вместе с тем инженеры AMD попытались как-то подреставрировать старую микроархитектуру, и хотя бы немного поднять производительность ядер Husky по сравнению с ядрами, используемыми в процессорах Athlon и Phenom. Насколько это удалось сделать, мы увидим в тестах, но официальные данные говорят о средневзвешенном 6-процентном приросте быстродействия.

Достигается это главным образом самым простым путём - увеличением объёма кэш-памяти второго уровня. Так, каждое из ядер Llano имеет собственный L2-кэш размером 1 Мбайт. Впрочем, при этом процессоры полностью лишены общего L3 кэша, так что суммарный объём кэш-памяти у новинок не так уж и велик по современным меркам.

В дополнение к увеличению кэша в Husky была улучшена работа блока предсказания переходов, а также оптимизированы размеры основных буферов: буфер переупорядочивания инструкций стал вместительнее на 20 %, а буферы загрузки/сохранения увеличили свой размер вдвое. Также, в Husky появился отдельный блок целочисленного деления, благодаря которому соответствующие операции исполняются быстрее. Как видим, изменений немного, и все они относятся к разряду косметических. Основы микроархитектуры K10 остались непоколебимы, а потому Husky, как и предшествующие ядра могут обрабатывать не более трёх инструкций за такт.



Очевидно, разработчики не особенно-то и боролись за рост производительности x86-ядер процессоров Llano. У них были другие приоритеты. В первую очередь им нужно было постараться улучшить энергетическую эффективность Husky, так как процессоры с микроархитектурой K10 хорошими показателями потребления похвастать не могут. Во-вторых, нужно было серьезно подумать и над тем, каким образом организовать взаимодействие между системной памятью, вычислительными ядрами и графическим ядром. Именно там, а не в микроархитектуре и сосредоточены кардинальные улучшения.

GPU-ядро Sumo

Не стоит забывать и о том, что в составе Llano появилось производительное графическое ядро, названное AMD Sumo. Также как и в случае с процессорами Zacate, архитектура этого ядра позаимствована из дискретных графических решений. Но, учитывая позиционирование Llano, AMD решила встроить в этот процессор значительно более мощную графику, аналогичную Radeon HD 5570 по числу исполнительных устройств.

Собственно, так оно и есть - Sumo является близким родственником дискретного GPU Redwood, построенного на архитектуре AMD VLIW5. То есть, в максимальной версии APU семейства Llano получил графический ускоритель с 400 потоковыми процессорами, 20 текстурными блоками и 8 блоками растеризации. В более дешёвых версиях APU один из SIMD-блоков GPU может отключаться производителем, и число потоковых процессоров будет сокращаться до 320, делая Sumo подобным Radeon HD 5550.


Изменений по сравнению с оригинальным Redwood в Sumo всего два. Во-первых, переделан интерфейс памяти с тем, чтобы адаптировать GPU для работы с двухканальной DDR3 не напрямую, а через процессорный северный мост. Скорость работы с памятью - традиционно слабое место интегрированной графики, поэтому, внедряя в свой APU скоростной GPU, разработчики должны были предусмотреть какие-то специальные оптимизации. К сожалению, в Llano нет ничего подобного интеловской кольцевой шине, и Sumo не может использовать для своих нужд процессорную кэш-память. Зато появилась другая принципиально новая для графического ядра возможность - запись в общую память напрямую, минуя процессорные ядра. Кроме того, все проводимые графическим ядром операции с памятью получают в Llano более высокий приоритет чем обращения вычислительных ядер и обслуживаются контроллером памяти в первую очередь.

Во-вторых, в Sumo заменён на более новую версию блок UVD (Unified Video Decoder). Используемая в Llano третья версия видеодекодера поддерживает все распространённые форматы HD-видео и совместима с MVC (Multi-View Codec), который применяется для 3D-видео. Таким образом, платформа Lynx, в отличие от платформы Brazos, способна воспроизводить 3D Blu-Ray через HDMI-интерфейс. Кроме того, UVD3 более экономичен, он может работать независимо от остальной части графического ускорителя, что позволяет отключать потоковые процессоры при воспроизведении видео.

Описанные изменения позволили компании AMD дать графическому ядру Sumo маркетинговое название из шеститысячной серии. Так, в Llano это ядро может именоваться в зависимости от числа активных потоковых процессоров либо Radeon HD 6550D, либо Radeon HD 6530D.

Встроенный в процессор аналог видеокарты Radeon HD 5570 - весьма заманчивое предложение, но, тем не менее, устроить оно может далеко не всех. Поэтому AMD предусмотрела возможность апгрейда встроенного в APU видеоускорителя с использованием технологии CrossFire. В данном случае эта технология именуется Dual Graphics и позволяет добавлять к мощностям интегрированного в процессор GPU внешнюю видеокарту семейства Radeon, объединяемую с ним в асимметричный CrossFire-массив.



Технология выглядит впечатляюще, ведь для создания системы Dual Graphics подходят совершенно разнородные видеокарты. Однако такая универсальность влечёт за собой и целый ряд проблем. Во-первых, выигрыш в производительности может быть достигнут только в том случае, если дополнительный видеоускоритель не слишком быстр и не превосходит по мощности встроенное в APU ядро Sumo более чем в два раза. То есть, имея, например, Radeon HD 6850, выгоднее будет использовать его независимо, полностью выключив встроенную в процессор графику. Второе ограничение ещё более серьёзно. Асимметричные режимы CrossFire работают лишь в DirectX 10 или 11, поэтому в DirectX 9 или OpenGL-играх Dual Graphics эффекта не даёт, а производительность снижается до уровня самого медленного GPU в системе. Тем не менее, для не слишком притязательных пользователей Dual Graphics предоставляет прекрасную возможность сэкономить, что серьёзно повышает привлекательность Llano как решения начального уровня для геймеров.

Северный мост

На встроенный в процессор северный мост AMD возложила не только работу с памятью, но и поддержку шины PCI Express. Это означает, что по своему строению платформа Lynx стала подобна интеловским системам, а чипсет на материнской плате выродился в южный мост.

Контроллер памяти Llano по сравнению с процессорами прошлого поколения приобрёл более широкую функциональность. Да, как и ранее, он поддерживает двухканальную память, но теперь официально декларируется совместимость не только с DDR3-1333, но и с DDR3-1600/1866 SDRAM. Правда, в случае использования скоростной DDR3-1866 её работоспособность гарантируется только лишь при установке одного модуля на канал.

Вполне очевидно, что рост пропускной способности шины памяти необходим для обеспечения нужд графического ядра. А AMD даже прямо указывает на то, что использование в системах с Llano DDR3-1333 памяти может существенно снизить производительность встроенной графики. Однако поддержка северным мостом скоростных модулей памяти - не главная его особенность. Гораздо интереснее то, что в нём реализованы новые пути следования данных, призванные оптимизировать графическую производительность APU. Помимо традиционной связи «процессор - северный мост», в Llano появились две дополнительных шины «GPU-северный мост».



Первая связь, так называемая Radeon Memory Bus, нужна для работы обычных графических приложений. Эта шина имеет пропускную способность 29.8 Гбайт/с, равную пропускной способности двухканальной DDR3-1866. Обращения к памяти, идущие по ней, обладают самым высоким приоритетом и обрабатываются контроллером памяти даже вперёд процессорных обращений.

Вторая шина, соединяющая графическое ядро и контроллер памяти, носит название AMD Fusion Compute Link и предназначается для прямого доступа графического ядра в память с сохранением когерентности кэш-памяти процессора. Иными словами, Fusion Compute Link нужна для прямого обмена данными между графическим и вычислительными ядрами при их совместной работе над одной задачей. В настоящее время эта шина практически не применяется, но впоследствии, по мере роста популярности концепции Fusion и появления программ, задействующих одновременно все мощности APU, значение Fusion Compute Link должно будет проявиться в полной мере.

Что же касается контроллера шины PCI Express, то в Llano поддерживается 24 линии второго поколения. Четыре линии отводятся на связь с южным мостом чипсета, ещё четыре линии отданы для подключения периферийных устройств. Оставшиеся 16 линий формируют шину PCIe x16, отведённую для внешних видеокарт. При желании эта шина может быть расщеплена на две PCIe x8, так что технология CrossFire поддерживается в платформе Lynx не только в варианте Dual Graphics, но и для работы с парой дискретных видеоускорителей.

Управление питанием и Turbo Core

Снижение энергопотребления было одной из основных целей, которую преследовали разработчики при создании дизайна Llano. Как мы помним, процессоры с микроархитектурой K10 особенной скромностью в энергетических аппетитах не отличались. А теперь к x86-ядрам добавилось и мощное графическое ядро. Поэтому AMD нужно было найти какие-то новые подходы к улучшению потребления, иначе Llano не смог бы претендовать на достойное место на рынке, и в особенности в мобильных компьютерах, где APU с мощной интегрированной графикой могут быть особенно востребованы.

Часть проблемы высокого энергопотребления решилась сама собой при переходе на новый технологический производственный процесс. Использование 32-нм технологии позволило понизить рабочие напряжения Llano до величин порядка 1.2-1.25 В, то есть до того уровня, который ранее использовали только энергоэффективные модификации процессоров Athlon II.

Однако главной новинкой стало то, что в Llano появилась новая внутренняя схема управления питанием, позволяющая отключать от питающего напряжения неиспользуемые участки APU. Несмотря на то, что на процессоры Llano в платформе Lynx отведено всего две независимые линии питания - для процессорных ядер и для графического ядра с северным мостом - внутренняя схема управления питанием может автономно и гибко обесточивать те или иные части процессора. Независимо отключаться могут отдельные x86-ядра, графическое ядро или встроенный в него блок UVD.



В результате, для настольных систем AMD смогла предложить процессоры с тепловыми пакетами 100 и 65 Вт, а для мобильных компьютеров - 45 и 35 Вт. То есть, AMD наконец-то выпустила такие процессоры, тепловыделение которых сравнимо с тепловыделением интеловских Sandy Bridge.

Впрочем, урезание тепловых пакетов для Llano обернулось и тем, что эти процессоры получили достаточно низкие тактовые частоты. Так, ни одна из представленных к настоящему времени моделей не достигает даже и 3-гигагерцовой отметки. Что же касается мобильных представителей семейства, то они и вовсе имеют частоты, не превышающие 2,6 ГГц.

В этих условиях AMD решила задействовать все доступные методы повышения быстродействия, в том числе и технологию динамического разгона Turbo Core, наращивающую частоту работы процессора в случае пассивности части из вычислительных ядер. Эта технология уже была реализована в процессорах Phenom II X6, но в Llano её немного переработали. В APU возможность повышения тактовой частоты устанавливается исходя не из температуры отдельных ядер, а основываясь на их загрузке. Температура же является второстепенным фактором, в случае превышения допустимого предела она может лишь спровоцировать отключение турбо-режима.

Новая реализация Turbo Core лучше тем, что она в общем случае даёт повторяемые результаты и практически не зависит от эффективности системы охлаждения или температуры окружающей среды.

К сожалению, технология динамического разгона в процессорах Llano прилагается только к вычислительным ядрам. Графическое ядро может лишь снижать свою частоту для уменьшения энергопотребления и не может автоматически разгоняться. Однако разработчики учли тот факт, что при работе графического ядра на полной скорости его тепловыделение возрастает, и в этом случае перевод процессорных x86-ядер в турбо-режим может приводить к выходу тепловыделения за установленные пределы. Поэтому, в 3D-или в Fusion-приложениях, активно задействующих потоковые процессоры графического ядра, технология Turbo Core может не включаться даже в том случае, если активно всего одно из четырёх процессорных x86-ядер.

Чипсеты и материнские платы

Платформа Lynx помимо собственно процессоров Llano включает и сопутствующие наборы системной логики. Так как APU уже содержат в себе контроллер памяти и контроллер шины PCI Express, наборы логики состоят всего из одной микросхемы - южного моста, называемого также FCH (Fusion Controller Hub).



AMD предлагает два варианта FCH: младший - A55 и старший - A75. В старшей версии присутствует врождённая поддержка всех современных интерфейсов, включая USB 3.0 и SATA 6 Гбит/с. Младший же чипсет лишён этой роскоши, поддерживая лишь старые версии интерфейсов SATA 3 Гбит/с и USB 2.0.

Полностью возможности FCH можно оценить по блок-схеме A75.


Формальные спецификации версий FCH и их различия видны из таблицы:


Поддерживающие десктопные процессоры Llano материнские платы, в основе которых лежат описанные наборы логики, оборудуются специальным процессорным разъёмом Socket FM1. То есть, они не совместимы с имеющимся парком Socket AM3 процессоров, точно также как Llano не могут быть установлены в старые материнские платы.



Внешний вид Socket FM1


По габаритным размерам Socket FM1 похож на привычный разъём Socket AM3, однако имеет меньшее число контактов - 905. Материнские платы с новым разъёмом подготовили практически все ведущие производители, поэтому проблем с выбором подходящей платформы у покупателей Llano явно не будет.



Что касается систем охлаждения, то AMD постаралась по возможности сохранить совместимость с существующей инфраструктурой, и для новых процессоров полностью подходят старые кулеры, предназначенные для Socket AM3-систем.

Модельный ряд Llano для настольных систем

Первая партия процессоров Llano для настольных систем, выходящая на рынок в эти дни, включает четыре модели APU с четырьмя вычислительными x86-ядрами. Также как и в случае с мобильными Llano, они не имеют маркетингового имени, а обозначаются модельными номерами серий A8 и A6. К серии A8 относятся старшие модели APU, снабжённые графическим ядром Sumo с 400 потоковыми процессорами, а к серии A6 относятся более медленные модификации с заниженными тактовыми частотами и урезанным графическим ядром с 320 потоковыми процессорами.

То есть, до появления двухъядерных Llano, которые будут относиться к серии A4, классификация серий APU происходит в первую очередь по мощности графического ядра. Базовые характеристики входящих в состав процессоров Llano графических ускорителей Radeon HD 6550D и Radeon HD 6530D приводятся в следующей таблице.



Полный же список доступных в данный момент процессоров Llano для новой настольной платформы Lynx приведён в таблице:



Сильные различия в характеристиках прослеживаются не только между APU серий A8 и A6. Пара моделей внутри каждой серии - это, фактически, тоже два принципиально разных продукта с кардинально различным тепловыделением. Наиболее производительные варианты относятся к 100-ваттному тепловому пакету, но вместе с этим AMD предлагает и модификации с более приемлемым расчётным тепловыделением 65 Вт и с поддержкой технологии Turbo Core. Тактовая частота экономичных процессоров снижена относительно 100-ваттных APU примерно на 20-25 %, но частота и характеристики графического ядра остаются на том же самом уровне.

Сразу же бросается в глаза, что тактовые частоты Llano явно ниже частот, которые достигнуты современными Athlon II и Phenom II. А это означает, что Llano - ещё более медленные процессоры, главным козырем которых должна быть не скорость x86-ядер, а мощность графического ядра. Поэтому, апгрейд с платформы Socket AM3 на платформу Socket FM1 имеет смысл разве только в погоне за экономичностью, но никак не за производительностью.

В мобильном секторе рынка AMD рассматривает процессоры Llano в качестве конкурирующих решений для систем на базе Sandy Bridge серий Core i3 и Core i5. На рынке же настольных систем всё немного печальнее - тут Llano конкурировать с Core i5 явно не сможет из-за своих невысоких тактовых частот и использования устаревшей микроархитектуры K10, разработанной ещё в 2007 году. Поэтому в десктопах ценовая политика AMD строится таким образом, чтобы старшие Llano линейки A8 рассматривались в качестве альтернативы младшим Core i3, которые, напомним, являются двухъядерными процессорами.

Описанные четыре модели настольных процессоров Llano станут далеко не единственными представителями семейства. К началу сезона «back-to-school» ряды Socket FM1 процессоров будут пополнены бюджетными 65-ваттными двухъядерными и трёхъядерными продуктами серий A6 и A4, снабжёнными графическими ядрами с 320 и 240 потоковыми процессорами. То есть, семейство Llano будет активно расширяться в нижние ценовые сегменты. Выпуск же производительных решений для платформы Lynx у AMD не планируется.

Как мы тестировали

Дабы создать у журналистов наиболее благоприятное впечатление о новой платформе Lynx, компания AMD разослала в адрес изданий старший из процессоров Llano, A8-3850. Однако нам показалось, что этот процессор не слишком привлекателен для пользователей из-за своего непомерно высокого энергопотребления. К счастью, нам удалось получить на тесты второй процессор, A8-3800, на испытаниях которого мы и сосредоточились.



A8-3800 интересен сразу по нескольким причинам, но самое главное, он сравним с процессорами Core i3 не только по цене, но и по энергопотреблению, то есть именно его, а не A8-3850 следует считать прямым конкурентом для двухъядерных Sandy Bridge.



Собственно, исходя из этих соображений, в нашем тестировании мы сопоставляли A8-3800 с двумя интеловскими процессорами, снабжёнными разными версиями графического ядра HD Graphics - Core i3-2100 (с графическим ядром HD Graphics 2000) и Core i3-2105 (с графическим ядром HD Graphics 3000). Также, часть тестов была проведена и с использованием более дешёвого и более медленного Sandy Bridge - Pentium G850.

Учитывая невысокую тактовую частоту процессора A8-3800, для его сравнения с предложениями предыдущего поколения мы выбрали самый медленный Athlon II X4, который только смогли найти - Athlon II X4 630.

В результате, в тестовых испытаниях были задействованы следующие компоненты:

Процессоры:

AMD A8-3800 (Llano, 4 ядра, 2,4/2,7 ГГц, 4 Мбайта L2, Radeon HD 6550D)
AMD Athlon II X4 630 (Propus, 4 ядра, 2,8 ГГц, 2 Мбайта L2);
Intel Core i3-2100 (Sandy Bridge, 2 ядра, 3,1 ГГц, 3 Мбайта L3, HD Graphics 2000);
Intel Core i3-2105 (Sandy Bridge, 2 ядра, 3,1 ГГц, 3 Мбайта L3, HD Graphics 3000);
Intel Pentium G850 (Sandy Bridge, 2 ядра, 2,9 ГГц, 3 Мбайта L3, HD Graphics);

Материнские платы:

ASUS Crosshair IV Formula (Socket AM3, AMD 890FX + SB850, DDR3 SDRAM);
ASUS P8Z68-V Pro (LGA1155, Intel Z68 Express);
Gigabyte GA-A75-D3H (Socket FM1, AMD A75)

Память - 2 x 2 GB DDR3-1600 SDRAM 9-9-9-27-1T (Kingston KHX1600C8D3K2/4GX);
Графические карты:

AMD Radeon HD 5570;
AMD Radeon HD 6450;
AMD Radeon HD 6570;
AMD Radeon HD 6970.

Жёсткий диск: Kingston SNVP325-S2/128GB.
Блок питания: Tagan TG880-U33II (880 Вт).
Операционная система: Microsoft Windows 7 SP1 Ultimate x64.
Драйверы:

Intel Chipset Driver 9.2.0.1030;
Intel Management Engine Driver 7.1.10.1065;
Intel Rapid Storage Technology 10.5.0.1027;
AMD Catalyst 11.6 Display Driver.

Исследование Llano проводилось в два этапа. На первом мы протестировали этот процессор в составе платформы, оснащённой дискретной графической картой AMD Radeon HD 6970. Второй этап был всецело посвящён исследованию Lynx как интегрированной платформы. Поэтому во второй части тестирования Radeon HD 6970 не использовался, зато для сравнения с графическим ядром Llano применялись недорогие видеокарты AMD Radeon HD 5570, AMD Radeon HD 6450 и AMD Radeon HD 6570.

Предварительная оценка: Llano против Propus

Перед тем, как приступить к «серьёзному» тестированию, мы решили провести небольшое сравнение процессоров Llano и Athlon II X4 при их функционировании на одинаковой тактовой частоте. Это нам даст понимание того, насколько серьёзны улучшения, сделанные в ядрах Husky. AMD говорит о 6-процентной прибавке в скорости, однако компания принимает во внимание и увеличение кэш-памяти второго уровня. Мы же решили сосредоточиться исключительно на усовершенствованиях микроархитектуры, которые можно проверить небольшими синтетическими тестами, не загружающими при своей работе кэш-память второго уровня. Хороший набор таких тестов предлагает популярная утилита SiSoftware Sandra.

Для сравнения в одинаковых условиях тактовая частота Llano и Athlon II X4 была выровнена на уровне 2,4 ГГц, а технология Turbo Core была отключена.



Микроархитектурные улучшения, сделанные в Husky, дают совсем незначительный практический эффект. При этом наибольший выигрыш наблюдается при работе процессора с целочисленными данными. Таким образом, большинство случаев, когда Llano, работая на той же тактовой частоте, превосходит по скорости процессоры предыдущего поколения, будет объясняться либо увеличенной кэш-памятью, либо вовлечением в работу мощностей потоковых процессоров продвинутого графического ядра.

Впрочем, есть и ещё один момент. AMD в процессорах Llano переделала контроллер памяти. Он стал поддерживать более быструю DDR3 и стал обслуживать три независимых пути доступа в память, имеющих разные приоритеты. Для оценки скорости его работы мы провели тесты в утилите Cachemem из пакета Aida64. Во всех случаях использовалась DDR3-1600 память с задержками 9-9-9-27-1T.



Здесь улучшений нет вообще. То, что с памятью теперь работают не только процессорные, но и графические ядра, потребовало реализации в контроллере памяти дополнительного арбитража. А это повлекло за собой снижение практической скорости работы вычислительных ядер с памятью, ведь x86-ядра с точки зрения контроллера имеют теперь не самый высокий приоритет. Также замедлился и L2-кэш, что, впрочем, объясняется и компенсируется ростом его ёмкости.

Производительность Llano в системе с дискретной графикой

При установке в систему, построенную на базе процессора Llano, мощной графической карты встроенное в APU видеоядро Radeon HD 6550D целесообразно отключить, так как использование режима Dual Graphics приведёт лишь к снижению производительности. В этом разделе мы посмотрим на то, как себя проявит система Lynx при работе в нашей стандартной тестовой конфигурации - с видеокартой AMD Radeon HD 6970.

Общая производительность

Для оценки производительности процессоров в общеупотребительных задачах мы традиционно используем тест Bapco SYSmark, моделирующий работу пользователя в распространённых офисных программах и приложениях для создания и обработки цифрового контента. Идея теста очень проста: он выдаёт единственную метрику, характеризующую средневзвешенную скорость компьютера.

Не так давно компания Bapco обновила свой тест, выпустив новую версию SYSmark 2012, включающий новые версии распространённых приложений и ещё более приближенные к действительности сценарии работы. К сожалению, AMD не устроили результаты, показываемые её процессорами в SYSmark 2012, и компания инициировала скандал, направленный на подрыв доверия к SYSmark. Но аргументы AMD нас не убедили. Её главной претензией стало то, что SYSmark 2012 не включает приложения, ускоряемые графическими ядрами APU. Однако не стоит забывать, что таких приложений не так много, и их распространение нельзя назвать повсеместным. Более того, при тестировании систем, использующих внешние графические карты, потоковые процессоры графического ядра APU оказываются недоступны для использования.

Иными словами, мы не стали отворачиваться от SYSmark 2012 и пока продолжим пользоваться этим тестом для оценки производительности. Тем более что список приложений, используемых в тесте, кажется нам вполне актуальным для того, чтобы основываясь на скорости системы в них выдавать заключение об общей производительности системы. В частности, SYSmark 2012 включает: ABBYY FineReader pro 10.0, Adobe Acrobat Pro 9, Adobe After Effects CS5, Adobe Dreamweaver CS5, Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Flash player 10.1, AutoDesk 3DS Max 2011, AutoDesk AutoCAD 2011, Google Sketchup Pro 8, Microsoft Internet Explorer 9, Microsoft Office 2010, Mozilla Firefox Installer, Mozilla Firefox 3.6.8 и Winzip Pro 14.5.



То, что результаты в SYSmark не нравятся AMD - вполне логично. Отставание A8-3800 от процессора Core i3-2100 составляет 33 %, однако такой результат вряд ли можно назвать нелогичным. Да, A8-3800 - четырёхъядерный процессор, а в Core i3-2100 всего лишь два ядра. Но интеловский продукт поддерживает Hyper-Threading, имеет более прогрессивную микроархитектуру и работает на частоте, превышающей частоту A8-3800 на 30 %.

Более того, из-за своей низкой тактовой частоты A8-3800 отстаёт и от Pentium G850, и даже от своего предшественника Athlon II X4 630. К сожалению, это большая проблема новинки, и в её решении не помогает даже имеющаяся технология Turbo Core. Снабдив Llano мощным графическим ядром и стараясь после этого уменьшить тепловыделение до приемлемых величин, AMD пришлось пожертвовать традиционной x86-производительностью. Поэтому в привычных применениях, не адаптированных под концепцию AMD Fusion, Llano явно не блещет, выступая на уровне бюджетных процессоров.

Более глубокое понимание результатов SYSmark 2012 способно дать знакомство с оценками производительности, получаемое в различных сценариях использования системы.

Сценарий Office Productivity моделирует типичную офисную работу: подготовку текстов, обработку электронных таблиц, работу с электронной почтой и посещение Интернет-сайтов. Сценарий задействует следующий набор приложений: ABBYY FineReader Pro 10.0, Adobe Acrobat Pro 9, Adobe Flash Player 10.1, Microsoft Excel 2010, Microsoft Internet Explorer 9, Microsoft Outlook 2010, Microsoft PowerPoint 2010, Microsoft Word 2010 и WinZip Pro 14.5.



В сценарии Media Creation моделируется создание рекламного ролика с использованием предварительно отснятых цифровых изображений и видео. Для этой цели применяются популярные пакеты компании Adobe: Photoshop CS5 Extended, Premiere Pro CS5 и After Effects CS5.



Web Development - сценарий, в рамках которого моделируется создание web-сайта. Используются приложения: Adobe Photoshop CS5 Extended, Adobe Premiere Pro CS5, Adobe Dreamweaver CS5, Mozilla Firefox 3.6.8 и Microsoft Internet Explorer 9.



Сценарий Data/Financial Analysis посвящён статистическому анализу и прогнозированию рыночных тенденций, которые выполняются в Microsoft Excel 2010.



Сценарий 3D Modeling всецело посвящён созданию трёхмерных объектов и рендерингу статичных и динамических сцен с использованием Adobe Photoshop CS5 Extended, Autodesk 3ds Max 2011, Autodesk AutoCAD 2011 и Google SketchUp Pro 8.



В последнем сценарии, System Management, выполняется создание бэкапов и установка программного обеспечения и апдейтов. Здесь задействуются несколько различных версий Mozilla Firefox Installer и WinZip Pro 14.5.



По итогам следует отметить, что сравнительно неплохой результат процессору A8-3800 удаётся продемонстрировать только в тесте 3D Modeling, где четыре полноценных x86-ядра являются действительно значимым аргументом в борьбе против двухъядерных Sandy Bridge. Однако заметьте, новый процессор A8-3800 всегда оказывается хуже одного из самых медленных представителей серии Athlon II X4. Так что если подходить к Llano как к традиционному процессору, а не как к APU, назвать его шагом вперёд совершенно невозможно.

Игровая производительность

Как известно, производительность платформ, оснащенных высокопроизводительными процессорами, в подавляющем большинстве современных игр определяется мощностью графической подсистемы. Именно поэтому при тестировании процессоров мы стараемся проводить испытания так, чтобы по возможности снять нагрузку с видеокарты: выбираются наиболее процессорозависимые игры, а тесты проводятся без включения сглаживания и с установкой далеко не самых высоких разрешений. То есть, полученные результаты дают возможность оценить не столько уровень fps, достижимый в системах с современными видеокартами, сколько то, насколько хорошо проявляют себя процессоры с игровой нагрузкой в принципе. Следовательно, основываясь на приведённых результатах, вполне можно строить догадки о том, как будут вести себя процессоры и в будущем, когда на рынке появятся более быстрые варианты графических ускорителей.


















Играм приходится по вкусу вместительная кэш-память второго уровня процессора A8-3800. Поэтому, несмотря на более низкую тактовую частоту, он выступает с тем же результатом, что и 2.8-гигагерцовый Athlon II X4 630. Впрочем, вряд ли это можно назвать хорошим результатом, ведь даже двухъядерные Sandy Bridge без Hyper-Threading показывают более высокую производительность почти во всех играх.

Архивация и шифрование

Для измерения быстродействия процессоров при компрессии информации мы пользуемся архиватором WinRAR , при помощи которого с максимальной степенью сжатия архивируем папку с различными файлами общим объёмом 1.4 Гбайт.



Алгоритмы архивации требуют активной работы с данными, поэтому превосходство A8-3800 над Athlon II X4 630 объяснимо - Llano имеет более вместительную кэш-память второго уровня. Но это не спасает новинку от разгрома со стороны недорогих LGA1155-процессоров, результат которых в тесте WinRAR лучше почти на 30 %.

Производительность процессоров при шифровании измеряется встроенным тестом популярной криптографической утилиты TrueCrypt . Следует отметить, что она не только способна эффективно загружать работой любое количество ядер, но и поддерживает новый специализированный набор инструкций AES.



Двухъядерные Sandy Bridge не всегда опережают четырёхъядерные процессоры AMD. Обратная ситуация - на диаграмме. При шифровании данных A8-3800 работает существенно быстрее Core i3-2100, который по странному решению Intel лишён поддержки криптографических инструкций. Однако до Athlon II X4 630 новинке всё-таки далеко - сказывается низкая тактовая частота.

Редактирование изображений

Измерение производительности в Adobe Photoshop мы проводим с использованием собственного теста, представляющего собой творчески переработанный Retouch Artists Photoshop Speed Test , включающий типичную обработку четырёх 10-мегапиксельных изображений, сделанных цифровой камерой.



Adobe Photoshop никогда не благоволил к процессорам AMD. Теперь же ситуация усугубилась до абсурда. Core i3-2100, который стоит примерно столько же, как и AMD A8-3800, обгоняет этот процессор почти на 70 %. AMD давно нуждается в кардинальном обновлении микроархитектуры и, хочется надеяться, что с выходом Bulldozer таких позорных результатов мы больше не увидим.

Также нами был проведено тестирование и в программе Adobe Photoshop Lightroom 3. Тестовый сценарий включает пост-обработку и экспорт в JPEG ста 12-мегапиксельных изображений в RAW формате.



Пакетная обработка фотографий в Lightroom хорошо оптимизирована под многоядерные архитектуры. Поэтому тут, в отличие от Phоtoshop, результаты A8-3800 выглядят вполне приемлемо. Особенно приятно видеть, что Llano обгоняет Athlon II X4 630, так что в ряде случаев ядра Husky могут обеспечить видимый прирост скорости по сравнению с процессорами предыдущего поколения.

Перекодирование аудио и видео

При тестировании скорости перекодирования аудио используется утилита Apple iTunes , при помощи которой осуществляется преобразование содержимого CD-диска в AAC-формат. Заметим, что характерной особенностью этой программы является способность использования лишь пары процессорных ядер.



Единственное, на что может опираться процессор AMD в соперничестве с Core i3-2100, это - на четыре полноценных x86 ядра. В том же случае, если приложение не может их задействовать в полной мере, результат предрешён. Поэтому столь медленному выступлению A8-3800 в iTunes удивляться не приходится.

Для измерения скорости перекодирования видео в формат H.264 используется x264 HD тест , основанный на измерении времени обработки исходного видео в формате MPEG-2, записанного в разрешении 720p с потоком 4 Мбит/сек. Следует отметить, что результаты этого теста имеют огромное практическое значение, так как используемый в нём кодек x264 лежит в основе многочисленных популярных утилит для перекодирования, например, HandBrake, MeGUI, VirtualDub и проч.



Кодек x264 неплохо работает на процессорах AMD, а кроме того, может эффективно задействовать все процессорные ядра. Поэтому в данном тесте A8-3800 превосходит и Pentium G850, и Core i3-2100. Впрочем, от своего собрата, Athlon II X4 630, он отстаёт из-за своей главной проблемы - невысокой тактовой частоты.

Производительность в Adobe Premiere Pro тестируется измерением времени рендеринга в формат H.264 Blu-Ray проекта, содержащего HDV 1080p25 видеоряд с наложением различных эффектов.



Неплохо показывает себя A8-3800 и в Premiere Pro CS5. В задачах обработки видео четыре медленных ядра Husky превосходят два быстрых ядра Sandy Bridge, и картина в целом не сильно-то и отличается от того, что мы уже видели на прошлой диаграмме.

В число тестов, которыми мы измеряем скорость перекодирования видеоконтента, была добавлена утилита Cyberlink MediaEspresso 6.5 . Она предназначается для преобразования видео из одного формата в другой, а интересна для нас тем, что может вовлекать в процесс транскодирования мощности графического ускорителя. В качестве тестового задания выполнялось перекодирование 10-минутного H.264 1080p видеоклипа в формат, пригодный для воспроизведения на iPhone 4 (H.264, 1280x720, 4Mbps). Для ускорения обработки во всех случаях задействовалась поддерживаемая видеокартой Radeon HD 6970 технология ATI Stream.



Третье приложение для обработки HD-видео, а результат всё тот же. Быстродействие A8-3800 находится в промежутке между Core i3-2100 и Pentium G850.

Финальный рендеринг

Тестирование скорости финального рендеринга в Maxon Cinema 4D выполняется путём использования специализированного теста Cinebench .



Рендеринг в чём-то сродни перекодированию видео. И та, и другая задача прекрасно масштабируется с увеличением количества доступных процессорных ядер. Поэтому результаты вполне ожидаемы. A8-3800 превосходит двухъядерный Pentium G850, но уступает двухъядерному Core i3-2100, который дополнительно усилен поддержкой технологии Hyper-Threading.

Производительность рендеринга в Autodesk 3ds max 2011 с использованием как Scanline, так и Mental Ray, мы измеряем, прибегая к услугам специализированного теста SPECapc .



Во всех приложениях, эффективно задействующих многопоточность, новый A8-3800 демонстрирует примерно одинаковое быстродействие. Можно сказать, что в таких случаях четырёхъядерным процессорам AMD удаётся показать приемлемое для этой ценовой категории быстродействие, однако в ней они соревнуются с двухъядерными Sandy Bridge. Поэтому, если речь заходит о скорости работы в задачах, использующих многоядерность не столь хорошо, A8-3800 сразу превращается в аутсайдера. Отдельное разочарование, связанное с Llano - это его очень низкая тактовая частота. Из-за этого процессор A8 отстаёт от Athlon II X4, так как сделанные в нём микроархитектурные улучшения дают микроскопический эффект.

Иными словами, процессоры Llano - это плохой вариант для системы с внешней графической картой. Четырёхъядерные Socket AM3-процессоры прошлого поколения, не говоря уже о предложениях конкурента, могут предложить куда более высокое быстродействие.

Энергопотребление

С производительностью вычислительных ядер у Llano революции не получилось, посмотрим, что стало с энергопотреблением. Посмотреть на эту характеристику особенно любопытно, так как в наших руках оказался 65-ваттный A8-3800, который по идее должен быть сопоставим по энергетическим и тепловым характеристикам с Core i3-2100, TDP которого равен тем же 65 Вт.

На следующих ниже графиках приводится полное потребление систем (без монитора), измеренное «после» блока питания и представляющее собой сумму энергопотребления всех задействованных в системе компонентов. КПД же самого блока питания в данном случае не учитывается. Во время измерений нагрузка на процессоры создавалась 64-битной версией утилиты LinX 0.6.4. Кроме того, для правильной оценки энергопотребления в простое мы активировали все имеющиеся энергосберегающие технологии: C1E, AMD Cool"n"Quiet и Enhanced Intel SpeedStep.



В состоянии простоя результат, показываемый A8-3800, выглядит очень неплохо. Этот процессор среди всех участников тестирования имеет самое большое число транзисторов, но проигрывает по экономичности только лишь Athlon II X4. Похоже, что внедрённое AMD отключение неиспользуемых блоков процессора от линий питания действительно работает.



Ещё более впечатляюще выглядит потребление, если вычислительная нагрузка ложится только на одно ядро. Тут система на базе A8-3800 может похвастать минимальным уровнем потребления.



При максимальной загрузке процессорных ядер работой платформа Lynx с процессором A8-3800 потребляет больше конкурирующих систем. Но, тем не менее, мы видим реальное сокращение энергетических аппетитов по сравнению с процессорами AMD прошлого поколения. И это весьма отрадный факт, открывающий Llano дорогу не только в экономичные системы, но и в мобильные компьютеры.

Производительность интегрированного графического ядра

При использовании в системе со внешней графикой результаты Llano оптимизма не вселяют. И дело даже не в том, что A8-3800 проигрывает Core i3-2100 в большинстве случаев. Главное разочарование заключается в том, что Llano оказался медленнее Athlon II X4.

Однако это не диагноз. Всё-таки Llano - не обычный процессор, а APU, который помимо традиционных вычислительных ядер включает и графическое ядро. Очевидно, что отключение этого ядра делает Llano малоинтересным предложением, но ведь существует и другая модель его использования - с задействованием интегрированной графики. Именно исследованию этой модели и будет посвящена вторая часть нашего тестирования, в которой мы посмотрим на графическую производительность APU в игровых тестах и приложениях, знакомых с концепцией Fusion.

Для получения полного представления о производительности графической части Llano производительность системы на базе A8-3800, использующей встроенное графическое ядро Radeon HD 6550D, сравнивалась со скоростью этой же платформы, но снабжённой различными внешними графическими картами нижнего ценового диапазона: Radeon HD 5570, Radeon HD 6450 и Radeon HD 6570. Кроме того, в тестах приняли участие системы, использующие интегрированную графику, но построенные на интеловских процессорах Core i3-2100 и Core i3-2105. Эти CPU аналогичны по характеристикам, но оборудованы разными версиями графики - Intel HD Graphics 2000 и Intel HD Graphics 3000. И в дополнение к перечисленному, мы заодно протестировали работу технологии AMD Dual Graphics, объединив в CrossFire-массив встроенное в A8-3800 графическое ядро с видеокартой Radeon HD 6570 и получив в итоге комбайн Radeon HD 6630D2.

Тесты в игровых приложениях выполнялись в двух режимах: в разрешении 1280x800 при установке низкого качества графики и в разрешении 1680x1050 при установке среднего уровня качества. Если в этих режимах A8-3800 показывал хороший уровень производительности, тестирование проводилось и в разрешении 1920x1080 с установкой высокого качества изображения.

3DMark Vantage









Популярный среди геймеров тест сразу же расставляет всё по своим местам. Если в тестах с дискретной графикой A8-3800 и смотрелся неубедительно, то встроенное в него графическое ядро Radeon HD 6550D полностью перечёркивает первое впечатление. Интегрированная система на базе Llano существенно опережает интеловские графические ядра, еще совсем недавно вызывавшие восторженные отзывы благодаря своей производительности, и вплотную приближается к результату 60-долларовой видеокарты Radeon HD 5570.

3DMark 11












Ещё одно преимущество Llano перед конкурирующими интегрированными решениями - это поддержка встроенной графикой Radeon HD 6550D DirectX 11. Поэтому, с прохождением теста 3DMark 11 у системы на базе A8-3800 не возникает никаких проблем, чего нельзя сказать об интеловских решениях.

Параллельно хочется обратить внимание ещё на одну особенность - результат процессорного теста A8-3800 при использовании внешней графики оказывается выше, чем в случае использования встроенного GPU. Разгадка этого феномена кроется в реализации технологии Turbo Core. Активизация интегрированного Radeon HD 6550D уменьшает «тепловой» бюджет, отводимый на вычислительные x86-ядра, в результате чего турбо-режим включается реже, чем когда встроенный GPU полностью неактивен.

Alien vs Predator (2010)






Ещё одна DirectX 11 игра, не работающая на интеловских интегрированных системах. Зато A8-3800 смотрится очень неплохо, серьёзно превосходя Radeon HD 6450. Заметьте, скорость встроенного ядра Radeon HD 6550D близка к результатам внешнего прообраза этого ядра - Radeon HD 5570. Однако отсутствие независимой видеопамяти всё-таки сказывается на производительности и о паритете между Sumo и Redwood речь не идёт.

Неплохо работает и конфигурация Dual Graphics. Этой технологии удаётся бесплатно поднять производительность видеокарты Radeon HD 6570 почти на 50 %.

Dirt 3









Эта игра поддерживает DirectX 11, но на интеловской графике по понятным причинам работает через DirectX 9. Впрочем, это совершенно не спасает даже старшую версию Intel HD Graphics 3000 от разгрома. Предлагаемое AMD графическое ядро процессора A8-3800 быстрее примерно вдвое.

Процессоры Llano устанавливают для интегрированных графических решений новые стандарты производительности. Весьма показательно, что эта красочная современная игра может приемлемо работать на платформе Lynx даже в Full HD-разрешении и при высоком качестве изображения.

Far Cry 2









A8-3800 хорошо справляется с графической нагрузкой в Far Cry 2. Тем не менее, данная игра весьма требовательна к пропускной способности видеопамяти, поэтому отставание встроенного видеоядра Radeon HD 6550D от его дискретного аналога достигает 20 %.

Left 4 Dead 2









Эта достаточно старая игра поддерживает только DirectX 9, а потому конфигурация Dual Graphics тут не работает. Выражается это в том, что мы получаем даже более низкую производительность, чем при использовании одиночной внешней видеокарты.

Lost Planet 2






Игра поддерживает DirectX 11, но интеловская графика работает через DirectX 9. Возможно, поэтому в разрешении 1680х1050 система с Core i3-2105 умудряется выдать большее число fps, чем платформа с процессором A8-3800.

Mafia 2






Mafia 2 нельзя назвать старой игрой, однако она использует лишь DirectX 9, что тут же становится понятно по низкому результату асимметричной CrossFire-конфигурации. В остальном же интегрированная система AMD нареканий не вызывает. Как и положено, она более чем вдвое превосходит систему с процессором Core i3-2105 и графическим ядром Intel HD Graphics 3000 и почти «дотягивает» до результата видеокарты Radeon HD 5570.

Metro 2033






Metro 2033 поддерживает несколько путей рендеринга, мы в тестах использовали DirectX 10. В этом случае Intel HD Graphics и Radeon HD 6550D находятся в равных условиях, а технология Dual Graphics должна нормально работать. Но что-то в драйвере AMD не заладилось, и Dual Graphics дала лишь минимальное преимущество в разрешении 1680х1050. Впрочем, система с одним APU A8-3800 работает замечательно: Intel HD Graphics 3000 остаётся далеко позади.

Starcraft 2






Уникальность Starcraft 2 заключается в том, что эта игра создаёт очень серьёзную нагрузку на процессор. Поэтому тут всё выглядит совсем не так, как в других играх. Более высокая вычислительная производительность процессоров Sandy Bridge позволяет системам на их основе опередить интегрированную платформу на базе A8-3800 в минимальном разрешении. Впрочем, при переключении на среднее качество картинки и 1600х1050 результаты Llano возвращаются в привычное русло. Но вот у Dual Graphics в Starcraft 2 вновь проблемы. Как видим, эта технология к ускорению графики подходит очень выборочно, и данная игра не попала в число «удачных» вариантов.

Tom Clancy"s H.A.W.X. 2









Соотношение результатов между Intel HD Graphics 3000 и Radeon HD 6550D совершенно привычно. Времена, когда интеловское графическое ядро казалось превосходным, закончились, и теперь лидерство в сфере интегрированного видео перехватывает AMD. Однако не всё хорошо и в «красном» лагере. Dual Graphics вновь не работает - и это, к сожалению, приходится констатировать слишком часто на протяжении всего тестирования. Так что хотя эта технология выглядит многообещающе, в реальности работает она не очень гладко.

Приложения GPGPU

Тестируя возможности нового APU компании AMD, мы не могли обойти стороной те приложения, которые используют возможности графического движка не для вывода 3D-графики, а для вычислений. Тем более что в этом и заключается суть концепции Fusion - потоковые процессоры GPU должны быть вовлечены в вычислительную работу и должны вносить свой вклад в увеличение общего быстродействия APU.

Для начала мы вновь воспользовались синтетическими тестами из SiSoftware Sandra 2011. Этот пакет предлагает в том числе и измерение вычислительной производительности шейдеров, используя программные интерфейсы OpenCL и DirectCompute. Встроенная в Llano графика поддерживает оба интерфейса, и с этим нет никаких проблем. Что касается процессоров Sandy Bridge, то Intel не даёт доступа к вычислительным ресурсам графического ядра, поэтому в интеловских системах соответствующие вычисления выполняются x86-ядрами.






Вот именно ради таких результатов AMD и ввязалась в продвижение концепции Fusion. Графическое ядро прекрасно приспособлено для параллельных вычислений, и потому его включение в обработку данных может стать хорошим подходом к повышению производительности.

Но то был синтетический тест, целенаправленно нагружающий потоковые процессоры. Гораздо же интереснее посмотреть на то, какие результаты может дать использование APU в реальных приложениях. Маркетинговый отдел AMD непрерывно возвещает о том, что число адаптированных под APU приложений неуклонно растёт. Что это за приложения - можно посмотреть в специальном разделе корпоративного сайта. Честно говоря, список этот нельзя назвать особенно впечатляющим, но среди перечисленных программ есть несколько интересных наименований. Их мы и выбрали для ознакомления с тем, насколько APU работает лучше традиционных CPU в оптимизированной среде.

В первую очередь - тест на скорость транскодирования HD-видео, выполняемый в Cyberlink MediaEspresso 6.5 . Эта утилита может использовать движок UVD3 для декодирования и потоковые процессоры для ускорения кодирования видео. Вместе с этим на интеловских процессорах она способна пользоваться технологией Quick Sync.



Хорошая новость заключается в том, что встроенное в A8-3800 графическое ядро Radeon HD 6550D может стать хорошим подспорьем при транскодировании видео. Включение его мощностей в дополнение к вычислительным x86-ядрам уменьшает время перекодирования почти вдвое. Однако есть и плохая новость. Производительность A8-3800 в режиме с использованием потоковых процессоров графического ядра дотягивает лишь до скорости Core i3-2100 без использования Quick Sync. Включение же интеловского аппаратного кодера приводит к тому, что APU компании AMD с Core i3-2100 конкурировать не может.

Среди приложений, оптимизированных для APU, AMD называет Microsoft Internet Explorer 9. Он действительно может использовать силы графических ядер для отображения веб-страниц и исполнения JavaScript и HTML5 кода. Однако что на счёт реальной производительности? Для получения её численных характеристик мы воспользовались двумя специализированными тестами. Futuremark Peacekeeper , который ориентирован в первую очередь на тестировании скорости при работе с JavaScript, и новым HTML5-тестом Stimulant WebVizBench .






При отображении HTML5-страниц производительность A8-3800 оказывается в промежутке между Core i3-2100 и Core i3-2105. И это можно назвать неплохим результатом на фоне того, что в JavaScript-тесте предложение AMD с треском проигрывает даже Core i3-2100.

Развивая тему об оптимизации APU для интернет предложений, AMD сообщает нам и о приспособленности для Fusion последних версий Flash-плеера. То, что он умеет использовать движок UVD3 для ускорения воспроизведения видео, мы знаем уже давно. Но как обстоит дело с другими приложениями? Ответить на этот вопрос нам поможет многопользовательская онлайновая танковая аркада Tanki Online , построенная на одном из самых продвинутых 3D Flash-движков Alternativa3D. Тестирование проводилось с использованием Adobe Flash Player 10.3.181.34.



Мощности графического процессора тут действительно нагружаются даже несмотря на то, что десятая версия Flash не использует видеокарту для отображения 3D-графики. Однако APU компании AMD это помогает не сильно. Процессоры Core i3-2100 и Core i3-2105 обгоняют A8-3800 примерно на 30 %.

Ещё одно приложение, в котором, по мнению AMD, эффективно используются мощности графического ядра - это Windows Live Movie Maker 2011 . Мы провели тест по созданию в нём небольшого HD-видеоролика - компиляции из фрагментов видео, изображений и музыкального ряда.



Графическое ядро A8-3800 тут действительно нагружается, но та же самая задача решается на процессорах Core i3 куда быстрее, так как они располагают весьма полезным при работе с видео специализированным аппаратным кодером Quick Sync.

И, завершая поиски приложений, в которых гибридный процессор Llano может выступить во всей своей красе, мы протестировали скорость в ещё одной утилите - ArcSoft Panorama Maker 5 Pro . Она предназначена для склейки панорам из нескольких фотографий. Именно такой и была наша тестовая задача, на примере которой мы измерили производительность.



APU тут тоже поддерживается в полной мере, нагрузка на графические ядра видна, но Core i3, вновь показывает существенно лучший результат, работая исключительно своими x86-ресурсами.

Таким образом, хотя нам удалось найти немало реальных приложений, которые действительно используют APU «по полной программе», в реальности это не приносит желаемого эффекта. Серьёзного скачка в быстродействии не наблюдается, и интеловские CPU семейства Core i3, решающие аналогичные задачи одними лишь x86-ядрами, в большинстве случаев остаются недосягаемы для процессора AMD Llano.

Тем не менее, отрицать заложенный в Llano потенциал не следует. На примере синтетических тестов мы видим, что вычислительная мощность графического ядра Radeon HD 6550D весьма велика. Так что будем надеяться, что появление программ, которые смогут получить серьёзный выигрыш от концепции Fusion, ещё впереди. А на сегодня единственная реальная задача, в которой Llano наверняка окажется сильно быстрее Core i3 благодаря потоковым процессорам графического ядра, это - подбор (взлом) паролей по известной хеш-функции.

Энергопотребление

Энергопотребление Llano в системе со внешней графической картой уже было измерено, однако теперь подошло время узнать, как покажет себя с этой точки зрения интегрированная система на базе A8-3800. Условия и методология измерений остались теми же.



В состоянии бездействия A8-3800 очень экономичен. Базирующаяся на нём система потребляет существенно меньше, чем система с Core i3 в основе.



При нагрузке на x86-ядра картина меняется. Core i3 способен в этом случае похвастать не только более высокой производительностью, но и меньшим энергопотреблением. В защиту же A8-3800 следует сказать, что система на его основе выглядит тоже неплохо, её энергетические аппетиты весьма умеренны.



Графическая нагрузка приводит к тому, что разница между потреблением процессоров Core i3 и A8-3800 становится сильно заметна, причём явно не в пользу новинки. Но не забывайте, производительность графического ядра Radeon HD 6550D примерно в два раза выше быстродействия Intel HD Graphics 3000.



Вместе с этим A8-3800 выглядит как довольно неплохой вариант для медиацентра. При воспроизведении видеоконтента его потребление не хуже энергопотребления процессоров Core i3. Всё это говорит о том, что применённые в Llano энергосберегающие технологии очень эффективны при небольшой частичной нагрузке.

Разгон

Платформа Lynx не предназначена для оверклокеров - это AMD даёт понять сразу. Среди процессоров Llano нет и не будет модификаций Black Edition c разблокированным множителем. Все процессоры этого семейства имеют жёстко зафиксированные коэффициенты умножения для формирования частоты процессорных ядер и для частоты графического ядра. Не работает с Socket FM1-процессорами и утилита AMD Overdrive.

Однако полностью возможностей разгона это не отменяет. Socket FM1-материнские платы не лишены инструментов для изменения частоты базового тактового генератора, и этим свойством можно пользоваться для увеличения тактовой частоты процессора. Но надо иметь в виду, что этот тактовый генератор в равной мере влияет на частоты всех составляющих системы. Поэтому, увеличение базовой частоты выше штатных 100 МГц приводит к одновременному и пропорциональному разгону процессора, графического ядра, частоты памяти и частот внешних интерфейсов системы. Единственный же подверженный изменению в Llano множитель - это тот, что отвечает за частоту работы памяти, он может принимать значения из диапазона 10,66, 13,33, 16 и 18,66.

Именно здесь и скрывается основная проблема. Увеличение частоты тактового генератора достаточно быстро натыкается на проблемы с детектированием и работой SATA-или USB- устройств. И именно этот фактор, а не возможности процессора, ограничивают разгон. Судя по имеющимся данным, максимальная частота базового тактового генератора, при которой можно надеяться на стабильную работу системы, не превосходит 120 МГц. Однако после прохождения 133-мегагерцового рубежа большинство материнских плат переключают делители для формирования частот внешних интерфейсов, поэтому в промежутке 133-150 МГц может существовать ещё один «островок работоспособности». При этом, подмножество частот тактового генератора, при которых система нормально функционирует при разгоне, может зависеть как от набора дополнительных контроллеров на материнской плате, так и от состава дисковой подсистемы и, например, с некоторыми SSD-носителями оно способно оказаться существенно уже.

Мы попробовали разогнать имеющийся в нашей лаборатории процессор A8-3800, используя материнскую плату Gigabyte GA-A75-D3H. Максимальная частота тактового генератора, при которой система сохраняла способность к стабильному функционированию, в нашем случае составила 146 МГц.

Таким образом, процессор разогнался до частоты 3,5 ГГц, а частота графического ядра пропорционально возросла со штатных 600 МГц до 876 МГц. Что касается памяти, то для неё удалось задействовать множитель 13,33, что позволило тактовать её в режиме DDR3-1946. Устойчивая работа системы в таком состоянии была подкреплена увеличением напряжения на процессоре на 0,175 В.



Описанный разгон вылился в достаточно существенный прирост быстродействия. Если опираться на результаты 3DMark 11, то можно констатировать, что скорость работы встроенной в A8-3800 графики доросла до уровня Radeon HD 6570, а вычислительная производительность увеличилась примерно на 40 %.

С разгоном Socket FM1 связан и курьёзный момент. Как оказалось, BIOS некоторых материнских плат имеет настройку для повышения множителей процессоров и независимую настройку для частоты графического ядра. Опции эти на самом деле не работают, но некоторые диагностические утилиты, например популярная программа CPU-Z, берут значение множителя напрямую из BIOS. Поэтому системы на базе Llano позволяют легко получать сколь угодно впечатляющие скриншоты про покорение этими процессорами самых невероятных рубежей. Однако вопреки показаниям CPU-Z реальный множитель у Llano не меняется, а действительная частота процессора и графического ядра зависит только от частоты базового тактового генератора.

Выводы

В первую очередь следует напомнить, что Llano - это не столько новые процессоры для десктопов, сколько решение, позволяющее, наконец, AMD уверенно заявить о себе на рынке мобильных компьютеров. Однако сегодня нам предъявили именно вариант для настольных систем, а вот с этой позиции Llano оставляет двойственное впечатление.

Если посмотреть на него просто как новый процессорный продукт AMD, приходящий на смену Phenom II и Athlon II, то энтузиазма он совершенно не вызывает. Конечно, в приложениях, хорошо оптимизированных под многопоточность, четыре вычислительных ядра процессоров A8 могут вывести их вперёд Core i3, однако утешение это слабое. Дело в том, что в системах с дискретной графикой Llano работает определённо хуже своих предшественников серии Athlon II X4. Процессоры Llano продолжают использовать x86-ядра с микроархитектурой K10 образца 2007 года, и сделанные в них улучшения - это лишь «косметический ремонт», в то время как давно назрела необходимость тотальной перестройки. Более того, в погоне за приемлемыми значениями TDP AMD пришлось дополнительно снижать тактовые частоты, а призванная компенсировать этот шаг технология Turbo Core со своей задачей не справляется. Нет возможности поправить эту ситуацию и через оверклокинг. Разгоняются Llano не лучшим образом, да и само строение платформы Lynx разгону не потворствует.

К счастью, Llano - это не традиционный CPU, а APU, в состав которого входят не только х86-ядра, но и быстродействующее графическое ядро. И благодаря этой особенности на Llano можно посмотреть совсем под другим углом. Встроенная в этот процессор графика - не просто самое быстрое на рынке интегрированное решение. Она превосходит Intel HD Graphics 3000 примерно в два раза и способна показать 3D-производительность на уровне видеокарт стоимостью 50-60 долларов. При этом Llano может похвастать и неплохой энергоэффективностью (в особенности это касается моделей с TDP 65 Вт), что делает интегрированные системы на его основе отличным вариантом для домашних игровых компьютеров начального уровня или для производительных HTPC.

Так что в конечном итоге вопрос о целесообразности использования Llano в той или иной системе будет решаться исходя из того, что вы хотите получить в итоге. Если на первом месте стоит игровая производительность, но вы не готовы тратиться на видеокарту среднего или верхнего уровня, то вряд ли можно найти вариант лучше процессоров серии AMD A8. Тем более, что существует по меньшей мере две возможности добиться дополнительного улучшения быстродействия графической части этого процессора с минимальными затратами. Во-первых, разгон, а, во-вторых, технология Dual Graphics, позволяющая объединить графику из APU с недорогой внешней видеокартой в асимметричный CrossFire-массив.

Однако если вам необходима платформа с высокой вычислительной мощностью, то тут Llano ничего хорошего предложить не может. И в этом случае переплачивать за встроенное в этот APU высококачественное графическое ядро нет никакого смысла. Несмотря на то, что концепция Fusion декларирует возможность использования потоковых процессоров из графического ядра APU для вычислений и ускорения работы общеупотребительных приложений, пока на практике это не работает или работает, но недостаточно хорошо.

Впрочем, этот вердикт не окончательный, идея APU в принципе жизнеспособна, и она ещё вполне может засиять с новой силой. Сейчас внедрение гибридных процессоров находится на начальном этапе, и через пару-тройку лет ситуация может измениться кардинально. Но тогда править бал будут уже APU будущих поколений, а Llano в этом эволюционном процессе отведено место локомотива, при поддержке которого концепция Fusion должна овладеть умами пользователей и разработчиков программного обеспечения.

Другие материалы по данной теме


На счету - каждый ватт: AMD E-350 против Intel Core i3-2100T
Обзор платформы AMD Brazos и процессора AMD E-350 (Zacate)
Обзор процессоров Pentium G850, Pentium G840 и Pentium G620

В июне 2011 г. компания AMD запустила первую линейку APU (ускоренных процессорных устройств) серии А на базе Llano, которая в одном кристалле объединила архитектуру K10 с ГПУ Radeon. Но, к сожалению тех, кто хотел бы воспользоваться новым продуктом, первый его запуск с компонентами, носящими кодовое название Husky, был нацелен на производителей ноутбуков и производителей ПК. Таким образом, каждый желающий создать собственный персональный компьютер на базе Llano, должен был ожидать своей очереди, чтобы получить доступ к новым С официальным запуском настольных версий APU серии A Llano под кодовым названием Lynx это ожидание закончилось.

AMD A8-3850: обзор архитектуры

Подобно маломощным ускоренным процессорам серии Е на базе Brazos, выпущенным AMD в феврале 2011 г., архитектура Lynx ознаменовала смену стратегического направления производителя в сторону более интегрированного подхода. Компания заявила, что A-серия представляет собой первую линейку процессоров, которая наряду с 4-ядерным ЦПУ предлагает встроенный графический чип в надежде, что рынок смирится с низкоэффективными гибридными чипами, которые окажутся в офисах и бюджетных ПК. AMD начала эту революцию выпуском 4-х APU, относящихся к сериям A8 и A6. Они отличались, как тактовой частотой, так и встроенными устройствами обработки графики. Пара ядер A8 имеет 400 потоковых процессоров графического чипа Radeon HD 6550D, а A6 - 320 в HD 6530D. При этом первый APU работает быстрее второго, поскольку обладает более высокой частотой ядра, равной 600 МГц против 443.

Линейка дополнительно подразделяется на модели с разной тактовой частотой. Два 4-ядерных ускоренных процессора верхнего ценового диапазона серий A8 и A6, APU AMD A8-3850 и A6-3650, используют тактовые частоты 2,9 и 2,6 ГГц соответственно (хотя эти значения снижаются в состоянии ожидания благодаря Cool"n"Quiet), и отличаются довольно внушительной потребляемой мощностью, равной 100 Вт.

Два младших представителя линейки, А6-3600 и А8-3800, также поддерживают технологию Turbo Core. Это означает, что их быстродействие динамически изменяется в зависимости от предъявляемых к ним требований. A8-3800 использует тактовую частоту 2,4 ГГц, повышая ее до 2,9 ГГц при включенном Turbo Core, а А6-3600 - на 2,1 ГГц, доводя их до 2,4. Оба эти гибридные процессорные устройства потребляют гораздо меньшую мощность - лишь 65 Вт.

Ядра, которые обеспечивают такую плавающую частоту, основаны на дизайне с довольно претензионным названием Stars. В действительности же это просто улучшенная 32-нанометровая версия 45-нм Phenom II. Это означает, что ЦПУ в чипе AMD по-прежнему базируется на устаревшей архитектуре K10, которая в прошлом плохо соперничала с Intel Core. Однако ускоренный процессор Lynx предлагает функцию, отличную от конкурирующих чипов Intel. Это скорость взаимодействия с оперативной памятью. Каждая из моделей серии A поддерживает DDR3, работающую на частоте до 1866 МГц, а не 1333 МГц, как того требуют бюджетные чипы Intel. Поскольку эта память распределена между центральным и графическим процессорными устройствами, она может обеспечить легкий прирост производительности графики благодаря использованию более быстрого ОЗУ.

Также архитектура Llano включает выделенный унифицированный видеодекодер UVD, который позволяет при воспроизведении видео без поддержки ускорения видео DirectX разгрузить ЦПУ и ГПУ.

В дополнение к выпуску A8 и A6 компания AMD предлагает пару чипсетов для материнских плат под названием A55 и A75. Каждый из них поддерживает RAID и жесткие диски размером более 2,2 ТБ, но чипсет премиум-класса A75 также позволяет иметь 4 порта USB 3 и 6 разъемов SATA, работающих со скоростью 6 Гбит/с.

В графической части APU 400 потоковых процессоров производят операции на частоте 600 МГц и разделены на 5 SIMD-блоков с общим регистром и блоком тесселяции, а также на 20 блоков обработки текстур и 8 ROP.

Особенности архитектуры

Процессор высокого класса AMD A8-3850 стоимостью 135 долларов США составляет прямую конкуренцию 2-ядерному i3-2100. Чип включает 4 ядра Star, которые работают с частотой 2,9 ГГц. Они выполнены по 32-нанометровой технологии, которая обеспечивает 6-процентное увеличение полезной площади кристалла по сравнению с 45-нм процессом предыдущего поколения Athlon II. Каждому ядру выделены 128 Кбайт кэша 1-го уровня и 1 МБ L2. Третий, более крупный уровень у APU отсутствует.

Под серию А специально создавался 905-контактный разъем FM1 AMD A8-3850, т. к. возникла необходимость вывода видео с процессора на разъемы DVI, VGA и HDMI материнской платы. Конечно, ни о какой обратной совместимости предыдущих моделей ЦПУ AMD и речи быть не может. Несмотря на изменение сокета спецификации отведения тепла не изменились. Все существующие кулеры должны по-прежнему оставаться совместимыми, так как они соответствуют расчетной тепловой мощности чипа.

Кроме того, под интегрированным тепловым рассеивателем находится процессор обработки графики Radeon HD 6550D, работающий при 600 МГц. Это выглядит довольно слабым по сравнению с 850 МГц, используемыми HD Graphics 2000 в i3-2100. Однако ГПУ AMD снабжено колоссальным количеством потоковых процессоров (400) и текстурных блоков (20) по сравнению с 6-ю небольшими исполнительными модулями у Intel. A8-3850 также превосходит i3-2100 с точки зрения возможностей, поскольку первый чип обеспечивает полную поддержку DirectX 11, тогда как второй совместим лишь с 10-й версией.

Характеристики AMD A8-3850 APU поддерживаются рядом уникальных функций, включая технологию Dual Graphics. Подобно технологии CrossFire для обеспечения дополнительной мощности она позволяет встроенному графическому процессору объединяться с другими совместимыми дискретными видеокартами компании-производителя. Данная функция активирована в БИОС ASRock по умолчанию, поэтому достаточно вставить видеокарту, и материнская карта с драйверами AMD A8-3850 сделает все остальное. Имеются и некоторые ограничения. Технология работает в играх, поддерживающих DirectX 11 и 10. С DX9 Dual Graphics функционирует, но в данном случае производительность не является оптимальной. С архитектурой Llano компания-производитель также впервые продемонстрировала асинхронный многопроцессорный рендеринг, который позволяет распределять различные рабочие нагрузки между центральным и графическим процессорами. Поддерживается совместимость только с низкопроизводительными ГПУ AMD, включая HD 6670 1 ГБ, HD 6570 1 ГБ, HD 6450 512 МБ и HD 6350 512 МБ.

Разгон AMD A8-3850

Как можно видеть, архитектура Lynx не нацелена на энтузиастов высокой производительности. В результате этого возможности разгона процессора AMD A8-3850 также ограничены. Например, пользователи обрадовались, узнав о том, что был скопирован дизайн встроенного генератора Intel. Это означает, что все тактовые частоты по всей плате связаны друг с другом. Как можно было видеть в системах Sandy Bridge, эта настройка, по сути, делает невозможным разгон через базовые частоты (или опорные, если говорить о APU Llano), так как их увеличение более чем на 5% может привести к нестабильности в подсистемах SATA и USB. Учитывая тот факт, что у процессоров серии A блокирован множитель ЦП, мало надежд на то, что скорость AMD A8-3850 превысит 2,9ГГц на основе 100-МГц опорных тактовых импульсов и множителя 29x.

Но пользователи были заинтригованы тем, что A75 Pro4, которую они использовали для тестирования, позволила увеличить множитель до 36х, что привело к общей частоте 3,6 ГГц. Однако, несмотря на сообщение CPU-Z о достижении вышеуказанного значения, фактически множитель не изменился. Результаты тестов были идентичны показателям производительности при 2,9 ГГц. Попытки разгона AMD A8-3850 оказались практически бесплодными, так как пользователям удалось добиться лишь увеличения на 5 МГц, что привело к росту частоты процессора до значения 3,4 ГГц, а ГПУ - до 630 МГц. Согласно производителю, это связано с тем, что некоторые из материнских плат имеют возможность блокировать SATA и USB, чтобы позволить больший разгон. Тот же источник утверждает, что в некоторых платах есть невидимые делители, которые включаются для SATA и USB на определенных опорных тактовых частотах. Это может означать, например, что 133 МГц приводят к стабильному разгону процессора AMD A8-3850, тогда как при 120 МГц этого добиться невозможно просто потому, что больший опорный такт инициирует использование более высокого делителя SATA/USB.

По отзывам пользователей, эта информация для разгона оказалась не очень полезной, так как материнская плата решительно отказывалась загружаться на любой опорной частоте выше 105 МГц.

Cinebench R11.5

Данный тест использует Maxon"s Cinema 4D для рендеринга очень сложной фотореалистичной сцены с отражениями, объемным светом и процедурными шейдерами, значительно нагружающими ЦПУ. Поскольку в нем задействованы объекты реального мира, которые встречаются в таких фильмах, как Spider-Man и Star Wars, то Cinebench R11.5 можно рассматривать как тест реального окружения. По отзывам пользователей, в нем процессор набрал 3,33 балла при 2,9 ГГц и 3,51 балл при 3,04 ГГц. Конкурент Core і3-2100 при этом набрал 3 балла.

WPrime

Это многопоточный тест математических вычислений с контринтуитивным использованием квадратных корней, а не простых чисел. В стандартном испытании используется набор из 32 млн чисел и вычисляются квадратные корни каждого из них с рекурсивным вызовом метода Ньютона в качестве оценочной функции. WPrime прекрасно масштабируется по нескольким ядрам центрального процессорного устройства и может загрузить их полностью на 100%. Итог вычислений выражается количеством времени, затраченным на нахождение квадратного корня всего набора из 32 млн чисел. Чем ниже балл, тем выше производительность. По отзывам пользователей, результат AMD A8-3850 - 14,443 c и 13,635 c (при 2,9 и 3,04 ГГц). Core і3-2100 считает дольше. На все вычисления процессор Intel затрачивает 18,090 с.

Left 4 Dead 2

По отзывам пользователей, запуск данной игры в разрешении 1280 x 720, 0х АА, 16х AF и высокими установками качества изображения позволяет добиться минимум 54 и в среднем 76 к/c при 2,9 ГГц тактовой частоты и соответственно 60 и 80 к/с при разгоне до 3,04 ГГц. Процессор Core і3-2100 обеспечивает частоту кадров 13 и 22 к/с.

Call of Duty: Black Ops

По отзывам пользователей, игра тестировалась с установкой максимальной детализации в игровом меню. Так как наибольшая частота кадров по умолчанию ограничена значением 91 к/с, то в файле конфигурации ее пришлось увеличить до 250 к/с. Запуск 90-секундного фрагмента многопользовательской игры, воспроизводимого через отличный встроенный плеер, с установками, аналогичными с предыдущим тестом, показал наименьшую скорость обновления экрана, равную 30 к/с, а ее среднее значение составило 54 к/с. Для разогнанного процессора данные показатели увеличились до 33 и 60 к/с соответственно. Конкурирующий процессор Intel Core продемонстрировал неприемлемые 11 и 20 к/с.

Потребляемая мощность

Для всех тестов производительности, которые проводили пользователи процессора, были отключены все энергосберегающие технологии, чтобы можно было получить адекватные результаты и представить наилучшие показатели работы, несмотря на то, что таким технологиям, как SpeedStep Intel, для запуска требуются микросекунды, что в некоторых случаях может сказаться. Однако для оценки характеристик процессора AMD A8-3850 в области энергопотребления весь функционал задействовался в полной мере, чтобы с помощью внешнего ваттметра можно было определить реальную потребляемую мощность, поэтому результаты представляют общую мощность системы, а не энергопотребление самого ЦП. Отдельный замер потребления любого отдельного компонента ПК практически невозможен.

По отзывам пользователей, в режиме ожидания, когда на экране ПК нет ничего, кроме рабочего стола Windows 7 с активированным Aero, общее потребление системы на базе AMD A8-3850 Quadcore составляет 47 Вт, а Intel Core і3-2100 - 40 Вт. Анализ энергоэффективности процессора, когда под нагрузкой находятся, как ЦПУ, так и ГПУ, для тестируемой модели дал результат 92 Вт. У конкурента данный показатель оказался значительно меньше - всего 66 Вт.

Анализ производительности

Для сравнения результатов тестирования AMD A8-3850 использовался процессор Core і3-2100, продававшийся по аналогичной цене, а также сравнимые материнские платы, выбранные таким образом, чтобы общая стоимость системы для двух испытательных стендов была примерно одинаковой. Проверка производительности для оцениваемой модели началась хорошо, так как ее оценка в Cinebench 11.5 (3,33) на 0,33 опередила конкурента Intel. Аналогичная ситуация возникла и в тесте WPrime 32M. Процессор А8-3850 со временем 14,443 с намного опередил конкурента, результат которого - 18,090 с. Причина этого заключается во вдвое большем количестве ядер. Именно в этих тестах дополнительные мощности дают максимальное преимущество.

Более жесткая проверка в форме обработки мультимедийных файлов пользуется преимуществом мультипроцессорных вычислений, но также вознаграждает процессоры, которые выполняют большее количество инструкций за такт. Чип і3-2100 доминирует именно в этой области, потому что архитектура Sandy Bridge способна обрабатывать гораздо больше данных, чем стареющая архитектура K10.

Тест на редактирование изображений оценил AMD A8-3850 2 90 GHz в 888, а i3-2100 - в 1331 баллов, что оказалось на 49% лучше. То же повторилось и в других тестах, при этом A8-3850 отстал на 28% в кодировании видео, которое обычно вознаграждает процессоры с дополнительными ядрами. Общая оценка A8-3850 составила 1059 баллов, что значительно отстает от 1476 очков у процессора Intel.

Однако основным преимуществом APU Llano, по отзывам пользователей, является его улучшенная производительность в 3D-играх. Может ли он стать основой для дешевого игрового ПК? Или же графические процессоры начального уровня обречены? Ответом на оба вопроса будет решительное «Да!».

При разрешении экрана 1280 x 720 точек с 0x AA процессор AMD A8-3850 APU в L4D2 обеспечивает минимальную частоту кадров, равную 54 к/с, со всеми настройками, установленными на высоком уровне. Это отличный результат, который означает, что теперь, наконец, появилась возможность построить систему домашнего кинотеатра, позволяющую играть в разрешении 720p без необходимости установки отдельной графической карты. Для сравнения, минимальная частота кадров процессора i3-2100 в 13 к/с при тех же настройках играть практически не позволяет. В игре L4D2 А8-3850 так же хорошо работает и при более высокой четкости изображения. При разрешении 1680 x 1050 пикселей APU обеспечивает минимальную частоту кадров 33 к/с, что позволяет комфортно играть даже во время нашествия зомби. Это делает систему на основе Llano действительно конкурентоспособной, если выбирать графически менее требовательные игры в стандартном разрешении дисплея диагональю Игра COD: Black Ops тоже демонстрирует приемлемые результаты в разрешении 1280 x 720 без AA, хотя с большим числом пикселей процессор справиться уже не в состоянии.

Более тонкая разница между чипами конкурирующих компаний прослеживается в качестве изображения при оценке производительности 3D. Графический процессор Intel i3-2100 в играх не справлялся с некоторыми мягкими тенями, которые можно увидеть в системе AMD, несмотря на то, что все настройки игры являются одинаковыми. Потеря этих теней сразу бросается в глаза, поскольку они добавляют глубину и реализм игровому окружению.

Скорость DRAM

Технические характеристики процессора AMD A8-3850 оценивались с использованием памяти DDR3 с рабочей частотой 1333 МГц. Благодаря этому сопоставление результатов становится справедливым. Тем не менее, интересно проверить, насколько увеличится производительность А8-3850 от использования более быстрой оперативной памяти. Тем более, что графический процессор разделяет ОЗУ вместе с центральным. Использование более быстрого запоминающего устройства должно быть сопоставимо с его разгоном в дискретной видеокарте.

Это и было подтверждено на практике. По отзывам пользователей, увеличение частоты DDR3 до 1,6 ГГц значительно улучшило производительность 3D. Минимальный фреймрейт при этом возрос на 6 к/с при разрешении 1680 x 1050 точек в L4D 2 и на 3 к/с в Black Ops, что немного повысило ее качество. Интересно, что увеличение частоты ОЗУ до 1600 МГц сказалось больше, чем скудный разгон процессора.

Заключение

Невозможно устоять от положительной характеристики AMD A8-3850, так как с его появлением наконец стала доступной полностью интегрированная графика, способная обеспечивать разумную производительность. APU доказал свою состоятельность в игровых тестах при низких и средних разрешениях, даже если все остальные настройки установлены на максимум. Это делает процессоры AMD серии A желанным приобретением для тех, кому нужен маломощный медиацентр или бюджетная игровая станция для сопряжения с монитором небольшого размера. Интересным решением является и ассиметричный CrossFire, который позволяет добиться более высокой производительности на недорогом гибридном процессоре с дискретной видеокартой базового уровня, хотя ограничение только играми DX10/11 является значительным сдерживающим фактором. Похоже, что A8-3850 сделал большую часть базового сегмента рынка графических процессоров избыточной. И это результат, который пользователей порадовал больше всего.

К сожалению, не все обстоит так радужно. Как показывает низкая A8-3850 в мультимедийных тестах, модель во многом отстает от аналогичного по цене чипа Intel і3-2100. Очевидно, это составит проблему при редактировании изображений или кодировании видео. Тем не менее, по мнению пользователей, компромисс между улучшенными графическими характеристиками в обмен на умеренно худшую медиа-производительность в большинстве случаев оправдан, особенно если такие системы получат распространение в будущем.

Покупатели, которым нужен недорогой ПК, просто офисный компьютер или домашний кинотеатр, способный при необходимости ненадолго становиться игровой станцией, в A8-3850 найдут идеальный вариант, поскольку процессор обойдется значительно дешевле, чем система на базе i3-2100 с дискретным GPU. Чипсет компании AMD обладает более чем достаточной мощностью для обеспечения высокого быстродействия и имеет преимущества дискретного графического процессора, которых достаточно для поддержки необходимой производительности 3D.




Top