Amd athlon все процессоры. Процессоры AMD - как устроены и основные принципы. О высоких технологиях

Кажется, со времени 486 процессоров, когда и Intel и AMD сосуществовали бок о бок и практически не конкурировали между собой, пользуясь одними и теми же технологиями, AMD впервые имеет шанс положить Intel на лопатки. Почему? Ответ прост - на рынке появился новый процессор седьмого поколения AMD Athlon.

Но сначала обратимся к истории. Первым процессором, который AMD разрабатывала самостоятельно, был K5, выпущенный в 1996 году. Сейчас о нем уже мало кто помнит, правда и помнить там особо нечего. Как всегда, опоздав с выпуском этого кристалла, отставая по тактовой частоте и производительности, AMD не смогла тогда завоевать расположения пользователей.

После этого провала AMD приобрела забытую сейчас фирму NexGen, еще одного независимого разработчика x86 процессоров, который обладал передовой на то время технологией и в небольших количествах выпускал кристаллы без арифметического сопроцессора. Используя эти наработки, AMD спроектировала новое поколение своих CPU - K6. По операциям с целыми числами эти процессоры стали превосходить аналоги от Intel, однако блок операций с плавающей точкой все еще оставлял желать лучшего. А так как начинающие активно набирать популярность игры в жанре Action опирались в своих вычислениях именно на FPU, AMD K6 вновь ждал провал.

AMD не сдавалась и для нужд компьютерных игр предложила использовать не сопроцессор, а специально спроектированный набор SIMD-инструкций 3DNow!. Так появился процессор AMD K6-2, в котором к обычному ядру K6 добавился еще один блок операций с числами одинарной точности с плавающей точкой. Благодаря тому, что он мог выполнять однотипные вычисления с четырьмя парами операндов одновременно, на специально оптимизированных под 3DNow! приложениях K6-2 показывал неплохую производительность. Однако, из специально и как следует оптимизированных оказался только Quake2, а потому пользователи, в большинстве своем, остались недовольны.

Тогда AMD к своему процессору K6-2 добавила интегрированный в ядро кеш второго уровня, работающий на частоте кристалла. Это спасло производительность - полученный K6-III мог успешно конкурировать с аналогами, однако, Intel практически задавил это начинание ценами. Celeron обходился значительно дешевле, обеспечивая, тем не менее, вполне пристойное быстродействие.

В результате мы получили то, что получили. Находясь в состоянии ценовой войны, Intel и AMD пришли к тому, что самые дешевые Intel Celeron продаются практически по себестоимости, если не ниже, а на рынке дорогих процессоров обосновался другой продукт от Intel - Pentium III. Единственный оставшийся шанс выжить для измотанной и порастерявшей в борьбе свои капиталы AMD - вылезти на рынок дорогих и производительных процессоров. Причем, закрепиться на нем не за счет цены - этим оружием в совершенстве владеет Intel, который может сбрасывать цены значительно сильнее AMD, а за счет быстродействия. Именно это и попыталась сделать AMD, выбросив на рынок процессор нового поколения - Athlon.

Если подойти к архитектуре AMD Athlon поверхностно, то основные его параметры можно обрисовать следующим образом:

Следует иметь в виду, что когда в начале 2000 года начнет функционировать новая Дрезденская Fab30, выпускающая Athlon по 0.18 мкм технологии, на которую AMD возлагает особые надежды, что-то из перечисленных выше параметров может и поменяться.

Однако таким простым процессор AMD Athlon кажется только лишь на первый взгляд. На самом же деле за этими несколькими строками скрываются многочисленные архитектурные инновации, которые мы рассмотрим позднее. Однако и простые характеристики AMD Athlon впечатляют. Например, как нетрудно заметить, Athlon превосходит Intel не только по максимальной тактовой частоте (у Intel Pentium III она 600 МГц, да и к тому же при этом он работает на повышенном до 2.05В напряжении ядра), но и по размеру кеша первого уровня, который у Intel Pentium III всего 32 Кбайта.

Перейдем же к более подробному рассмотрению архитектуры AMD Athlon.

Системная шина

Прежде чем углубляться в сам процессор, посмотрим, чем же отличается системная шина EV6, примененная AMD, от привычной интеловской GTL+. Внешнее сходство бывает обманчиво. Хотя процессорный разъем Slot A на системных платах для процессора AMD Athlon выглядит также как и Slot 1, перевернутый на 180 градусов, шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Более того, различно даже число задействованных сигналов - Athlon использует примерно половину из 242 контактов, в то время как Pentium III всего четверть. Внешняя похожесть вызвана тем, что AMD просто хотела облегчить жизнь производителям системных плат, которым не придется покупать особенные разъемы для установки на Slot A системные платы. Только и всего.

На самом же деле, хоть EV6 и работает на частоте 100 МГц, передача данных по ней, в отличие от GTL+ ведется на обоих фронтах сигнала, потому фактическая частота передачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 - 72 бита, 8 из которых используется под ECC (контрольную сумму), то получаем скорость передачи данных 64бита х 200 МГц = 1,6 Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100 МГц в два раза меньше - 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает увеличение пропускной способности при этом только до 1,06 Гбайт/с. Казалось бы, как в случае с GTL+, так и с EV6 получаются внушительные значения пропускной способности. Однако, только современная PC100 память может отожрать от нее до 800 Мбайт/с, а AGP, работающий в режиме 2x - до 528 Мбайт/с. Не говоря уже о PCI и всякой другой мелочевке. Получается, что GTL+ уже сейчас может не справляться с передаваемыми объемами данных. У EV6 же в этом случае все в порядке, потому эта шина более перспективна.

При этом, как частота GTL+ может быть увеличена со 100 до 133 МГц, планируется, что и частота EV6 также впоследствии достигнет значения 133 (266), а затем и 200 (400) МГц. Однако планы эти могут и не осуществиться - реализовать работу на материнской плате EV6, требующую большего количества контактных дорожек, несколько сложнее, особенно на больших частотах. Хотя если у AMD все получится, пропускная способность системной шины может достичь 2.1 и 3.2 Гбайта/с соответственно, что позволит беспрепятственно применять в Athlon-системах, например, высокопроизводительную 266-мегагерцовую DDR SDRAM.

Еще одна интересная особенность EV6 заключается в поддержке многопроцессорных систем, на рынок которых AMD планирует выйти в наступающем году. В отличие от GTL+, EV6 обеспечивает соединение точка-точка между процессорами и чипсетом, что позволяет выделить всю пропускную способность шины для каждого процессора. Теоретически таким образом может подключаться до 14 процессоров. Ограничения же на количество процессоров в интеловских системах обусловлено, в частности, и тем фактом, что общая пропускная способность GTL+ делится поровну между CPU. Потому, EV6 кажется перспективной и при использовании в многопроцессорных системах.


EV6

GTL+

Кеш

Прежде чем переходить непосредственно к функционированию AMD Athlon, хочется затронуть тему L1 и L2 кешей.

Что касается кеша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кеша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.

Что же касается кеша L2, то и тут AMD оказалось на высоте. Во-первых, интегрированный в ядро tag для L2-кеша поддерживает его размеры от 512 Кбайт до 16 Мбайт. Pentium III, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кеш второго уровня. К тому же, Athlon может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и 1:3. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков SRAM определенной скорости, особенно при выпуске более быстрых моделей.

Благодаря возможности варьировать размеры и скорости кеша второго уровня AMD собирается выпускать четыре семейства процессоров Athlon, ориентированных на разные рынки.

Архитектура. Общие положения

Вот мы и подошли к рассказу о том, как же, собственно, работает Athlon. Как и процессоры от Intel с ядром, унаследованным от Pentium Pro, процессоры Athlon имеют внутреннюю RISC-архитектуру. Это означает, что все CISC-команды, обрабатываемые процессором, сначала раскладываются на простые RISC-операции, а потом только начинают обрабатываться в вычислительных устройствах CPU. Казалось бы, зачем усложнять себе жизнь? Оказывается, есть зачем. Сравнительно простые RISC-инструкции могут выполняться процессором по несколько штук одновременно и намного облегчают предсказание переходов, тем самым позволяя наращивать производительность за счет большего параллелизма. Говоря более просто, тот производитель, который сделает более "параллельный" процессор, имеет шанс добиться превосходства в производительности гораздо меньшими усилиями. AMD при проектировании Athlon, по-видимому, руководствовалась и этим принципом.

Однако перед тем, как начать работу над параллельными потоками инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon, как впрочем и в Intel Pentium III, применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд одновременно. Современные интеловские процессоры могут также обрабатывать до трех команд, однако если для Athlon совершенно все равно, какие команды он расщепляет, Pentium III хочет, чтобы две из трех инструкций были простыми и только одна - сложной. Это приводит к тому, что если Athlon за каждый процессорный такт может переварить три инструкции независимо ни от чего, то у Pentium III отдельные части дешифратора могут простаивать из-за неоптимизированного кода.

Перед тем, как попасть в соответствующий вычислительный блок, поступающий поток RISC-команд задерживается в небольшом буфере (Instruction Control Unit), который, что уже неудивительно, у AMD Athlon расчитан на 72 инструкции против 20 у Pentium III. Увеличивая этот буфер, AMD попыталась добиться того, чтобы дешифратор команд не простаивал из-за переполнения Instruction Control Unit.

Еще один момент, заслуживающий внимания - вчетверо большая, чем у Pentium III, таблица предсказания переходов размером 2048 ячеек, в которой сохраняются предыдущие результаты выполнения логических операций. На основании этих данных процессор прогнозирует их результаты при их повторном выполнении. Благодаря этой технике AMD Athlon правильно предсказывает результаты ветвлений где-то в 95% случаев, что очень даже неплохо, если учесть, что аналогичная характеристика у Intel Pentium III всего 90%.

Посмотрим теперь, что же происходит в Athlon, когда дело доходит непосредственно до вычислений.

Целочисленные операции

С целочисленными операциями у процессоров от AMD всегда все было в порядке. Со времен AMD K6 процессоры от Intel проигрывали именно в скорости целочисленных вычислений. Тем не менее, в Athlon AMD напрочь отказалась от старого наследия.

Благодаря наличию трех конвейерных блоков исполнения целочисленных команд (Integer Execution Unit) AMD Athlon может выполнять три целочисленные инструкции одновременно. Что же касается Pentium III, то его возможности ограничиваются одновременным выполнением только двух команд.

Отдельно хочется затронуть вопрос конвейеров. Оптимальной глубиной конвейера для процессоров с современными скоростями считается 9 стадий. Увеличение этого числа приводит к ускорению процесса обработки команд, так как скорость работы конвейера определяется работой самой медленной его стадии. Однако, в случае слишком большого конвейера при ошибках в предсказании переходов оказывается что большая часть работы по исполнению команд, уже вошедших на конвейер выполнена напрасно. Его приходится очищать и начинать процесс заново.

Потому в AMD Athlon глубина целочисленных конвейеров составляет 10 стадий, что близко к оптимуму. К сожалению, поклонники продукции Intel снова не услышат ничего утешительного, так как конвейер в Pentium III состоит из 12-17 стадий в зависимости от типа исполняемой инструкции.

Вполне закономерными в свете вышеизложенного выглядят результаты теста ZD CPUMark 99, измеряющего производительность операций с целыми числами и памятью:

Вот это да! Первый тест и первый крупный успех AMD Athlon - его превосходство над Intel Pentium III на той же тактовой частоте составляет более 20%! Вот что значит большой кеш плюс большее количество лучше организованных конвейеров! Однако пока не стоит особенно обольщаться, скорость работы современных приложений, особенно игр, зависит от целочисленной производительности не так сильно, как от вещественночисленной. Потому посмотрим, что же представляет из себя новый конвейерный FPU в Athlon.

Вещественные операции

С замиранием сердца обращаем наш взгляд на блок FPU, встроенный в Athlon. Как мы все хорошо помним, для предыдущих процессоров AMD операции с плавающей точкой были настоящей ахиллесовой пятой. Главной проблемой было то, что блок FPU в K6, K6-2 и K6-III был неконвейеризированый. Это приводило к тому, что хотя многие операции с плавающей точкой в FPU от AMD выполнялись за меньшее число тактов, чем на интеловских процессорах, общая производительность была катастрофически низкой, так как следующая вещественная операция не могла начать выполняться до завершения предыдущей. А что-то менять в своем FPU AMD в то время не хотела, призывая разработчиков к отказу от его использования в пользу 3DNow!.

Но, похоже, прошлый опыт научил AMD. В Athlon арифметический сопроцессор имеет конвейер глубиной 15 стадий против 25 у Pentium III. Не следует забывать, что, как уже говорилось выше, более длинный конвейер не всегда обеспечивает лучшую производительность. К тому же, существенным недостатком Intel Pentium III, которого в Athlon, естественно нет, является неконвейерезируемость операций FMUL и FDIV.

FPU в Athlon объединяет в себе три блока: один для выполнения простых операций типа сложения, второй - для сложных операций типа умножения и третий - для операций с данными. Благодаря такому разделению работы Athlon может выполнять одновременно по две вещественночисленные инструкциии. А ведь такого не умеет даже Intel Pentium III - он выполняет инструкции только последовательно!

Так что, как это ни странно, FPU интеловских процессоров оказался не таким уж замечательным, как это принято было считать ранее. Результаты теста ZD FPU WinMark это подтверждают - AMD переиграла Intel на чужом поле:

Только работая на частоте 650 МГц Pentium III удается догнать новый суперFPU AMD Athlon. Результат крайне непривычный, но многообещающий - наконец-то процессор от AMD должен задать жару и в 3D играх.

MMX

На первый взгляд с выполнением MMX-операций у Athlon по сравнению с K6-III изменений не произошло. Однако это не совсем так. Хотя и MMX-инструкции используются в крайне небольшом числе приложений, AMD добавила в этот набор еще несколько инструкций, которые также появились в MMX-блоке процессора Pentium III. В их число вошли нахождение среднего, максимума и минимума и изощренные пересылки данных.

Если обратить внимание на архитектурные особенности, то в AMD Athlon имеется по два блока MMX, потому на обоих процессорах - и на Athlon, и на Pentium III - может выполняться одновременно пара MMX-инструкций. Однако, MMX-блоки в AMD Athlon имеют большую, чем у Pentium III латентность, что теоретически должно приводить к отставанию этого CPU в MMX-приложениях. Для того, чтобы протестировать реальную скорость MMX мы воспользовались старым добрым тестом Intel Media Benchmark:

Странно, но, несмотря на теоретический проигрыш, Athlon на практике все равно остается на высоте. Этот успех можно отнести как на счет большего кеша или лучшего декодера инструкций. Однако, еще раз должен отметить, что реально используют MMX очень малое число программ, потому, если даже Athlon бы проигрывал Pentium III в повседневной работе это, скорее всего, заметно бы не было.

А вот что касается вещественных SIMD-инструкций, то они приобретают все большее и большее значение.

3DNow!

Блока 3DNow! в AMD Athlon коснулись сильные изменения. Хотя его архитектура и осталась неизменной - два конвейера обрабатывают инструкции, работающие с 64-битными регистрами, в которых лежат пары вещественных чисел одинарной точности, в сам набор команд было добавлено 24 новинки. Новые операции должны не только позволить увеличить скорость обработки данных, но и позволить задействовать технологию 3DNow! в таких областях, как распознавание звука и видео, а также интернет:) Кроме этого, по аналогии с SSE были добавлены и инструкции для работы с данными, находящимися в кеше. Поддержка обновленного набора 3DNow! уже встроена в Windows 98 SE и в DirectX 6.2.

Таким образом, в набор 3DNow! входит теперь 45 команд, против 71 инструкции в SSE от Intel. Причем, судя по всему, использование новых команд должно дать еще больший эффект от 3DNow! В доказательство этого факта AMD распространила дополнительный DLL для известного теста 3DMark 99 MAX, задействующий новые возможности процессора.

Специально для оценки эффективности процессора в 3D-играх, 3DMark 99 MAX предлагает индекс CPU 3DМark, просчитывающий 3D-сцены, но не выводящий их не экран. Таким образом, получается результат, зависящий только от возможностей процессора по обработке 3D-графики и от пропускной способности основной памяти. Мы изучили быстродействие AMD Athlon по этому тесту как с использованием старого 3DNow!, так и с новым Enhanced 3DNow! и без этой технологии вообще. Для сопоставления результатов был протестирован и Intel Pentium III, с включенной SSE-оптимизацией и без нее:

Как мы видим, AMD Athlon по этому тесту чрезвычайно силен. Даже без использования новых 3DNow! инструкций он остается в недосягаемости для процессоров Intel. Все это дает нам право ожидать выдающейся производительности в 3D-играх. А мы обратим взор на гораздо более актуальный вопрос - эффективность различных наборов SIMD-инструкций: SSE и 3DNow!. Для этого посмотрим на прирост производительности в 3DMark 99 MAX при включении соответствующей оптимизации:

Что же, результат показателен. Если старый набор 3DNow!, состоящий из 21 инструкции, обеспечивал выигрыш практически аналогичный приросту производительности от SSE, то новый 45-командный выводит SIMD инструкции от AMD далеко вперед. Правда, все это результаты синтетического теста, что будет в реальных приложениях зависит от разработчиков. А мы можем только лишь их призвать оптимизировать свои изделия как под SSE, так и под 3DNow!, тем более после выхода AMD Athlon оба набора стали гораздо более близки по своим возможностям.

Производительность

После того, как мы рассмотрели устройство AMD Athlon с разных позиций и протестировали его различные части синтетическими тестами, пришло время посмотреть, как он будет вести себя в реальной жизни. Пока фанаты AMD предвкушают высокие результаты их нового фетиша, опишем наши тестовые системы.

Система на базе AMD Athlon:

  • Процессор AMD Athlon 600 МГц;
  • Системная плата MSI MS-6167;
  • 128 Мбайт SEC PC-100 SDRAM

Система на базе Intel Pentium III:

  • Процессор Intel Pentium III 550 и 600 МГц. Данные по Intel Pentium III 650 МГц получены путем разгона до 6,5х100 МГц;
  • Системная плата ABIT BE6;
  • Видеокарта Diamond Viper V770 Ultra;
  • Звуковая карта Creative Sound Blaster Live!;
  • Жесткий диск IBM IBM DJNA 372200
  • 128 Мбайт SEC PC-100 SDRAM

Тесты проводились под управлением операционной системы MS Windows98 SE, во всех 3D-тестах было установлено разрешение 800x600x16.

Первым делом по сложившейся традиции посмотрим на скорость, обеспечиваемую AMD Athlon в офисных приложениях:

Скорость Athlon, работающего на частоте 600 МГц, оказывается практически такой же, как и у Pentium III 650 МГц. Да, лучшая работа с целыми числами и больший кеш обеспечивают превосходство Athlon над Pentium III в бизнес-приложениях при одинаковой тактовой частоте. Однако, толку от того что MS Word или MS Excel будет работать быстрее - немного. Где действительно нужна скорость, так это в современных 3D-играх. Но для начала прикинем скорость в 3D на синтетическом тесте 3DMark 99 MAX:

Athlon не разочаровал нас и здесь. Даже без специальной оптимизации под новые 3DNow!-инструкции этот процессор обеспечивает превосходство даже над Intel Pentium III, работающем на большой тактовой частоте. Но перейдем же, наконец, к реальным тестам - 3D-играм. Первой в списке будет OpenGL-игра Quake2, имеющая специально оптимизированный под 3DNow! минипорт:

Хотя в Quake2, на котором AMD ранее демонстрировала преимущества технологии 3DNow!, и процессоры K6-2 и K6-III вели себя неплохо, такого выигрыша в 25% от Athlon никто даже не ожидал. А ведь это не синтетический тест, а реальное приложение, причем во многом зависящее от возможностей видеокарты. При этом следует иметь в виду, что в нашей тестовой системе была установлена видеокарта на чипе nVidia Riva TNT2. Если бы это была 3dfx Voodoo3, то преимущество было бы еще больше! Но чтобы не подозревать AMD в жульничестве, мы воспользовались и другим игровым OpenGL приложением, к которому AMD руку приложить еще не успела - Quake3 Arena Test:

Ну что же, мы опять видим то самое 25-процентное преимущество AMD Athlon во всех режимах, кроме High Quality, где скорость ограничивается уже возможностями графической карты, а не процессора. Так что, высокоскоростной конвейерный FPU теперь не только не подводит AMD, но и дает возможность стать Athlon самым быстрым процессором для игр. Подтверждение этому можно найти и в результатах Direct3D-игр, например Expendable:

И снова даже Intel Pentium III 650 не может нагнать нашего героя. Ну и в заключение - результаты по одной из самых тяжелых для процессора игр, Unreal:

В принципе, сказать уже нечего - как не крути, AMD Athlon получается быстрее Intel Pentium III.

Что же, тот факт, что Athlon всегда обгоняет Pentium III, говорит сам за себя. Наличие прекрасного арифметического сопроцессора, высокая целочисленная производительность и качественная поддержка SIMD-инструкций превратили Athlon в отличный процессор для развлечений и повседневной работы.

Разгон

Делая всесторонний обзор нового процессора, нельзя не остановиться и на таком важном пункте, как разгон. Правда, поводов для оптимизма здесь немного.

Хотя ядро Athlon не имеет никакой внутренней фиксации ни умножения, ни частоты, номинальная скорость процессора задается расположением нескольких резисторов на процессорной плате. Потому, если вы хотите изменить какие-либо параметры CPU, вы вынуждены снимать картридж, автоматически теряя гарантию и рисковать собственным процессором, перепаивая детальки.

Правда, есть и другой способ. Процессорная плата Athlon снабжена технологическим разъемом, доступ к которому возможен, к слову сказать, опять-таки после снятия картриджа. Посредством этого разъема к CPU может быть подключен дополнительный адаптер, позволяющий изменить умножение и частоту шины. Огорчает одно - непонятно, где брать эти адаптеры. Пока мы не слышали ни о штучных, ни о серийных поставках этих деталей.

Что касается конкретных результатов, то Kryotech разгоняет в своих охлаждающих установках AMD Athlon 600 до 800 МГц, и это внушает оптимизм.

То есть, Athlon вполне разгоняем, но сделать это на практике очень непросто. Поэтому, похоже, разгон этого процессора не станет таким массовым спортом, как оверклокинг Intel Pentium III или Celeron. Тем не менее, недобросовестные продавцы, ищущие легкой наживы и имеющие необходимые навыки, легко могут заняться перемеркировкой процессоров Athlon. Против таких махинаций, к сожалению, AMD не предлагает никакой защиты.

Чипсеты

Прекратив разрабатывать процессоры под гнездо Super 7 и начав продвигать собственный Slot A и системную шину EV6, AMD оказалась отрезана от всех интеловских наработок на поприще чипсетов и системных плат. Теперь AMD придется самой создавать необходимую инфраструктуру, чтобы мы могли приобрести не только процессор, но и системную плату, оборудованную Slot A.

И, судя по первым успехам, ей это удалось. На первое время компания разработала собственный набор логики AMD 750, имеющий кодовое имя Irongate, а также собственный дизайн системной платы - Fester, который был растиражирован рядом тайваньских производителей.

Сам чипсет AMD 750 не представляет собой ничего особенного - по возможностям он аналогичен i440BX. Но большего, в принципе, и не надо. AMD Athlon, как мы видели, и так работает нормально и даже обгоняет по производительности конкурирующие продукты.

AMD 750 имеет традиционую архитектуру и состоит из северного моста AMD 751 и южного AMD 756. Северный мост обеспечивает взаимодействие посредством шины EV6 процессора с памятью и шинами PCI и AGP, поддерживая до 768 Мбайт оперативной памяти PC100 в не более чем трех модулях, AGP 2x и 6 PCI bus maser устройств. Южный мост, осуществляющий интерфейс со всей периферией, кроме обычных функций, умеет работать с UltraDMA/66 IDE-устройствами.

Здесь хочется затронуть еще одну волнующую всех проблему - совместимость. Все мы помним, что для функционирования предыдущих плат, ориентированных на процессоры AMD, требовалась установка специального минипорта, включающего AGP GART драйвер. Этот момент вызывал наибольшие нарекания пользователей, так как часто драйвер отказывался нормально работать с определенными видеокартами. Для корректной работы Athlon с AGP драйвер тоже надо устанавливать, однако можно сказать уверенно - его реализация во много раз изменилась к лучшему. Нам не удалось найти ни одной карты из современных, которая бы работала некорректно. И вообще, говоря о стабильности и совместимости - проблем AMD Athlon ни при работе под Windows 98, ни при работе под Windows NT не вызывал. Так что с надежностью и стабильностью Athlon-систем все должно быть в порядке.

Любопытно, но как оказалось из-за того, что шина EV6 используется и в процессорах Alpha, Irongate может применяться на системных платах и под этот процессор, в частности, системная плата UP1000 от API (для Alpha) основывается именно на этом чипсете.

Хотя на данный момент Irongate выглядит вполне современно, пройдет какое-то время, и его возможностей будет явно недостаточно. AMD, хотя и продолжает свои разработки, планируя внедрить в Irongate поддержку AGP 4x и памяти PC133 или Direct RDRAM, делает это крайне неохотно. По расчетам компании к проектированию Athlon-чипсетов должны быть привлечены тайваньские производители VIA, SiS и ALI, которые не отказались поучаствовать в продвижении нового процессора на рынок.

VIA уже объявила свой Athlon-чипсет KX133, который отличается от Irongate поддержкой памяти PC133 и AGP 4x. Архитектура KX133 также традиционная - северный мост VT8371 и любой южный мост от имеющихся у VIA чипсетов, например VT82C686A. Видимо, именно этот чипсет станет впоследствии самым массовым, на то есть все предпосылки. Обладая более широкими возможностями, например поддержкой до 2 Гбайт оперативной памяти, он появится на рынке уже в четвертом квартале.

Ну а если говорить о более далеких перспективах, то там нас ждут и SMP, и поддержка более скоростной системной шины, и решения с интегрированной графикой. Так что, видимо, с чипсетами под AMD Athlon все будет в порядке.

Системные платы

Для облегчения жизни разработчикам плат AMD разработала референс-дизайн Fester, который и был им передан в расчете на то, что к выходу Athlon тайваньские производители заполнят рынок платами своего изготовления. Сама AMD выпустила лишь небольшое количество плат, предназначенных только для демонстрации, а не для продажи. Однако, в действительности, все произошло не совсем так, как хотелось AMD.

Дело в том, что предложенный дизайн был шестислойным, в то время как практически все современные материнские платы - четырехслойные. Этот момент вызвал некоторые затруднения у производителей, и с платами получилась небольшая задержка. Более того, даже первые выпущенные серийно платы MSI пришлось отзывать из-за низкой стабильности. На производственные трудности наложилось и давление, оказываемое Intel, который во время дефицита чипсетов имеет неплохое влияние на производителей. Таким образом, к настоящему моменту объявлены только платы шести производителей - MSI, Gigabyte, FIC, Asus, Biostar, и GVC, а доступно и того меньше.

Есть информация, что ASUS и FIC работают в настоящий момент над созданием собственно, четырехслойного дизайна, однако, ждать плодов их творчества следует еще не скоро.

Нам удалось раздобыть образцы только двух плат под AMD Athlon - MSI MS-6167 и Gigabyte GA-7IX. Говорят, что уже доступны еще две платы - FIC SD11 и GVC QS750, однако нам их в продаже найти не удалось. Что же касается найденных нами образцов от MSI и Gigabyte, то они выполнены на основе дизайна Fester: MSI подошла к вопросу бесхитростно и просто повторила референс-дизайн. Gigabyte же подошел к делу более творчески и внес отдельные косметические изменения. Однако все равно в результате мы имеем две платы, похожие как капли воды.


Microstar MS-6167

Gigabyte GA-7IX

Обе платы выполнены в ATX-формате, основаны на чипсете AMD 750, поддерживают процессоры со скоростями до гигагерца и имеют по 5 слотов PCI, 2 - ISA, 1 - AGP и по три разъема под DIMM. Естественно, имеется поддержка UltraDMA/66. Системный мониторинг также присутствует и реализован контроллером W83782D. Единственные видимые отличия есть только в BIOS Setup - MS-6167 имеет большее число настроек для работы с памятью. Setup же 7IX более понятен для неискушенного пользователя.

Что касается скоростей работы обоих плат - то они практически идентичны и рассмотрение их различия не заслуживает внимания. Думается, наиболее логичным шагом в настоящий момент будет немного подождать выхода системных плат и от других фирм, которые занимались редизайном Fester. Эти платы как могут быть более скоростными, так и наделены новыми возможностями, например, опциями для беспрепятственного разгона Athlon.

Выводы

Пора подводить итоги. AMD Athlon является на сегодня самым быстрым x86-процессором с передовой архитектурой, что подтверждают наши тесты. Intel сейчас ничего не может противопоставить успеху AMD - архитектура Katmai практически исчерпала свои возможности, в то время как AMD может беспрепятственно увеличивать частоты своих кристаллов. Переход Intel на технологию 0.18 мкм вряд ли надолго сможет решить проблему: завод AMD в Дрездене, который будет выпускать Athlon по аналогичной технологии, но с применением медных проводников находится уже практически на стадии запуска. Кроме того, без изменения архитектуры ядра Intel неоткуда почерпнуть дополнительного прироста быстродействия, потому вся надежда микропроцессорного гиганта должна возлагаться на Willamette, который, впрочем, выйдет не очень скоро.

Мощный, но недорогой процессор для персонального компьютера - это далеко не миф, как может показаться на первый взгляд. Дело в том, что известная всему миру компания AMD поставила на поток производство топовых кристаллов без встроенного графического ускорителя. Соответственно, высокопроизводительные процессоры подешевели практически вдвое.

В фокусе данной статьи - игровой чип AMD Athlon 860K, который претендует стать лучшей покупкой в среднем и бюджетном сегменте на компьютерном рынке. Обзор, технические характеристики и отзывы владельцев позволят потенциальному покупателю ближе познакомиться с новинкой.

Знакомство с процессором

Большая картонная коробка чёрного цвета, красные вставки по всему её контуру и фирменный логотип компании демонстрируют владельцу, что у него в руках процессор от известного производителя AMD. Практически все пользователи данного устройства в своих отзывах отмечают странную особенность, которую они заметили при знакомстве - слабая система охлаждения. В коробке, вместе с кристаллом, размещён небольшой кулер фирмы Foxconn, который и вызывает недоверие своим внешним видом.

Помимо базовых устройств, в упаковке пользователь обнаружит большое количество ненужной литературы, описывающей спецификацию процессора, а также термопасту, которая понадобится владельцу при установке всех компонентов в системный блок. Что касается комплектации AMD Athlon 860K OEM, то здесь всё намного проще - небольшая пластиковая коробочка, в которой удобно расположились процессор и гарантийный талон.

Кстати, прежде чем выбрасывать документацию, многие владельцы рекомендуют её пролистать. В одной из книжек присутствует фирменный логотип компании AMD, выполненный в виде наклейки на корпус компьютера. Довольно странно, что производитель не прикрепил его к процессору или термопасте.

Битва титанов

Естественно, потенциальные покупатели интересуются, с какой целью известная компания модифицировала свои высокопроизводительные продукты и начала их раздавать всем пользователям практически даром (цена на отечественном рынке составляет 6000 рублей). Как оказалось, всё очень просто. Вся проблема скрывается в ядре и сокете, которым оснащён кристалл AMD Athlon x4 860K (Kaveri и Socket FM2+).

Да, процессор, созданный по 28-нанометровому процессу, просто морально устарел. Соответственно, первостепенной задачей производителя является распродажа залежавшихся чипов. Отсюда и модернизация с последующим снижением стоимости продукта. Правда, в этом всём выгода затрагивает не только компанию AMD, а и потенциального покупателя, который получает достаточно производительный процессор по очень привлекательной стоимости.

Базовые технические характеристики

На одном кристалле AMD Athlon x4 860K реализовано 4 физических ядра, каждое из которых работает на частоте 3700 МГц. Процессор на аппаратном уровне поддерживает режим Turbo Boost и способен разгоняться до 4 ГГц. Ускорение осуществляется автоматически путём изменения множителя с 37 до 40. Соответственно, базовая частота системной шины чипа составляет 100 МГц.

Сразу стоит отметить, что каждому ядру процессора соответствует всего один поток, и у кристалла нет КЭШ памяти третьего уровня, что выглядит довольно странно для такого привлекательного устройства. Зато производитель обеспечил свой продукт большим объёмом КЭШ 2-го уровня (4 Мб) и 1-го уровня (64 Кб для данных и 129 Кб для инструкций).

О высоких технологиях

Athlon x4 860K FM2 поддерживаются все современные инструкции и технологии. Фактически данный кристалл можно устанавливать не только в игровую платформу, а и реализовывать в серверах, ведь чип на аппаратном уровне поддерживает виртуализацию, шифрование и оснащён защитой от вредоносного кода, передаваемого на машинном языке.

Устройство умеет работать с двуканальным режимом памяти и полностью совместимо с модулями DDR3-2133 МГц. Эта новость непременно обрадует всех любителей ресурсоёмких динамических игр, которые уже успели обнаружить зависимость многих приложений от скорости работы оперативной памяти и процессора.

Слабое звено игрового процессора

Как и следовало ожидать, такой интересный продукт имеет одну существенную проблему, связанную с системой охлаждения, на которую обращают внимание покупателей многие владельцы процессоров AMD Athlon 860K. Отзывы негативного характера понять можно. Игровой кристалл с тепловыделением 95 Ватт оснащён каким-то детским вентилятором и алюминиевым радиатором с крупным сечением.

И проблема возникает в штатном режиме, а что же будет при разгоне, когда процессор начнёт рассеивать 150-160 Вт? Вариантов решения проблемы не так много. Потенциальный покупатель изначально должен побеспокоиться о покупке достойной системы охлаждения. Естественно, при выборе центрального процессора на компьютерном рынке эксперты рекомендуют пользователям отдать предпочтение модификации OEM вместо коробочного варианта. По крайней мене, с экономической точки зрения это будет правильным шагом.

Выбор достойного кулера

Сразу становится ясно, на что потратит сэкономленные средства пользователь - мощный процессор AMD Athlon 860K нуждается в достойном охлаждении. И стоит отметить, что хороший кулер для игрового кристалла с большой рассеиваемой мощностью стоит немалых денежных средств. Однако перед покупкой владелец должен решить для себя, будет ли он разгонять процессор или ему достаточно и базовых частот.

Из недорогих решений среди воздушного хорошо зарекомендовали себя продукты DeepCool Ice Pro. Недорогое решение (цена порядка 2-3 тысяч рублей) имеет тепловой пакет 125 Ватт и точно не позволит мощному кристаллу перегреваться при больших нагрузках.

А вот любителям разгона придётся увеличить свой бюджет вдвое, ведь достойный кулер, который сможет справиться с рассеиваемой мощностью 160 Вт, в бюджетном сегменте отсутствует. Тут на помощь пользователю придут продукты от компаний Noctua, Scuthe и DeepCool Gamer, которые имеют лишь положительные отзывы от покупателей.

Сборка игрового ПК

При построении многим пользователям интересно, какие компьютерные компоненты необходимо подбирать под чип AMD Athlon II 860K, чтобы получить максимальную производительность при минимальных затратах. И если с материнской платой всё понятно (соответствие платформы в приоритете), то в остальном в таких вопросах без помощи экспертов не обойтись.

По заявлениям энтузиастов, игровой процессор полностью раскрывает потенциал игровых видеокарт Nvidia GTX 750 и AMD HD 7790, заставляя их работать на пределе своих возможностей. И это происходит в обычном режиме, без разгона кристалла. Эксперты рекомендуют подобрать для игрового процессора видеоадаптеры классом выше или AMD HD 5870).

С оперативной памятью дела обстоят проще. Для ресурсоёмких приложений рекомендуется использовать 8-12 гигабайт памяти, однако любителям спортивных игр (NBA, FIFA) стоит подумать об установке 16 Гб в систему.

Правильный разгон

Понятно, что без увеличения производительности собственными силами кристалл AMD Athlon 860K мало кому интересен. Поэтому предстоит обсудить игровой потенциал процессора и его правильный разгон. Естественно, перед проведением мероприятия покупатель должен позаботиться о наличии достойного охлаждения, иначе чип удастся разогнать всего один раз (потом его можно выбросить).

Разгон можно осуществлять двумя способами: поднимать частоту шины и использовать множитель. Второй вариант предпочтительнее, так как он увеличивает производительность только процессора, да и с ошибками в работе проблем не будет. При невозможности запуска системы BIOS материнской платы сбросит множитель до заводских настроек.

А вот с частотой шины нередко возникают проблемы, и касаются они часто оперативной памяти. Любителям разгона лучше изначально побеспокоиться о модулях ОЗУ, поддерживающих нестандартные частоты.

Ближайшие конкуренты в линейке AMD

Если изучить процессоры AMD в ценовой категории до 6000 рублей, то обнаружится, что не так много чипов способны продемонстрировать высокую производительность в игровых решениях. Внимание энтузиастов привлекли два кристалла с кодовым именем Vishera и созданных под платформу AM3+. Речь идёт о легендарном процессоре с шестью ядрами FX-6300 и самом мощном представителе 4-ядерных платформ, AMD FX-4350.

Да, если сравнивать с продуктом AMD Athlon 860K характеристики процессоров, то можно обнаружить несоответствие. Речь идёт о памяти КЭШ третьего уровня. В процессорах FX он составляет 8 мегабайт, однако этот показатель не сильно отражается на общей производительности платформы. Как показывают результаты, практически во всех тестах все процессоры демонстрируют одинаковую производительность, что и вызывает сомнения у потенциальных покупателей. Ведь, по логике, 6-ядерный представитель априори должен быть быстрее.

Аналоги конкурента

Многие пользователи, разогнав до предела AMD Athlon x4 860K Kaveri, пытаются доказать окружающим, что их процессор может конкурировать с представителем линейки Intel Core i5. Вот только о разгонном потенциале конкурента почему-то многие умалчивают. Естественно, вокруг первенства таких процессоров и возникает множество споров, которые способны разрушить лишь сравнительные тестирования.

Пусть это звучит и странно, однако у кристалла 860К всего один конкурент, с которым он может проходить тестирования на равных. Речь идёт о продукте Intel Core i3. Известный всему миру чип обладает всего двумя ядрами и малым объёмом КЭШ-памяти, но это не мешает ему в ресурсоёмких приложениях демонстрировать достойные показатели. Что касается синтетических тестов, то здесь бесспорное лидерство за процессором AMD, однако пользователи привыкли играть в реальные компьютерные игры, а не наслаждаться результатами каких-то тестовых программ.

Игровой потенциал

На тестовом стенде чип AMD Athlon 860K, цена которого не превышает 6000 рублей, способен продемонстрировать владельцу весь свой потенциал. Правда, для реализации полной мощности не разогнанного кристалла энтузиастам пришлось установить мощный игровой видеоадаптер (Nvidia Titan X) и обеспечить платформу большим объёмом оперативной памяти.

Одна из самых ресурсоёмких игр, требующая высокой производительности от процессора, Civilization Beyond Earth в разрешении FullHD и на максимальных настройках качества способна работать на частоте 88 кадров в секунду. Это серьёзный показатель обходит продукт AMD Athlon 860K всего на 10 %).

А вот любителям игр Metro, Thief, World of Tanks и Hitman вряд ли подойдёт чип Kaveri. Добиться от игры более 50 FPS на максимальных настройках просто невозможно. Удивительно, что 6-ядерный представитель семейства AMD демонстрирует лучшие показатели (прирост производительности 40 %).

Обратная связь

Каждому будущему потенциальному покупателю всегда интересно знать, что о товаре думают люди, которые уже являются счастливыми владельцами. О процессоре AMD Athlon x4 860K достаточно много отзывов как положительных, так и негативных.

Большинство плохих отзывов связано с перегревом кристалла даже при эксплуатации с базовыми частотами. Как показывает практика, 90 % владельцев отказались пользоваться штатным кулером и обеспечили игровую систему достойной системой охлаждения. Правда, у большинства появился негатив к производителю, который знал о проблеме с перегревом и не побеспокоился оснастить свой продукт медным радиатором и мощным вентилятором.

За бесперспективность платформы выступало тоже немало пользователей, однако после анонса новых 8-ядерных кристаллов под Socket FM2 народ успокоился. Ведь компания AMD не будет создавать новые архитектуры для нерабочих платформ.

В заключение

Да, процессор AMD Athlon 860K можно смело называть игровым, даже в том случае, если продавец его позиционирует в бюджетном классе. Отличный потенциал в работе, возможность разгона и невысокая стоимость привлекают к себе внимание потенциальных покупателей. Однако перед приобретением будущему владельцу необходимо позаботиться не только о наличии мощных игровых компонентов, а и о системе охлаждения, которая сможет остудить этот мощный и горячий процессор.

Введение

Начинаем знакомство с двухъядерными процессорами для настольных компьютеров. В этом обзоре вы найдёте всё о процессоре с двумя ядрами от AMD: общую информацию, тестирование производительности, разгон и сведения о энергопотреблении и тепловыделении.

Время двухъядерных процессоров пришло. В самое ближайшее время процессоры, оснащённые двумя вычислительными ядрами, начнут активное проникновение в настольные компьютеры. К концу следующего года большинство новых PC должно быть основано именно на CPU с двумя ядрами.
Столь сильное рвение производителей по внедрению двухъядерных архитектур объясняется тем, что иные методы для наращивания производительности себя уже исчерпали. Рост тактовых частот даётся очень тяжело, а увеличение скорости шины и размера кэш-памяти не приводит к ощутимому результату.
В то же время совершенствование 90 нм технологического процесса дошло да той точки, когда производство гигантских кристаллов с площадью порядка 200 кв. мм стало рентабельным. Именно этот факт дал возможность производителям CPU начать кампанию по внедрению двухъядерных архитектур.

Итак, сегодня, 9 мая 2005 года, вслед за компанией Intel, предварительно представляет свои двухъядерные процессоры для настольных систем и компания AMD. Впрочем, как и в случае с двухъядерными процессорами Smithfield (Intel Pentium D и Intel Extreme Edition), речь о начале поставок пока не идёт, они начнутся несколько позднее. В данный момент AMD даёт нам возможность лишь предварительно познакомиться со своими перспективными предложениями.
Линейка двухъядерных процессоров от AMD получила название Athlon 64 X2. Это наименование отражает как тот факт, что новые двухъядерные CPU имеют архитектуру AMD64, так и то, что в них присутствует два вычислительных ядра. Вместе с названием, процессоры с двумя ядрами для настольных систем получили и собственный логотип:


Семейство Athlon 64 X2 на момент его появления на прилавках магазинов будет включать четыре процессора с рейтингами 4200+, 4400+, 4600+ и 4800+. Эти процессоры можно будет приобрести по цене от $500 до $1000 в зависимости от их производительности. То есть, свою линейку Athlon 64 X2 AMD ставит несколько выше обычных Athlon 64.
Однако прежде чем начинать судить о потребительских качествах новых CPU, давайте подробнее познакомимся с особенностями этих процессоров.

Архитектура Athlon 64 X2

Следует отметить, что реализация двухъядерности в процессорах AMD несколько отличается от реализации Intel. Хотя, как и Pentium D и Pentium Extreme Edition, Athlon 64 X2 по сути представляет собой два процессора Athlon 64, объединённых на одном кристалле, двухъядерный процессор от AMD предлагает несколько иной способ взаимодействия ядер между собой.
Дело в том, что подход Intel заключается в простом помещении на один кристалл двух ядер Prescott. При такой организации двухъядерности процессор не имеет никаких специальных механизмов для осуществления взаимодействия между ядрами. То есть, как и в обычных двухпроцессорных системах на базе Xeon, ядра в Smithfield общаются (например, для решения проблем с когерентностью кэшей) посредством системной шины. Соответственно, системная шина разделяется между ядрами процессора и при работе с памятью, что приводит к увеличению задержек при обращении к памяти обоих ядер одновременно.
Инженеры AMD предусмотрели возможность создания многоядерных процессоров ещё на этапе разработки архитектуры AMD64. Благодаря этому, в двухъядерных Athlon 64 X2 некоторые узкие места удалось обойти. Во-первых, дублированы в новых процессорах AMD далеко не все ресурсы. Хотя каждое из ядер Athlon 64 X2 обладает собственным набором исполнительных устройств и выделенной кэш-памятью второго уровня, контроллер памяти и контроллер шины Hyper-Transport на оба ядра общий. Взаимодействие каждого из ядер с разделяемыми ресурсами осуществляется посредством специального Crossbar-переключателя и очереди системных запросов (System Request Queue). На этом же уровне организовано и взаимодействие ядер между собой, благодаря чему вопросы когерентности кэшей решаются без дополнительной нагрузки на системную шину и шину памяти.


Таким образом, единственное узкое место, имеющееся в архитектуре Athlon 64 X2 – это пропускная способность подсистемы памяти 6.4 Гбайт в секунду, которая делится между процессорными ядрами. Впрочем, в будущем году AMD планирует перейти на использование более скоростных типов памяти, в частности двухканальной DDR2-667 SDRAM. Этот шаг должен положительно сказаться на увеличении производительности именно двухъядерных CPU.
Отсутствие поддержки современных типов памяти с высокой пропускной способностью новыми двухъядерными процессорами объясняется тем, что AMD в первую очередь стремилась сохранить совместимость Athlon 64 X2 с существующими платформами. В результате, эти процессоры могут использоваться в тех же самых материнских платах, что и обычные Athlon 64. Поэтому, Athlon 64 X2 имеют Socket 939 корпусировку, двухканальный контроллер памяти с поддержкой DDR400 SDRAM и работают с шиной HyperTransport с частотой до 1 ГГц. Благодаря этому единственное, что требуется для поддержки двухъядерных CPU от AMD современными Socket 939 материнскими платами, – это обновление BIOS. В этой связи отдельно следует отметить, что, к счастью, инженерам AMD удалось вписать в ранее установленные рамки и энергопотребление Athlon 64 X2.

Таким образом, в части совместимости с существующей инфраструктурой двухъядерные процессоры от AMD оказались лучше конкурирующих продуктов Intel. Smithfield совместим лишь с новыми чипсетами i955X и NVIDIA nFroce4 (Intel Edition), а также предъявляет повышенные требования к конвертеру питания материнской платы.
В основе процессоров Athlon 64 X2 использованы ядра с кодовыми именами Toledo и Manchester степпинга E, то есть по своему функционалу (за исключением возможности обработки двух вычислительных потоков одновременно) новые CPU подобны Athlon 64 на базе ядер San Diego и Venice. Так, Athlon 64 X2 поддерживают набор инструкций SSE3, а также имеют усовершенствованный контроллер памяти. Среди особенностей контроллера памяти Athlon 64 X2 следует упомянуть возможность использования разномастных модулей DIMM в различных каналах (вплоть до установки в оба канала памяти модулей разного объёма) и возможность работы с четырьмя двухсторонними модулями DIMM в режиме DDR400.
Процессоры Athlon 64 X2 (Toledo), содержащие два ядра с кэш-памятью второго уровня по 1 Мбайту на каждое ядро, состоят из примерно 233.2 млн. транзисторов и имеет площадь около 199 кв. мм. Таким образом, как того и следовало ожидать, кристалл и сложность двухъядерного процессора оказывается примерно вдвое больше кристалла соответствующего одноядерного CPU.

Линейка Athlon 64 X2

Линейка процессоров Athlon 64 X2 включает в себя четыре модели CPU c рейтингами 4800+, 4600+, 4400+ и 4200+. В их основе могут использоваться ядра с кодовыми именами Toledo и Manchester. Различия между ними заключаются в размере кэш-памяти второго уровня. Процессоры с кодовым именем Toledo, которые обладают рейтингами 4800+ и 4400+, имеют два L2 кэша (на каждое из ядер) объёмом 1 Мбайт. CPU же с кодовым именем Manchester располагают вдвое меньшим объёмом кэш-памяти: два раза по 512 Кбайт.
Частоты двухъядерных процессоров AMD достаточно высоки и равны 2.2 или 2.4 ГГц. То есть, тактовая частота старшей модели двухъядерного процессора AMD соответствует частоте старшего процессора в линейке Athlon 64. Это означает, что даже в приложениях, не поддерживающих многопоточность, Athlon 64 X2 сможет демонстрировать очень хороший уровень производительности.
Что же касается электрических и тепловых характеристик, то, несмотря на достаточно высокие частоты Athlon 64 X2, они мало отличаются от соответствующих характеристик одноядерных CPU. Максимальное тепловыделение новых процессоров с двумя ядрами составляет 110 Вт против 89 Вт у обычных Athlon 64, а ток питания возрос до 80А против 57.4А. Впрочем, если сравнивать электрические характеристики Athlon 64 X2 с спецификациями Athlon 64 FX-55, то рост максимального тепловыделения составит всего лишь 6Вт, а предельный ток и вовсе не изменится. Таким образом, можно говорить о том, что процессоры Athlon 64 X2 предъявляют к конвертеру питания материнских плат примерно такие же требования, как и Athlon 64 FX-55.

Целиком характеристики линейки процессоров Athlon 64 X2 выглядят следующим образом:


Следует отметить, что AMD позиционирует Athlon 64 X2 как совершенно независимую линейку, отвечающую своим целям. Процессоры этого семейства предназначаются той группе продвинутых пользователей, для которой важна возможность использования нескольких ресурсоёмких приложений одновременно, либо применяющих в повседневной работе приложения для создания цифрового контента, большинство из которых эффективно поддерживает многопоточность. То есть, Athlon 64 X2 представляется неким аналогом Athlon 64 FX, но не для игроков, а для энтузиастов, использующих PC для работы.


При этом выпуск Athlon 64 X2 не отменяет существование остальных линеек: Athlon 64 FX, Athlon 64 и Sempron. Все они продолжат мирно сосуществовать на рынке.
Но, отдельно следует отметить тот факт, что линейки Athlon 64 X2 и Athlon 64 имеют унифицированную систему рейтингов. Это значит, что процессоры Athlon 64 с рейтингами выше 4000+ на рынке не появятся. В то же время семейство одноядерных процессоров Athlon 64 FX будет продолжать развиваться, поскольку данные CPU востребованы геймерами.
Цены Athlon 64 X2 таковы, что, судя по ним, эту линейку можно считать дальнейшим развитием обычных Athlon 64. Фактически, так оно и есть. По мере того, как старшие модели Athlon 64 будут переходить в среднюю ценовую категорию, верхние модели в этой линейке будут заменяться на Athlon 64 X2.
Появление процессоров Athlon 64 X2 в продаже ожидается в июне. Рекомендованные AMD розничные цены выглядят следующим образом:

AMD Athlon 64 X2 4800+ - $1001;
AMD Athlon 64 X2 4600+ - $803;
AMD Athlon 64 X2 4400+ - $581;
AMD Athlon 64 X2 4200+ - $537.

Athlon 64 X2 4800+: первое знакомство

Нам удалось получить на тестирование образец процессора AMD Athlon 64 X2 4800+, являющегося старшей моделью в линейке двухъядерных CPU от AMD. Данный процессор по своему внешнему виду оказался очень похож на своих прародителей. Фактически, отличается он от обычных Athlon 64 FX и Athlon 64 для Socket 939 только лишь маркировкой.


Несмотря на то, что Athlon 64 X2 – это типичный Socket 939 процессор, который должен быть совместим с большинством материнских плат с 939-контактным процессорным гнездом, на данный момент его функционирование с многими платами затруднено в виду отсутствия необходимой поддержки со стороны BIOS. Единственной материнской платой, на которой данный CPU смог заработать в двухъядерном режиме в нашей лаборатории, оказалась ASUS A8N SLI Deluxe, для которой существует специальный технологический BIOS с поддержкой Athlon 64 X2. Впрочем, очевидно, что с появлением двухъядерных процессоров AMD в широкой продаже данный недостаток будет ликвидирован.
Следует отметить, что без необходимой поддержки со стороны BIOS, Athlon 64 X2 в любой материнской плате превосходно работает в одноядерном режиме. То есть, без обновлённой прошивки наш Athlon 64 X2 4800+ работал как Athlon 64 4000+.
Популярная утилита CPU-Z пока выдаёт о Athlon 64 X2 неполную информацию, хотя и распознаёт его:


Несмотря на то, что CPU-Z детектирует два ядра, вся отображаемая информация о кеш-памяти относится лишь к одному из ядер CPU.
Предваряя тесты производительности полученного процессора, в первую очередь мы решили исследовать его тепловые и электрические характеристики. Для начала мы сравнили температуру Athlon 64 X2 4800+ с температурой других Socket 939 процессоров. Для этих опытов мы применяли единый воздушный кулер AVC Z7U7414001; прогрев процессоров осуществлялся утилитой S&M 1.6.0, которая оказалась совместима с двухъядерным Athlon 64 X2.


В состоянии покоя температура Athlon 64 X2 оказывается несколько выше температуры процессоров Athlon 64 на ядре Venice. Однако, несмотря на наличие в нём двух ядер, этот CPU не горячее чем одноядерные процессоры, производимые по 130 нм технологическому процессу. Причём, такая же картина наблюдается и при максимальной нагрузке CPU работой. Температура Athlon 64 X2 при 100-процентной загрузке оказывается меньше температуры Athlon 64 и Athlon 64 FX, в которых используются 130 нм ядра. Таким образом, благодаря пониженному напряжению питания и использованию ядра ревизии E инженерам AMD действительно удалось добиться приемлемого тепловыделения своих двухъядерных процессоров.
Исследуя энергопотребление Athlon 64 X2, мы решили сравнить его не только с соответствующей характеристикой одноядерных Socket 939 CPU, но и с энергопотреблением старших процессоров Intel.


Как это ни покажется удивительным, но энергопотребление Athlon 64 X2 4800+ оказывается ниже энергопотребления Athlon 64 FX-55. Объясняется это тем, что в основе Athlon 64 FX-55 лежит старое 130 нм ядро, так что в этом нет ничего странного. Основной же вывод заключается в другом: те материнские платы, которые были совместимы с Athlon 64 FX-55, способны (с точки зрения мощности конвертера питания) поддерживать и новые двухъядерные процессоры AMD. То есть, AMD совершенно права, говоря о том, что вся необходимая для внедрения Athlon 64 X2 инфраструктура уже практически готова.

Естественно, мы не упустили и возможность проверки разгонного потенциала Athlon 64 X2 4800+. К сожалению, технологический BIOS для ASUS A8N-SLI Deluxe, поддерживающий Athlon 64 X2, не позволяет изменять ни напряжение на CPU, ни его множитель. Поэтому, эксперименты по оверклокингу выполнялись на штатном для процессора напряжении путём увеличения частоты тактового генератора.
В процессе экспериментов нам удалось увеличить частоту тактового генератора до 225 МГц, при этом процессор продолжал сохранять способность к стабильному функционированию. То есть, в результате разгона у нас получилось поднять частоту нового двухъядерного CPU от AMD до 2.7 ГГц.


Итак, при оверклокинге Athlon 64 X2 4800+ позволил увеличить свою частоту на 12.5%, что, как нам кажется, для двухъядерного CPU не так уж и плохо. По крайней мере, можно говорить о том, что частотный потенциал ядра Toledo близок к потенциалу других ядер ревизии E: San Diego, Venice и Palermo. Так что достигнутый при разгоне результат даёт нам надежду на появление ещё более скоростных процессоров в семействе Athlon 64 X2 до внедрения следующего технологического процесса.

Как мы тестировали

В рамках этого тестирования мы сравнили производительность двухъядерного процессора Athlon 64 X2 4800+ с быстродействием старших процессоров с одноядерной архитектурой. То есть, в соперниках у Athlon 64 X2 выступили Athlon 64, Athlon 64 FX, Pentium 4 и Pentium 4 Extreme Edition.
К сожалению, сегодня мы не можем представить сравнение нового двухъядерного процессора от AMD с конкурирующим решением от Intel, CPU с кодовым именем Smithfield. Однако в самое ближайшее время наши результаты тестов будут дополнены результатами Pentium D и Pentium Extreme Edition, так что следите за обновлениями.
Пока же в тестировании приняло участие несколько систем, состояли которые из перечисленного ниже набора комплектующих:

Процессоры:

AMD Athlon 64 X2 4800+ (Socket 939, 2.4 ГГц, 2 x 1024KB L2, ревизия ядра E6 - Toledo);
AMD Athlon 64 FX-55 (Socket 939, 2.6 ГГц, 1024KB L2, ревизия ядра CG - Clawhammer);
AMD Athlon 64 4000+ (Socket 939, 2.4 ГГц, 1024KB L2, ревизия ядра CG - Clawhammer);
AMD Athlon 64 3800+ (Socket 939, 2.4 ГГц, 512KB L2, ревизия ядра E3 - Venice);
Intel Pentium 4 Extreme Edition 3.73 ГГц (LGA775, 3.73 ГГц, 2MB L2);
Intel Pentium 4 660 (LGA775, 3.6 ГГц, 2MB L2);
Intel Pentium 4 570 (LGA775, 3.8 ГГц, 1MB L2);

Материнские платы:

ASUS A8N SLI Deluxe (Socket 939, NVIDIA nForce4 SLI);
NVIDIA C19 CRB Demo Board (LGA775, nForce4 SLI (Intel Edition)).

Память:

1024MB DDR400 SDRAM (Corsair CMX512-3200XLPRO, 2 x 512MB, 2-2-2-10);
1024MB DDR2-667 SDRAM (Corsair CM2X512A-5400UL, 2 x 512MB, 4-4-4-12).

Графическая карта: - PowerColor RADEON X800 XT (PCI-E x16).
Дисковая подсистема: - Maxtor MaXLine III 250GB (SATA150).
Операционная система: - Microsoft Windows XP SP2.

Производительность

Офисная работа

Для исследования производительности в офисных приложениях мы воспользовались тестами SYSmark 2004 и Business Winstone 2004.


Тест Business Winstone 2004 моделирует работу пользователя в распространённых приложениях: Microsoft Access 2002, Microsoft Excel 2002, Microsoft FrontPage 2002, Microsoft Outlook 2002, Microsoft PowerPoint 2002, Microsoft Project 2002, Microsoft Word 2002, Norton AntiVirus Professional Edition 2003 и WinZip 8.1. Полученный же результат достаточно закономерен: все эти приложения многопоточность не используют, а потому Athlon 64 X2 оказывается лишь чуть-чуть быстрее своего одноядерного аналога Athlon 64 4000+. Небольшое преимущество же объясняется скорее усовершенствованным контроллером памяти ядра Toledo, нежели наличием второго ядра.
Впрочем, в повседневной офисной работе частенько несколько приложений работает одновременно. Насколько эффективными в этом случае оказываются двухъядерные процессоры AMD, показано ниже.


В данном случае измеряется скорость работы в Microsoft Outlook и Internet Explorer, в то время как в фоновом режиме выполняется копирование файлов. Однако, как показывает приведённая диаграмма, копирование файлов – это не столь сложная задача и выигрыша двухъядерная архитектура тут не даёт.


Этот тест несколько сложнее. Здесь в фоновом режиме выполняется архивация файлов посредством Winzip, в то время как на переднем плане пользователь работает в Excel и Word. И в данном случае мы получаем вполне осязаемый дивиденд от двухъядерности. Athlon 64 X2 4800+, работающий на частоте 2.4 ГГц, обгоняет не только Athlon 64 4000+, но и одноядерный Athlon 64 FX-55 с частотой 2.6 ГГц.


По мере усложнения задач, работающих в фоновом режиме, прелести двухъядерной архитектуры начинают проявляться всё сильнее. В данном случае моделируется работа пользователя в приложениях Microsoft Excel, Microsoft Project, Microsoft Access, Microsoft PowerPoint, Microsoft FrontPage и WinZip, в то время как в фоновом режиме происходит антивирусная проверка. В данном тесте работающие приложения оказываются способными как следует загрузить оба ядра Athlon 64 X2, результат чего не заставляет себя ждать. Двухъядерный процессор поставленные задачи решает в полтора раза быстрее аналогичного одноядерного.


Здесь моделируется работа пользователя, получающего письмо в Outlook 2002, которое содержит набор документов в zip-архиве. Пока полученные файлы сканируются на вирусы при помощи VirusScan 7.0, пользователь просматривает e-mail и вносит пометки в календарь Outlook. Затем пользователь просматривает корпоративный веб-сайт и некоторые документы при помощи Internet Explorer 6.0.
Данная модель работы пользователя предусматривает использование многопоточности, поэтому Athlon 64 X2 4800+ демонстрирует более высокое быстродействие, нежели одноядерные процессоры от AMD и Intel. Заметим, что процессоры Pentium 4 с технологией «виртуальной» многопоточности Hyper-Threading не могут похвастать столь же высокой производительностью, как Athlon 64 X2, в котором находится два настоящих независимых процессорных ядра.


В данном бенчмарке гипотетический пользователь редактирует текст в Word 2002, а также использует Dragon NaturallySpeaking 6 для преобразования аудио-файла в текстовый документ. Готовый документ преобразуется в pdf-формат с использованием Acrobat 5.0.5. Затем, пользуясь сформированным документом, создается презентация в PowerPoint 2002. И в данном случае Athlon 64 X2 вновь оказывается на высоте.


Здесь модель работы такова: пользователь открывает базу данных в Access 2002 и выполняет ряд запросов. Документы архивируются с использованием WinZip 8.1. Результаты запросов экспортируются в Excel 2002, и на их основании строится диаграмма. Хотя в этом случае положительный эффект от двухъядерности также присутствует, процессоры семейства Pentium 4 справляются с такой работой несколько быстрее.
В целом, относительно оправданности использования двухъядерных процессоров в офисных приложениях можно сказать следующее. Сами по себе приложения такого типа редко оптимизированы для создания многопоточной нагрузки. Поэтому, получить выигрыш при работе в одном конкретном приложении на двухъядерном процессоре тяжело. Однако, если модель работы такова, что какие-то из ресурсоёмких задач выполняются в фоне, то процессоры с двумя ядрами могут дать весьма ощутимый прирост в быстродействии.

Создание цифрового контента

В этом разделе мы вновь воспользуемся комплексными тестами SYSmark 2004 и Multimedia Content Creation Winstone 2004.


Бенчмарк моделирует работу в следующих приложениях: Adobe Photoshop 7.0.1, Adobe Premiere 6.50, Macromedia Director MX 9.0, Macromedia Dreamweaver MX 6.1, Microsoft Windows Media Encoder 9 Version 9.00.00.2980, NewTek LightWave 3D 7.5b, Steinberg WaveLab 4.0f. Поскольку большинство приложений, предназначенных для создания и обработки цифрового контента, поддерживают многопоточность, совершенно неудивителен успех Athlon 64 X2 4800+ в данном тесте. Причём, заметим, что преимущество этого двухъядерного CPU проявляется даже тогда, когда параллельная работа в нескольких приложениях не используется.


Когда же несколько приложений работает одновременно, двухъядерные процессоры способны показать ещё более впечатляющие результаты. Например, в этом тесте в пакете 3ds max 5.1 рендерится в bmp файл изображение, и, в это же время, пользователь готовит web-страницы в Dreamweaver MX. Затем пользователь рендерит в векторном графическом формате 3D анимацию.


В этом случае моделируется работа в Premiere 6.5 пользователя, который создает видео-ролик из нескольких других роликов в raw-формате и отдельных звуковых треков. Ожидая окончания операции, пользователь готовит также изображение в Photoshop 7.01, модифицируя имеющуюся картинку и сохраняя ее на диске. После завершения создания видео-ролика, пользователь редактирует его и добавляет специальные эффекты в After Effects 5.5.
И снова мы видим гигантское преимущество двухъядерной архитектуры от AMD как над обычными Athlon 64 и Athlon 64 FX, так и над Pentium 4 с технологией «виртуальной» многоядерности Hyper-Threading.


А вот и ещё одно проявление триумфа двухъядерной архитектуры AMD. Его причины такие же, как и в предыдущем случае. Они кроются в использованной модели работы. Здесь гипотетический пользователь разархивирует контент веб-сайта из архива в zip-формате, одновременно используя Flash MX для открытия экспортированного 3D векторного графического ролика. Затем пользователь модифицирует его путем включения других картинок и оптимизирует для более быстрой анимации. Итоговый ролик со специальными эффектами сжимается с использованием Windows Media Encoder 9 для транслирования через Интернет. Затем создаваемый веб-сайт компонуется в Dreamweaver MX, а параллельно система сканируется на вирусы с использованием VirusScan 7.0.
Таким образом, необходимо признать, что для приложений, работающих с цифровым контентом, двухъядерная архитектура очень выгодна. Практически любые задачи такого типа умеют эффективно загружать оба ядра CPU одновременно, что приводит к сильному увеличению скорости работы системы.

PCMark04, 3DMark 2001 SE, 3DMark05

Отдельно мы решили посмотреть на скорость Athlon 64 X2 в популярных синтетических бенчмарках от FutureMark.






Как мы уже неоднократно отмечали ранее, тест PCMark04 оптимизирован для многопоточных систем. Именно поэтому процессоры Pentium 4 с технологией Hyper-Threading показывали в нём лучшие результаты, нежели CPU семейства Athlon 64. Однако, теперь ситуация сменилась. Два настоящих ядра в Athlon 64 X2 4800+ позволили этому процессору оказаться наверху диаграммы.






Графические тесты семейства 3DMark многопоточность не поддерживают ни в каком виде. Поэтому, результаты Athlon 64 X2 здесь мало отличаются от показателей обычных Athlon 64 с частотой 2.4 ГГц. Небольшое преимущество же над Athlon 64 4000+ объясняется наличием в ядре Toledo усовершенствованного контроллера памяти, а над Athlon 64 3800+ - большим объёмом кеш-памяти.
Впрочем, в составе 3DMark05 есть пара тестов, которые могут задействовать многопоточность. Это – тесты CPU. В этих бенчмарках на центральный процессор возлагается нагрузка по программной эмуляции вершинных шейдеров, а, кроме того, вторым потоком, выполняется обсчёт физики игровой среды.






Результаты вполне закономерны. Если приложение в состоянии задействовать два ядра, то двухъядерные процессоры работают намного быстрее одноядерных.

Игровые приложения















К сожалению, современные игровые приложения многопоточность не поддерживают. Несмотря на то, что технология «виртуальной» многоядерности Hyper-Threading появилась очень давно, разработчики игр не спешат делить вычисления, производимые игровым движком, на несколько потоков. И дело, скорее всего, не в том, что для игр это сделать тяжело. По всей видимости, рост вычислительных возможностей процессора для игр не так уж и важен, поскольку основная нагрузка в задачах этого типа ложится на видеокарту.
Впрочем, появление на рынке двухъядерных CPU даёт некоторую надежду на то, что производители игр станут сильнее нагружать центральный процессор расчётами. Результатом этого может явиться появление нового поколения игр с продвинутым искусственным интеллектом и реалистичной физикой.

Пока же в применении двухъядерных CPU в игровых системах никакого смысла нет. Поэтому, кстати, AMD не собирается прекращать развитие своей линейки процессоров ориентированной специально на геймеров, Athlon 64 FX. Эти процессоры характеризуются более высокими таковыми частотами и наличием единственного вычислительного ядра.

Сжатие информации


К сожалению, WinRAR не поддерживает многопоточность, поэтому результат Athlon 64 X2 4800+ практически не отличается от результата обычного Athlon 64 4000+.


Однако существуют архиваторы, которые могут эффективно задействовать двухъядерность. Например, 7zip. При тестировании в нём результаты Athlon 64 X2 4800+ вполне оправдывают стоимость этого процессора.

Кодирование аудио и видео


Популярный mp3 кодек Lame до недавнего времени многопоточность не поддерживал. Однако вновь появившаяся версия 3.97 alpha 2 этот недостаток исправила. В результате, процессоры Pentium 4 стали кодировать аудио быстрее, чем Athlon 64, а Athlon 64 X2 4800+, хотя и обгоняет своих одноядерных собратьев, всё же несколько отстаёт от старших моделей семейства Pentium 4 и Pentium 4 Extreme Edition.


Хотя кодек Mainconcept может задействовать два вычислительных ядра, скорость Athlon 64 X2 оказывается не на много выше быстродействия, демонстрируемого одноядерными собратьями. Причём, отчасти это преимущество объясняется не только двухъядерной архитектурой, но и поддержкой команд SSE3, а также усовершенствованным контроллером памяти. В результате, Pentium 4 с одним ядром в Mainconcept работают заметно быстрее, чем Athlon 64 X2 4800+.


При кодировании MPEG-4 популярным кодеком DiVX, картина складывается совершенно иная. Athlon 64 X2, благодаря наличию второго ядра, получает хорошую прибавку к скорости, которая позволяет ему обойти даже старшие модели Pentium 4.


Кодек XviD также поддерживает многопоточность, однако добавление второго ядра в этом случае даёт гораздо меньший прирост в скорости, чем в эпизоде с DiVX.


Очевидно, что из кодеков Windows Media Encoder оптимизирован для многоядерных архитектур лучше всего. Например, Athlon 64 X2 4800+ справляется с кодированием с использованием этого кодека в 1.7 раз быстрее, чем одноядерный Athlon 64 4000+, работающий на аналогичной тактовой частоте. В результате, говорить о каком бы то ни было соперничестве одноядерных и двухъядерных процессоров в WME просто бессмысленно.
Как и приложения для обработки цифрового контента, подавляющее большинство кодеков уже давно оптимизировано для Hyper-Threading. В результате, и двухъядерные процессоры, позволяющие выполнять два вычислительных потока одновременно, выполняют кодирование быстрее, чем одноядерные. То есть, использование систем с CPU с двумя ядрами для кодирования аудио и видео контента вполне оправдано.

Редактирование изображений и видео









Популярные продукты Adobe для обработки видео и редактирования изображений хорошо оптимизированы под многопроцессорные системы и Hyper-Threading. Поэтому, в Photoshop, After Effects и Premiere двухъядерный процессор от AMD демонстрирует чрезвычайно высокую производительность, значительно превышающую быстродействие не только Athlon 64 FX-55, но и более быстрых в задачах этого класса процессоров Pentium 4.

Распознавание текста


Достаточно популярная программа для оптического распознавания текстов ABBYY Finereader, хотя и имеет оптимизацию для процессоров с технологией Hyper-Threading, на Athlon 64 X2 работает только лишь одним потоком. Налицо ошибка программистов, которые детектируют возможность распараллеливания вычислений по наименованию процессора.
К сожалению, подобные примеры неправильного программирования встречаются и в наши дни. Будем надеяться, что на сегодня число приложений, подобных ABBYY Finereader, минимально, а в ближайшем будущем их количество сократится до нуля.

Математические вычисления






Как это не покажется странным, но популярные математические пакеты MATLAB и Mathematica в варианте для операционной системы Windows XP многопоточность не поддерживают. Поэтому, в этих задачах Athlon 64 X2 4800+ выступает примерно на одном уровне с Athlon 64 4000+, опережая его лишь за счёт лучше оптимизированного контроллера памяти.


Зато многие задачи математического моделирования позволяют организовать распараллеливание вычислений, которое даёт неплохой прирост производительности в случае использования двухъядерных CPU. Это и подтверждается тестом ScienceMark.

3D-рендеринг






Финальный рендеринг относится к задачам, которые могут легко и эффективно быть распараллелены. Поэтому, совершенно неудивительно, что применение при работе в 3ds max процессора Athlon 64 X2, оснащённого двумя вычислительными ядрами, позволяет получить очень неплохой прирост в быстродействии.






Аналогичная картина наблюдается и в Lightwave. Таким образом, использование двухъядерных процессоров при финальном рендеринге не менее выгодно, чем и в приложениях для обработки изображений и видео.

Общие впечатления

Перед тем, как сформулировать общие выводы по итогам нашего тестирования, пару слов следует сказать и о том, что осталось за кадром. А именно о комфорте использования систем, оснащённых двухъядерными процессорами. Дело в том, что в системе с одним одноядерным процессором, например, Athlon 64, в каждый момент времени может исполняться лишь один вычислительный поток. Это значит, что если в системе работает несколько приложений одновременно, то планировщик OC вынужден с большой частотой переключать процессорные ресурсы между задачами.

За счёт того, что современные процессоры очень быстры, переключение между задачами обычно остаётся незаметным на взгляд пользователя. Однако существуют и приложения, прервать которые для передачи процессорного времени другим задачам в очереди достаточно сложно. В этом случае операционная система начинает подтормаживать, что нередко вызывает раздражение у человека, сидящего за компьютером. Также, нередко можно наблюдать и ситуацию, когда приложение, забрав ресурсы процессора, «зависает», и такое приложение бывает очень тяжело снять с выполнения, поскольку оно не отдаёт процессорные ресурсы даже планировщику операционной системы.

Подобные проблемы возникают в системах, оснащённых двухъядерными процессорами, на порядок реже. Дело в том, процессоры с двумя ядрами способны выполнять одновременно два вычислительных потока, соответственно, для функционирования планировщика появляется в два раза больше свободных ресурсов, которые можно разделять между работающими приложениями. Фактически, для того, чтобы работа в системе с двухъядерным процессором стала некомфортной, необходимо одновременное пересечение двух процессов, пытающихся захватить в безраздельное пользование все ресурсы CPU.

В заключение мы решили провести небольшой эксперимент, показывающий, как влияет на производительность системы с одноядерным и двухъядерным процессором параллельное исполнение большого количества ресурсоёмких приложений. Для этого мы измеряли число fps в Half-Life 2, запуская в фоне несколько копий архиватора WinRAR.


Как видим, при использовании в системе процессора Athlon 64 X2 4800+, производительность в Half-Life 2 остаётся на приемлемом уровне гораздо дольше, нежели в системе с одноядерным, но более высокочастотным процессором Athlon 64 FX-55. Фактически, в системе с одноядерным процессором запуск одного фонового приложения уже приводит к двукратному падению скорости. При дальнейшем увеличении числа задач, работающих в фоне, производительность падает до неприличного уровня.
В системе же с двухъядерным процессором сохранять высокую производительность приложения, работающего на переднем плане, удаётся гораздо дольше. Запуск одной копии WinRAR проходит практически незамеченным, добавление большего числа фоновых приложений, хотя и оказывает влияние на задачу переднего плана, приводит к гораздо меньшему снижению производительности. Следует заметить, что падение скорости в данном случае вызвано не столько нехваткой процессорных ресурсов, сколько разделением ограниченной по пропускной способности шины памяти между работающими приложениями. То есть, если фоновые задачи не будут активно работать с памятью, приложение переднего плана вряд ли сильно будет реагировать на увеличение фоновой нагрузки.

Выводы

Сегодня состоялось наше первое знакомство с двухъядерными процессорами от AMD. Как показали проведённые испытания, идея объединения двух ядер в одном процессоре продемонстрировала свою состоятельность на практике.
Использование двухъядерных процессоров в настольных системах, способно значительно увеличить скорость работы целого ряда приложений, эффективно использующих многопоточность. Ввиду того, что технология виртуальной многопоточности, Hyper-Threading присутствует в процессорах семейства Pentium 4 уже очень продолжительно время, разработчики программного обеспечения к настоящему времени предлагают достаточно большое число программ, способных получить выигрыш от двухъядерной архитектуры CPU. Так, среди приложений, скорость работы которых на двухъядерных процессорах будет увеличена, следует отметить утилиты для кодирования видео и аудио, системы 3D моделирования и рендеринга, программы для редактирования фото и видео, а также профессиональные графические приложения класса САПР.
При этом существует и большое количество программного обеспечения, которое многопоточность не использует или использует её крайне ограниченно. Среди ярких представителей таких программ – офисные приложения, веб-браузеры, почтовые клиенты, медиа-проигрыватели, а также игры. Однако даже при работе в таких приложениях двухъядерная архитектура CPU способна оказать положительное влияние. Например, в тех случаях, когда несколько приложений выполняется одновременно.
Резюмируя вышесказанное, на графике ниже мы просто приводим численное выражение преимущества двухъядерного процессора Athlon 64 X2 4800+ над одноядерным Athlon 64 4000+, работающим на той же частоте 2.4 ГГц.


Как видно по графику, Athlon 64 X2 4800+ оказывается во многих приложениях значительно быстрее старшего CPU в семействе Athlon 64. И, если бы не баснословно высокая стоимость Athlon 64 X2 4800+, превышающая $1000, то этот CPU смело можно было бы назвать весьма выгодным приобретением. Тем более что ни в одном приложении он не отстаёт от своих одноядерных собратьев.
Учитывая же цену Athlon 64 X2, следует признать, что на сегодня эти процессоры наравне с Athlon 64 FX могут являться разве только ещё одним предложением для обеспеченных энтузиастов. Те из них, для кого в первую очередь важна не игровая производительность, а скорость работы в других приложениях, обратят внимание на линейку Athlon 64 X2. Экстремальные же геймеры, очевидно, останутся приверженцами Athlon 64 FX.

Рассмотрение двухъядерных процессоров на нашем сайте на этом не заканчивается. В ближайшие дни ждите второй части эпопеи, в которой речь пойдёт о двухъядерных CPU от Intel.

Длительное время Advanced Micro Devices, подобно Cyrix, производила центральные процессоры 286, 386 и 486, которые были основаны на разработках Intel. К5 был первым независимо созданным х86 процессором, на который AMD возлагала большие надежды.

Однако, покупка компанией AMD основанного в Калифорнии конкурента весной 1996 года, кажется, создала возможность лучше подготовиться к своей следующей атаке на Intel. К6 начал жизнь как Nx686, будучи переименованным после приобретения NextGen. Серия ММХ-совместимых процессоров К6 была запущена в середине 1997 года, за несколько недель до Cyrix 6х86МХ, и сразу была одобрена пользователями.

Изготовленный по 5-слойной 0.35-мкм технологии, К6 был почти на 20 % меньше, чем Pentium Pro и при этом содержал на 3.3 миллионов транзисторов больше (8.8 против 5.5 миллионов). Большинство этих дополнительных транзисторов находилось в кэше первого уровня на 64 Кбайт (на кэш команд 32 Кбайт и на кэш данных 32 Кбайт). Это равносильно четырем Pentium Pro или двум Pentium ММХ и Pentium 2.

Центральный процессор К6 поддерживал технологию ММХ Intel, включая 57 новых х86 команд, разработанных для развития мультимедийного программного обеспечения. Как и Pentium Pro, К6 был многим обязан классическим технологиям RISC. Используя суперскалярную микроархитектуру AMD RISC86, чип декодировал каждую х86-инструкцию в ряд более простых действий, которые могли быть обработаны, используя типичные принципы RISC - такие, как выполнение вне естественного порядка, переименование регистров, предсказание переходов, спекулятивное исполнение, опережающая выборка данных.

Центральный процессор К6 начинал с версий 166.200 и 233 МГц. Уровень его производительности был очень схож с Pentium Pro соответствующих частот с его максимальным 512 Кбайт кэшем второго уровня. Общее с чипом Cyrix MX (но в несколько меньшей степени) - работа с плавающей запятой - была областью относительной слабости по сравнению с Pentium Pro или Pentium 2. Однако проникновению процессора на рынок в конце 1997 - начале 1998 года препятствовали проблемы, которые возникли у AMD при перемещении ее нового производственного 0.25-мкм процесса из лабораторий на заводы-изготовители. Это привело к падению производства центральных процессоров на 200 и 233 МГц, задержке введения чипа 266 МГц и отмене чипа 300 МГц.

Процессор AMD К6-2

Процессоры AMD К6-2 с 9.3 миллионами транзисторов производились по 0.25-микронной технологии AMD. Процессор был упакован в 100 МГц Sирег7-совместимую, 321-контактную керамическую плату (ceramic pin grid array (CPGA) package).

K6-2 включает инновационную эффективную микроархитектуру RISC86, большой (64 Кбайт) кэш первого уровня (двухпортовый кэш данных на 32 Кбайт, кэш команд на 32 Кбайт с дополнительным предрасшифровывающим кэшем на 20 Кбайт), а также улучшенный модуль работы с плавающей запятой. Эффективная производительность при его запуске в середине 1998 года была оценена в 300 МГц, к началу 1999 года самым быстрым из доступных процессоров была версия 450 МГц.

Трехмерные возможности К6-2 представляли другое важное достижение. Они были воплощены в AMD технологии 3DNow!, как новый набор из 21 команды, который дополнял стандартные команды ММХ, уже включенные в архитектуру К6, что ускоряло обработку трехмерных приложений.

Процессор AMD K6-3

В феврале 1999 года AMD объявила о начале выпуска партии 400 МГц AMD К6-lll процессора под кодовым названием «Sharptooth» и опробовала 450 МГц версию. Ключевой особенностью этого нового процессора была инновационная разработка - «Трехуровневый кэш».

Традиционно процессоры персональных компьютеров использовали два уровня кэша:

  • кэш первого уровня (L1), который обычно расположен на кристалле;
  • кэш второго уровня (L2), который мог располагаться либо вне центрального процессора, на материнской плате или слоте, либо непосредственно на чипе центрального процессора.

Общее эмпирическое правило при проектировании подсистемы кэша - чем больше и быстрее кэш, тем выше производительность (ядро центрального процессора может быстрее получить доступ к инструкциям и данным).

Признавая выгоды большого и быстрого кэша в удовлетворении потребностей приложений, все более требовательных к производительности персональные компьютеры, «Трехуровневый кэш» компании AMD вводил архитектурные новшества кэша, разработанные для увеличения производительности персонального компьютера на основе платформы Super7:

  • внутренний L2-кэш (256 Кбайт), работающий на полной скорости процессора AMD-K6-3 и дополняющий кэш L1 (64 Кбайт), который был стандартен для всего семейства процессоров AMD-K6;
  • многопортовый внутренний кэш, позволяющий одновременное 64-битовое чтение и запись как кэшу L1, так и L2;
  • первичную процессорную шину (100 МГц), обеспечивающую соединение с резидентной кэш памятью на системной плате, расширяемой от 512 до 2048 Кбайт.

Таблица основных характеристик процессоров AMD

Тип процессора Архитектура Год выпуска Кодовое наименование Количество транзисторов, млн Ядро, мм L1 -кэш, Кбайт L2-кэш, Кбайт
AMD K5 K5 1996 SSA/5 4.3 271-161 8+16 Внешн.
1996 Godot 4.3 181 8+16 Внешн.
AMD К6 К6 1997 Nx686 (Model 6) 8.8 162 32+32 Внешн.
1998 Little Foot 8.8 88 32+32 Внешн.
K6-2 1998-2001 Chompers 9.3 81 64 Внешн.
К6 3 1999 Sharptooth 21.3 118 64 256
Athlon К7 1999 Argon 22.0 184 128 512
2000 Pluto 22.0 102 128 512
2000-2001 Thunderbird 37.0 120 64+64 256
Duron 2000-2001 Spitfire 25.0 100 64(|) + 64(D) 64-128
2001-2002 Morgan 25.18 106 128 64
2003 Applebred 37.2 85 128 64
Athlon ХР/МР 2001-2002 Palomino 37.5 130 128 256
2002 Thoroughbred 37.2 85 128 256
2003-2004 Barton 54.3 101 64+64 512
Sempron К7 2004 Thorton 54.3 101 128 256
2004 Thoroubred 37.2 85 128 256
2005 Winchester 68.5 84 128 128
Sempron К7 2005 Palermo 68-75 84 64+64 128-256
2006 Manila 103 81 128 128-256
Athlon 64 К8 2003-2004 Clawhammer 105.9 193 128 512-1024
2004 Newcastle 68.5 144 128 512
2004 Winchester 68.5 84 128 512
2005 Venice 76 84 128 512
2005 San Diego 114 115 128 512-1024
2006 Orleans 129 125 128 512
2006 Manchester 154 147 128 512
Opteron 2003 Sledgehammer 64+64 1024
2005 Venus, Troy, Athens 64+64 1024
Athlon 64 x 2 2-ядерные 2005 Manchester 154 147 128 x 2 512 x 2
2005 Toledo 233 199 128 x 2 512 x 2
2006 Windsor 243 220 128 x 2 512 x 2
2006 Brisbane 153.6 183 128 x 2 1024 x 2
Тип процессора Архитектура Размер минимальной структуры, мкм Тактовая частота шины, МГц Тактовая частота процессора, МГц Потребляемая мощность, Вт Интерфейс
AMD K5 K5 0.5-0.35 50-66 75-100 11-15 Socket 5/7
0.35 60-66 90-115 12-16 Socket 5/7
AMD К6 К6 0.35 CMOS 66 166-300 13-28 Socket 7
0.25 66 200-300 13-28 Socket 7
K6-2 0.25 66-100 266-550 15-30 Super7(321 p)
К6 3 0.25 100 400-450 18-30 Super7
Athlon К7 0.25 200 500-700 36-54 Slot A(575 p)
0.18 200 550-950 31-62 Slot A
0.18 200 700-1.4 ГГц 38-72 Socket A/Slot A
Duron 0.18 200 600-950 27-41 Socket A (Socket 462)
0.18 200 900-1.3 ГГц 44-60 S 462
0.13 266 1.4-1.8 57 S 462
Athlon ХР/МР 0.18 266 1.4-1.7 62-72 Socket 462
0.13 266 1.4-2.25 49-74 S 462
0.13 266-400 1.86-2.33 66-77 Socket A
Sempron К7 0.13 333 1.5-2.0 62 S 754/S 939
0.13 333 1.5-2.0 62 S462
0.09 400 1.6 62 S 754
Sempron К7 0.09 400 1.6-1.8 59-64.0 Socket А/ Socket 754
0.09 400 1.6-2.0 35-62 AM2
Athlon 64 К8 0.13 400 1.8-2.4 89 S 754
0.09 400 1.6-2.4 89 S754
0.09 400 1.8-2.2 67 S 939
0.09 400 2.0-2.4 16-89 S 754
0.09 400 2.2 89 S 939
0.09 400 1.8-2.4 35-62 AM2
0.09 400 2.0-2.2 67 S 939
Opteron 0.13 800/НТ 1.4-2.4 55-95 S 940
0.09 1000/НТ 1.6-3.0 55-95 S 940
Athlon 64 x 2 2-ядерные 0.09 667-800 2.0-2.4 69-110 S939
0.09 2.0-2.4 89-110 S 939
0.09 2.0-2.6 65-89 AM2
0.09 2.0-2.8 65-89 AM2

Проект многопортового внутреннего кэша процессора AMD-K6-3 позволил как кэшу L1 (64 Кбайт), так и кэшу L2 (256 Кбайт) выполнять одновременное 64-битовое чтение и запись операций за один такт процессора. В дополнение к этому многопортовому проекту кэша ядро процессора AMD-K6-I11 было в состоянии получить доступ к кэшам L1 и L2 одновременно, что увеличивало общую пропускную способность центрального процессора.

Процессор AMD Athlon

Выпуск процессора Athlon летом 1999 года был наиболее удачным ходом AMD. Это позволило им гордиться тем, что они произвели первый процессор седьмого поколения (у него было достаточно много радикальных архитектурных отличий от Pentium ll/lll и К6-3, чтобы заслужить название процессора следующего поколения), и это означало также, что они вырвали технологическое лидерство у Intel.

Древнегреческое слово Athlon означает «трофей», или «игры». Athlon - процессор, с помощью которого AMD надеялась увеличить реальное конкурентоспособное присутствие в корпоративном секторе, помимо его традиционного преимущества на потребительском рынке и рынке трехмерных игр. Ядро размещается на кристалле в 102 квадратных миллиметров и содержит приблизительно 22 миллиона транзисторов.

Основные элементы ядра Athlon

Многократные декодеры

Три полных декодера переводят х86-команды в макрооперации (MacroOPs) с фиксированной длиной для более высокой пропускной способности команд и увеличения мощности обработки. Вместо того чтобы выполнять х86 команды с длиной 1-15 байтов, процессор Athlon выполняет макрооперации фиксированной длины.

Блок контроля команд

Как только макрооперация расшифрована, за цикл посылаются до трех макроопераций блоку управления инструкциями (ICU). Это буфер перенаправления макроопераций с 72 входами (ROB), который управляет выполнением каждой макрооперации в целом, осуществляет переименование регистра для операндов, управляет любыми условиями исключения и действиями команды. ICU посылает макрооперацию планировщику исполнения.

Конвейеры исполнения

Athlon содержит 18-разрядный планировщик макроопераций и 36-разрядный планировщик операций мультимедиа и ПТ. Эти планировщики распределяют MacroOPs по девяти независимым конвейерам - три для вычислений с ФТ, три для вычисления адресов и три для выполнения команд ММХ, 3DNow! и операций ПТ для х87.

Супер скалярный блок плавающей точки FPT

Предыдущие центральные процессоры AMD были недостаточно производительными при работе с ПТ по сравнению с Intel. К этому недостатку более чем ответственно отнеслись в Athlon, который характеризуется суперскалярной архитектурой, включающей три конвейера выполнения команд с ПТ вне естественного порядка - FMUL (перемножение с ПТ), FADD (сложение с ПТ) и FSTORE (запись с ПТ). «Суперскалярность» означает способность центрального процессора выполнять более одной команды за такт процессора. Athlon же может выполнять одну операцию над 32-битовым числом с ПТ за такт процессора, что дает производительность в 2.4 Гфлопс при частоте в 600 МГц.

Прогнозирование переходов

Процессор Athlon предлагает сложную динамическую логику прогнозирования ветвления, чтобы минимизировать или устранить задержки из-за команд перехода, широко распространенные в программном обеспечении х86.

Системная шина

Системная шина Athlon - первая системная шина на 200 МГц для х86-платформ. Основанная на протоколе Digital Alpha EV6, первичная шина (FSB) - потенциально расширяемая до 400 МГц и более и, в отличие от разделяемой шины SMP (Symmetric Multi-Processing) проекта Pentium 3, использует архитектуру «точка-точка», чтобы обеспечить широкую полосу пропускания для одно- и многопроцессорных х86 платформ.

Архитектура кэша

Архитектура кэша Athlon существенно превосходит обычные центральные процессоры шестого поколения - полноценный кэш первого уровня 128 Кбайт, в 4 раза больший, чем у Pentium 3, и быстродействующий 64-битовый контроллер вторичного кэша 2-го уровня, поддерживающий от 512 Кбайт до 8 Мбайт.

Расширенный 3D Now

В ответ на Streaming SIMD Extensions (Intel Pentium 3) реализация 3DNow! в Athlon была модернизирована добавлением 24 новых команд к исходной 21 инструкции 3DNow!

Athlon был первоначально доступен в диапазонах скорости 500.550 и 600 МГц и 650 МГц немного позднее (все изготовлены по 0.25-мкм технологии). К концу 1999 года AMD еще более повысила частоту: его ядро К75 (750 МГц) является первым процессором, построенным с использованием алюминиевой 6-слойной технологии 0.18-мкм компании AMD.

Утверждение о том, что это был самый быстрый х86 совместимый центральный процессора тысячелетия, спорно, поскольку Intel быстро ответила объявлением 800 МГц Pentium 3. Однако AMD вскоре вернула лидерство в 2000 году выпуском версий на 800 и 850 МГц и преуспела в опережении Intel в преодолении барьера 1 ГГц буквально через несколько недель.

Процессор Thunderbird

В середине 2000 года была выпущена улучшенная версия Athlon с кодовым названием «Thunderbird».

Технология 0.18-мкм, кэш память 2-го уровня (L2) размером в 256 Кбайт расположена на плате процессора и работает на полной частоте процессора (первые процессоры Athlon имели кэш L2, работавшую на меньших частотах, например при частоте в 1 ГГЦ, память L2 работала на 330 МГц).

Интерфейсы - 462-контактный Socket А и Slot А. Частоты от 0.75 до 1 ГГц. Размещение 256 Кбайт памяти на кристалле привело к увеличению его размера до 120 квадратных миллиметров (102 квадратных миллиметров для ядра). Однако он меньше исходного (0.25-micron) К7 Athlon, который занимает 184 квадратных миллиметров. Добавление 256 Кбайт к L2-кэшу на кристалле весьма увеличивает число транзисторов. Центральный процессор Thunderbird включает 37 миллионов транзисторов, то есть 15 миллионов добавились для размещения кэша L2.

Осенью 2000 года был выпущен чипсет AMD760, обеспечивающий поддержку для памяти DDR SDRAM РС1600 (200 МГц FSB) и РС2100 (266 МГц FSB). Другие особенности - AGP 4-х, 4 порта USB , адресация памяти 8 Гбайт на 4 DIMM и поддержка АТА-100. С этого момента процессоры Athlon выпускались только для разъемов Socket А. Последние из процессоров Athlon/Thunderbird были выпущены летом 2001 года, достигнув частоты 1.4 ГГц.

Процессор Duron

В середине 2000 года был выпущен процессор Duron, предназначенный для дома и офиса. Название происходит от латинского «durare» - «вечный», «длительный». Кэш-память L1 (128 Кбайт) и L2 (64 Кбайт) размещается на плате. Первичная системная шина работает на частоте 200 МГц. Поддерживается улучшенная технология 3DNow! Технология 0.18-мкм, частоты 600.650 и 700 МГц. Интерфейс - 462-контактный разъем Socket А.

Процессор Palomino (Athlon ХР - EXtra Performance)

Процессор выполнен по 0.18-мкм технологии с использованием медных проводников на плате (вместо алюминия), содержит 37.5 миллионов транзисторов на кристалле в 128 квадратных миллиметров. Достигнуто понижение на 20 % энергопотребления сравнительно с Thunderbird. Введен ряд новшеств, в совокупности именуемых AMD как «QuantiSpeed Architecture»:

  • введение дополнительного буфера - буфера быстрого преобразования адреса (БПА, TLB - Processor`s Transition Lookaside Buffer). Это дополнительная кэш память, расположенная между L1 и L2. В частности, TLB содержит данные, которые используются для перевода виртуальных адресов в физические и наоборот;
  • поддержка SSE технологии Intel. В Palomino добавлены еще 52 новые команды SIMD по отношению к ранее имевшимся. Удвоено количество исходных 21 SIMD-команд, реализующих «3DNow!», и получена технология «Enhanced 3DNow!» («3DNow! Professional»);
  • использование технологии упаковки OPGA (organic PGA) для замещения CPGA (ceramic PGA), которая использовалась ранее. Использование пластмасс вместо керамики технологичнее, платы оказываются легче и обладают лучшими тепловыми свойствами. Кроме того, можно плотнее размещать навесные элементы, что уменьшает наводки и помехи. OPGA размещаются на уже известном разъеме Socket А.

Процессор Morgan

Morgan первоначально представлял собой ядро Palomino c удаленными 3/4 кэша L2 (64 Кбайт вместо 256 Кбайт). Размер кристалла - 106 квадратных миллиметров, число транзисторов - 25.18 миллионов. Напряжение питания было изменено с 1.6 до 1.75 В.

Процессор Thoroughbred

Летом 2002 года AMD начала поставлять первый процессор с 0.13-мкм технологией и медными соединениями. Площадь кристалла - 80 квадратных миллиметров (у его предшественников - 128 квадратных миллиметров). Питание - 1.65 В, размеры кэша на кристалле - 128 Кбайт для L1 и 256 Кбайт для L2, разъем - Socket А. Эквивалентная производительность Athlon ХР - 2400+ или 2600+.

Однако ядро Thoroughbred рассматривать как простую переделку Palomino с учетом новых норм технологического процесса все же не совсем верно. Thoroughbred по своей внутренней структуре значительно отличается от Palomino, в чем можно убедиться по микроснимкам процессорных ядер.

  • а - Palomino.
  • б - Thoroughbred.

Процессор Sempron

Летом 2004 года AMD объявила о выходе центрального процессора семейства Sempron. Первоначально задуманный как преемник успешного центрального процессора Duron и прямой конкурент процессору Celeron D (Intel, 90 нм), диапазон применения Sempron фактически перекрыл диапазон Athlon AMD ХР и поставил фирмы, выпускающие настольные и мобильные персональные компьютеры, перед выбором - либо Sempron, либо Athlon 64.

Все первые центральные процессоры базировались на 130 нанометровой технологии AMD. Наиболее мощные образцы (3100+) выпускаются в формате интерфейса Socket 754 (Athlon 64 - в формате Socket 939). Другие участники семейства - от 2 ГГц (2800+) до 1.5 ГГц (2200+) - используют Socket А.

В дальнейшем Sempron предполагается перевести на 90 нанометровую технологию и интерфейс Socket 939.

Архитектура процессора К8

Эта архитектура используется во всех современных серверных, настольных и мобильных процессорах AMD (Opteron, Athlon 64 и Athlon 64 Х2). Первым из процессоров К8 являлся Hammer (середина 2000 года).

Одним из главных новшеств К8 является 64-разрядная архитектура х86-64 ISA. Примером 64-разрядных процессоров (IA-64) является Intel Itanium. Однако между 64-разрядными архитектурами процессоров Itanium и К8 мало общего. Itanium - процессор, несовместимый с системой команд х86, тогда как К8, напротив, таковым является.

Стратегия AMD на 64 бита (х86-64) заключается в следующем - за основу взято производительное х86-ядро и расширен набор инструкций для возможности адресации 64-битового пространства памяти. Особенности архитектуры х86-64 (AMD64):

  • обратная совместимость с инструкциями х86;
  • 8 новых 64-битовых РОН плюс 64-битовые версии прежних 8 РОН х86 (доступны лишь в 64-битовом «длинном» режиме);
  • поддержка SSE и SSE2 помимо восьми новых регистров SSE2;
  • увеличен объем адресуемой памяти для приложений, работающих с большими объемами данных (доступно лишь в «длинном» режиме);
  • высокая производительность 32-битовых приложений плюс поддержка появляющихся 64-битовых приложений, хороший вариант переходного процессора.

Таблица режимов процессоров К8

Режим Подрежим Назначение Адресуемая память, Гбайт Операционная система Примечания
«Преемственности» (Legacy Mode) Нет Работа со всеми 16- или 32-бито-выми х86-прило-жениями 4 32-раз-рядная Используются только 32 разряда в 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется
«Длинный» (Long Mode) Полный (64 разряда) Работа с 64-разрядными приложениями (инструкции х86-64) Более 4 64-разрядная Используются 64-разрядные основные и дополнительные регистры. Требуется перекомпиляция старых программ
Совместимости (Compatibility Mode) Запуск 32-разрядных программ в 64-разрядной операционной системы 2 в 32-битовой операционной системе. 4 в 64-битовой операционной системе Используются только 32 разряда е 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется

Основные недостатки:

  • процессор продолжает поддерживать архитектуру х86, которая достаточно устарела;
  • новые РОН можно использовать лишь в 64-битовом режиме, что не позволяет повысить производительность 32-битовых приложений посредством улучшения архитектуры системы команд.

Для реализации возможности работы как с 32-битовыми, так и с 64-битовыми приложениями процессоры К8 поддерживают два режима работы - Long Mode и Legacy Mode. В режиме Long Mode также предусмотрено два подрежима - 64-битовый и Compability mode (режим совместимости).

Некоторые прочие особенности К8

  • контроллер памяти интегрирован в сам процессор. Традиционно он располагается в «северном мосте» чипсета на системной плате. Собственно, контроллер памяти - это основной функциональный блок «северного моста» (в чипсетах Intel его так и называют - МСН, Memory Controller Hub); встроенный порт («линк») шины HyperTransport - универсальной шины межчипового соединения. В процессорах К8 Opteron может быть до 3-4 линков НТ, что позволяет комбинировать их в кластерные структуры

  • архитектура К8 разработана с перспективой создания многоядерных процессоров и многопроцессорных систем: если центральные процессоры Intel Хеоn может продемонстрировать лишь 11 процентов увеличения производительности при переходе к двум процессорам, то в случае с Opteron оно составляет 24 процента;
  • усовершенствован блок предсказания переходов - для увеличения точности он содержит историю 16 000 переходов, а также 2000 адресов назначения.

Исполнение инструкций на конвейере К8 начинается с блока выборки инструкций. За один такт блок выбирает из кэша 16 байт данных и выделяет из них от одной до трех инструкций х86 - сколько в выбранных данных поместилось. Поскольку средняя длина команды х86 составляет 5-6 байт, то, как правило, блоку удается выбрать три команды за такт.

На втором такте конвейера выбранные команды распределяются по трем блокам декодирования инструкций. Самые сложные команды отправляются в декодер сложных команд (VectorPath), другие - в декодеры простых команд (DirectPath).

Исходные х86-инструкции на завершающих этапах работы декодера К7/К8 переводятся в макрооперации, или МакОПы (mOPs). Большинству х86-инструкций соответствует одна МакОП, некоторые преобразуются в 2 или 3, а наиболее сложные, например деление или тригонометрические, - в последовательность из нескольких десятков МакОП. Макрооперации имеют фиксированную длину и регулярную структуру.

Условно можно считать что в определенный момент МакОп может «расщепляться» на две микрооперации (МкОП). Как правило, в К7 и в К8 МакОП содержит две МкОП - одну для АЛУ (ALU) (или блока ПЗ - FPU), другую - для УВА (устройства вычисления адреса, AGU - Address Generation Unit).

За счет конвейеризации возможны ситуации, когда одновременно в разных блоках процессора будут выполняться до двух десятков команд - и в К7, и в К8 имеется десять исполнительных устройств - три ALU, три FPU, три AGU и отдельный блок умножения.

Подобно тому, как объединение двух отдельных МкОП в одну МакОП дает явные преимущества, точно так же дела обстоят и с самими МакОП - практически везде они выступают не в виде самостоятельных единиц, а в виде группы. Группу образуют три МакОП, которые одновременно запускаются на параллельные каналы.

Вся дальнейшая работа идет не с одиночными, а с «тройками» МакОП («линиями», line). Такая «линия», с точки зрения центрального управляющего блока процессора - ICU (Instruction Control Unit) воспринимается как единое целое: все основные действия выполняются именно над «линиями», в первую очередь выделение внутренних ресурсов.

Сгенерированные «линии» от декодеров по одной за такт поступают в блок управления командами - Instructions Control Unit (ICU), где подготовленные к исполнению линии накапливаются в специальной очереди (24 линии).

Из очереди в 24 линии по три МакОП в каждой ICU выбирает в наиболее удобной для исполнения последовательности (одна-три МакОП) и пересылает их либо на АЛУ, либо на блок ПЗ в зависимости от типа микрооперации. В случае АЛУ микрооперации сразу же попадают в очередь планировщика (шесть элементов по три МакОП), который подготавливает необходимые для исполнения микрооперации ресурсы, дожидается их готовности и только потом отправляет. Причем при исполнении одной МакОП на самом деле может происходить исполнение сразу двух действий (МкОП).

Процессор Athlon 64х2

AMD снова оказалась впереди Intel, продемонстрировав действующий экспериментальный образец двухъядерного процессора летом 2004 года и поэтому Intel вызвала всеобщее удивление, все же выйдя первой на рынок с двухъядерным процессором весной 2005 года Однако, мало того, что AMD 64 Х2 был только короткое время позади Pentium Extreme Edition и Pentium D по датам выхода на рынок, он значительно опережал их по показателям эффективности.

Athlon 64 Х2 включает все возможности, заложенные в единственном ядре Athlon 64 (такие, как HyperTransport и Enhanced Virus Protection - EVP). Когда центральный процессор работает под операционной системой Windows ХР (SP2), EVP интерпретирует области системной памяти как «только данные», так что любой находящийся здесь фрагмент кода может быть либо прочитан, либо записан, но не может быть выполнен как код программы. Тем самым EVP действует как профилактическая мера против обычных злонамеренных вирусов, локализуя и обезвреживая их.

Основная архитектура ядра Х2 по существу та же, как и у Athlon 64. Различие в том, что новые чипы, размещаемые на единственном кристалле в 199 квадратных миллиметров, причем каждый содержит более чем 233 миллиона транзисторов, изготовлены по 90 нанометровой технологии AMD.

Таким образом, спецификации первоначально объявленного диапазона Athlon 64 Х2 были эквивалентны таковым из существующих центральных процессоров на 3500+, 3700+, 3800+ и 4000+ с изменением кэша L2 и тактовой частоты. Модели с 512 Кбайт кэша на ядре базируются на двойном ядре «Winchecter», в то время как версии версии кэша L2 на 1 Мбайт используют дизайн «Toledo». К лету 2005 года диапазон был расширен с появлением нового чипа (3800 +).

С появлением микроархитектуры Zen стратегия AMD на процессорном рынке стала базироваться на очень простом принципе: компания старается обеспечивать лучшие характеристики (в первую очередь по числу ядер и поддерживаемых потоков) по более выгодной цене. Семейства Ryzen 7, Ryzen 5 и Ryzen 3 при таком подходе оказались более дешёвыми альтернативами для Core i7, i5 и i3, и именно это во многом обеспечивает их популярность у покупателей. Но несмотря на то, что цена - это один из самых важных аргументов в продвижении процессоров AMD, совсем дешёвых Socket AM4-процессоров в ассортименте у этого производителя до недавних пор не существовало. Для тех покупателей, которые не располагали как минимум 100-долларовым бюджетом, выделенным на покупку CPU, AMD могла лишь предложить старые процессоры для Socket FM2+ семейств и либо ещё более старые процессоры AMD FX класса Piledriver. Но привлекательность таких предложений в современных условиях вызывает обоснованные сомнения, и это стало заметной проблемой.

Данная проблема дополнительно усугубилась тем, что компания Intel с внедрением дизайна Kaby Lake начала выпускать очень привлекательные процессоры начального уровня - двухъядерные . Такие недорогие четырёхпоточные CPU быстро завоевали признание и стали очень популярным вариантом для бюджетных конфигураций.

Тем не менее оставлять Pentium c Hyper-Threading совсем без конкуренции в начальном рыночном сегменте AMD всё же не стала. Спустя примерно полгода после их появления в продаже «красный чипмейкер» принял решение создать свою альтернативу «гиперпням» и пустить для этого в дело имевшиеся в его распоряжении четырёхъядерные чипы Bristol Ridge. Такие процессоры поставлялись AMD по OEM-каналам примерно с середины прошлого года, но летом было объявлено, что теперь для исправления ситуации в нижнем ценовом сегменте Bristol Ridge станут доступны и для розничных покупателей.

Вообще, семейство Bristol Ridge в первую очередь включает в себя гибридные процессоры A-серии с интегрированным графическим ядром Radeon (поколения Volcanic Islands). Однако для конкуренции с Pentium были спроектированы специальные модели с отключённой графикой - такие процессоры AMD отнесла к отдельному модельному ряду Athlon X4. В результате покупатели бюджетных систем с дискретными видеокартами получили выбор между двухъядерными Kaby Lake с Hyper-Threading и четырёхъядерными процессорами Bristol Ridge, которые базируются на микроархитектуре Excavator. Какой вариант лучше - мы и решили выяснить в нашем очередном материале.

Для проведения тестирования нам пришлось взять модель Athlon X4 950. Несмотря на то, что в серии Bristol Ridge компания AMD запланировала три модификации процессоров без интегрированной графики, в продаже реально доступна только эта, средняя модель. Тем не менее благодаря наличию даже одного такого процессора экосистема Socket AM4 приобрела необходимую полноту. Сегодня для этой платформы можно приобрести процессор с ценой от $51 до $499, и доступный Athlon X4 950 может стать отличным вариантом начального уровня, который со временем можно будет заметить одним из существующих Ryzen серии Summit Ridge или даже перспективным Ryzen серии Pinnacle Ridge.

⇡ Athlon X4 для Socket AM4: что нового

В теории всё выглядит достаточно неплохо. Новая версия Athlon X4 представляет собой производную от наиболее современных APU компании AMD, относящихся к поколению Bristol Ridge. Такие APU пришли на рынок мобильных решений ещё в 2016 году, а в этом году семейство расширилось за счёт чипов для настольных систем. Конструктивно Bristol Ridge можно охарактеризовать как перенос в современную экосистему. В процессе этого переноса в APU сохранились вычислительные ядра Excavator и графическое ядро класса Volcanic Islands (дискретный аналог архитектуры R9 Fury с меньшим количеством потоковых процессоров), но добавился более новый контроллер памяти, поддерживающий DDR4 SDRAM. Кроме того, архитектурно Bristol Ridge больше напоминают системы-на-чипе (SoC), что позволило вписать их в экосистему Socket AM4.

Интересующие нас представители серии Athlon X4, как и раньше, интегрированной графики лишены. Графический процессор, естественно, присутствует на полупроводниковом кристалле, но он аппаратно заблокирован, что позволяет AMD задействовать при производстве Athlon X4 кремниевую отбраковку, которая не смогла попасть в полноценные гибридные процессоры A-серии. В результате Athlon X4 представляют собой недорогие четырёхъядерники для платформы Socket AM4, которые кардинально отличаются от схожих по количеству ядер чипов Ryzen 3 своей базовой микроархитектурой. Процессорные ядра в Bristol Ridge были спроектированы в эпоху, предшествовавшую появлению архитектуры Zen, а значит, Athlon X4 для Socket AM4, как и их Socket FM2+-собратья, относятся к прямым потомкам Bulldozer.

Если конкретнее, то лежащие в основе актуального поколения APU вычислительные ядра Excavator представляют собой эволюционное развитие ядер Steamroller, которые, в свою очередь, появились в результате оптимизации Piledriver. Как говорит сама AMD, по показателю IPC (по числу выполняемых за такт инструкций) Excavator превосходит предшествующее ядро Steamroller примерно на 5-15 процентов. Прогресс достигается за счёт увеличения объёма кеш-памяти данных первого уровня до 32 Кбайт на ядро , а также благодаря полуторакратному расширению буфера адресов ветвлений, что улучшает результативность работы алгоритмов предсказания переходов. Кроме того, в Excavator добавлена поддержка 256-битных векторных инструкций из набора AVX2.

Однако не стоит переоценивать все такие дополнения, ведь они сделаны на откровенно устаревшем фундаменте. Ждать каких-то чудес производительности от Excavator явно не следует, и хорошей иллюстрацией слабости данной микроархитектуры может послужить тот факт, что во время представления первых процессоров серии Ryzen представители AMD говорили о 52-процентном превосходстве Zen над Excavator по показателю IPC. То есть при прочих равных четырёхъядерные Ryzen 3 способны обеспечить как минимум в полтора раза более высокую производительность, чем современные Athlon X4. А это значит, что между Athlon X4 для Socket AM4-систем и «полноценными» процессорами Ryzen существует колоссальный разрыв хотя бы с точки зрения эффективности базовой микроархитектуры. И этим дело не ограничивается. В бюджетных CPU компания AMD заложила ещё несколько дополнительных «ухудшений».

Одна из основных потерь, которую понёс современный Athlon X4, касается системы кеширования. В отличие от представителей серий FX или Ryzen, в процессорах этого семейства вообще нет кеш-памяти третьего уровня. Кроме того, в ядрах Excavator сократился и объём L2-кеша. Раньше в CPU такого класса на каждый двухъядерный модуль Bulldozer приходился кеш второго уровня объёмом по 2 Мбайт. Теперь он стал вдвое меньше, и четырёхъядерные Athlon X4 для Socket AM4 располагают лишь небольшим L2-кешем ёмкостью 2 Мбайт суммарно.

Серьёзные претензии вызывает и встроенный в Bristol Ridge двухканальный контроллер памяти. AMD реализовала в этих процессорах поддержку DDR4, но она совсем не такая, как в Ryzen. Bristol Ridge проектировался заметно раньше, и контроллер памяти в нём оказался намного хуже. В частности, максимальная частота поддерживаемой памяти ограничена режимом DDR4-2400, причём более высокие скорости недоступны и через разгон - для них банально не предусмотрены делители. Не впечатляет и эффективность этого контроллера. Bristol Ridge ощутимо проигрывает Ryzen в латентности подсистемы памяти и катастрофически уступает в реальной пропускной способности. Таким образом, переход на использование DDR4 производительность представителей семейства Athlon X4 только ухудшил.

Athlon X4 950 Ryzen 3 1200

Что касается встроенных в процессор элементов SoC, то и они у новых Athlon X4 тоже сильно отличаются от того, что предлагает AMD в процессорах семейства Ryzen. Самая серьёзная потеря затронула шину для взаимодействия с дискретными графическими ускорителями: для этой цели Athlon X4 предлагает лишь восемь линий PCI Express 3.0. То есть видеокарты в Socket AM4-платформах, построенных на базе таких бюджетных процессоров, будут работать «не в полную силу».

В дополнение к урезанной графической шине процессорная SoC в Bristol Ridge поддерживает две дополнительные линии PCI Express 3.0, которые могут быть конвертированы в два порта SATA, а также четыре порта USB 3.0. Расширить этот набор можно за счёт подключения внешнего южного моста, для соединения с которым в процессоре зарезервировано ещё четыре линии PCI Express 3.0. Поскольку способ взаимодействия с набором системной логики у Athlon X4 точно такой же, как и у Ryzen, процессоры поколения Bristol Ridge полностью совместимы с любыми Socket AM4-материнскими платами, включая модели, построенные на чипсетах A320, B350 и даже X370.

Скудные характеристики Athlon X4 объясняются его происхождением. Изначально дизайн Bristol Ridge был нацелен на применение в мобильных системах, поэтому многое из того, в чём нет острой необходимости в ноутбуках, пошло под нож ради оптимизации энергопотребления. И в этом есть некоторая положительная сторона: энергосберегающие технологии в Bristol Ridge сделали большой шаг вперёд, позволяя соблюдать тонкий баланс между производительностью и энергопотреблением.

Но самое важное заключается в том, что, несмотря на использование при производстве Bristol Ridge полупроводниковой технологии с разрешением 28 нм, данный процессорный дизайн получился вполне энергоэффективным. В частности, все представители десктопного семейства Bristol Ridge вписываются в 65-ваттный тепловой пакет, в том числе даже модели с графическим ядром и рабочими частотами порядка 4 ГГц. Достигается это во многом благодаря тому, что производственный партнёр AMD, компания TSMC, внедрил специальную «высокоплотную» разновидность 28-нм техпроцесса, похожую на технологию, которая применяется при выпуске GPU. В результате современные Athlon X4 смогли получить не только сравнительно невысокое тепловыделение и энергопотребление, но и конфигурируемый TDP. Номинальный тепловой пакет этих процессоров, как и у полноценных APU, установлен на уровне 65 Вт, но в случае необходимости его рамки могут быть ужесточены до 35 Вт.

⇡ Athlon X4 950 в подробностях

Когда AMD объявляла о начале розничных продаж десктопных процессоров семейства Bristol Ridge, она говорила о модельном ряде, состоящем из восьми APU A-серии и трёх процессоров Athlon X4 без встроенной графики. Новые модификации Athlon X4 должны были получить модельные номера 940, 950 и 970 и, согласно спецификации, различались бы тактовыми частотами, установленными на уровне 3,2, 3,5 и 3,8 ГГц соответственно. Однако впоследствии AMD решила отказаться от розничной реализации бюджетных Socket AM4-процессоров «широким фронтом» и ограничилась поставками лишь единичной четырёхъядерной модели Athlon X4 950.

Стоит напомнить, что в экосистеме Socket FM2+ модельный ряд процессоров Athlon X4 был весьма представителен. Он формировался из многочисленных четырёхъядерных чипов Kaveri с частотами от 3,0 до 4,0 ГГц и впоследствии получил дополнение в виде Carrizo с частотой 3,5 ГГц. При переносе Athlon X4 в более актуальную платформу Socket AM4 от былого изобилия не осталось и следа. Причём единственный Athlon X4 для Socket AM4 - это ещё и сильно «зарезанный» по характеристикам процессор. Если пытаться провести параллели между Athlon X4 950 и предшественниками для Socket FM2+, то наиболее близкой по характеристикам моделью окажется Athlon X4 845, в то время как популярные Athlon X4 860K (и более быстрые модели) родом из 2015 года новинку заметно превосходят.

Зато это позволило компании AMD установить на Athlon X4 950 очень привлекательную цену. Его официальная стоимость составляет $51, что делает данный процессор самым доступным четырёхъядерником, который вдвое дешевле младшего представителя в серии Ryzen 3. Благодаря такому предложению AMD надеется привлечь на свою сторону покупателей бюджетных систем, которые до настоящего момента ориентировались на Intel Pentium поколения Kaby Lake с поддержкой Hyper-Threading.

При этом характеристики Athlon X4 950 на фоне прочих дешёвых процессоров с возможностью исполнения четырёх потоков выглядят достаточно многообещающе:

AMD Athlon X4 950 AMD Ryzen 3 1200 Intel Pentium G4560
Кодовое имя Bristol Ridge Summit Ridge Kaby Lake
Технология производства, нм 28 14 14+
Ядра/потоки 4/4 4/4 2/4
Базовая частота, ГГц 3,5 3,1 3,5
Частота в турборежиме, ГГц 3,8 3,4 -
Технология XFR Нет +50 МГц Нет
Разгон Поддерживается Поддерживается Не поддерживается
L2-кеш 2 × 1 Мбайт 4 × 512 Кбайт 2 × 256 Кбайт
L3-кеш Нет 2 × 4 Мбайт 3 Мбайт
Поддержка памяти DDR4-2400 DDR4-2666 DDR4-2400
Линии PCI Express 3.0 для GPU 8 16 16
TDP, Вт 65 65 54
Разъём Socket AM4 Socket AM4 LGA1151 v1
Официальная цена $51 $109 $64

Основная проблема Athlon X4 950 - устаревшая микроархитектура с низкой удельной производительностью, в остальном же никаких очевидных изъянов в приведённом списке спецификаций не видно.

В диагностической программе CPU-Z характеристики Athlon X4 950 выглядят следующим образом.

Реальные рабочие частоты Athlon X4 950 оказываются немного выше номинала. В Bristol Ridge работа технологии Turbo Core привязана исключительно к показаниям встроенных в ядро датчиков температуры и потребляемой мощности и никак не зависит от того, какое количество ядер процессора реально работает, а какое находится в состоянии простоя. Поэтому, несмотря на то, что номинальная частота Athlon X4 950 - 3,5 ГГц, в большинстве случаев он работает на 3,7-3,8 ГГц. Причём активация турборежима нередко происходит даже при исполнении ресурсоёмких многопоточных программ.

В таком состоянии расчётное тепловыделение Athlon X4 950 остаётся в 65-ваттных рамках. Однако имеется возможность снизить TDP через настройки UEFI BIOS материнской платы. Минимальный уровень потребления составляет 35 Вт, что в теории может быть востребовано в случае использования такого CPU в компактных системах. В таком экономичном режиме реальная частота Athlon X4 950 оказывается ниже номинала и в ресурсоёмких приложениях плавает в интервале от 3,0 до 3,4 ГГц.

⇡ Разгон

Хотя в названии Athlon X4 950 нет литеры K, коэффициент умножения у этого процессора не зафиксирован, что открывает путь к сравнительно простому разгону. Впрочем, не стоит забывать, что процессорный дизайн Bristol Ridge пришёл в десктопы из мобильной среды, а это значит, что основанные на нём чипы оптимизированы скорее под низкое энергопотребление, чем под высокие частоты.

Поэтому вполне закономерно, что на практике разгонный потенциал Athlon X4 950 оказался достаточно скудным, и с повышением напряжения питания до 1,5 В нам удалось добиться устойчивой работы нашего экземпляра всего лишь на частоте 4,2 ГГц.

Хотя 28-нм Athlon X4 с ядрами Excavator по оверклокерскому потенциалу немного превосходит 14-нм Ryzen, которые обычно удаётся разогнать до частот порядка 4,0 ГГц, хорошим результатом такой разгон всё равно назвать невозможно. Более ранние потомки Bulldozer были способны работать на значительно более высоких частотах. Например, предшествующие Athlon X4 950 процессоры той же серии с модельными номерами из девятой сотни, предназначенные для платформы Socket FM2+ и базирующиеся на дизайне Kaveri, без особого труда брали частоты в диапазоне от 4,5 до 4,8 ГГц.

При этом максимально доступные для представителей поколения Bristol Ridge частоты ограничиваются отнюдь не тепловыделением. Температура Athlon X4 950 в разгоне остаётся сравнительно невысокой. Повышение же частоты стопорится из-за каких-то глубинных ограничений в полупроводниковой структуре, которые препятствуют безошибочной работе CPU на скоростях сильно выше номинальной.




Top