Процессор pentium 4 имеет. Процессоры

Как известно, революции в компьютерном
мире случаются все реже. Да и так ли они необходимы там, где, в общем-то, "все
хорошо", где возможности систем и продуктов с лихвой покрывают нужды большинства
современных пользователей. Это в полной мере относится и к процессорам корпорации
Intel, лидера индустрии. У компании есть полная линейка высокопроизводительных
CPU всех уровней (серверные, десктопные, мобильные), тактовые частоты давно уже
перевалили за "заоблачные" 3 GHz, продажи идут просто "на ура".
И наверное, если бы не оживившиеся конкуренты (точнее, конкурент ), то все
было бы совсем хорошо.

Но "гонка гигагерцев" не прекращается. Оставим в стороне рассмотрение вопросов вроде "Кому это нужно? " и "Насколько это востребовано? " — примем лишь как факт: чтобы удержаться на плаву, производители CPU просто вынуждены тратить силы на выпуск все более быстродействующих (или как минимум более высокочастотных ) продуктов.

Начало февраля Intel отметила представлением целой обоймы новых процессоров. Компания
выпустила сразу семь новых CPU, в числе которых:

  • Pentium 4 3,40 GHz ("старое" ядро Northwood);
  • Pentium 4 Extreme Edition 3,40 GHz;
  • целых четыре представителя новой линейки с ядром Prescott (кстати, ударение
    на первом слоге) — 3,40E, 3,20E, 3,0E и 2,80E GHz, изготовленные по 90-нанометровой
    технологии и оснащенные кэшем второго уровня объемом 1 MB.

Все эти CPU рассчитаны на шину 800 MHz и поддерживают технологию Hyper-Threading. Кроме того, Intel выпустила Pentium 4 на ядре Prescott с частотой 2,8A GHz, также изготовленный по 90-нанометровому процессу, но рассчитанный на частоту FSB 533 MHz и не поддерживающий Hyper-Threading . По информации Intel, предназначен этот процессор специально для OEM-производителей ПК в ответ на их пожелания. От себя добавим — и на радость оверклокерам, которые наверняка оценят его возможности разгона.

С выпуском новых CPU семейство Pentium 4 значительно пополнилось и сейчас выглядит так, как показано в табл. 1. Естественно, пока Intel вовсе не собирается сворачивать производство Pentium 4 на ядре Northwood с FSB 533 и 800 MHz. Кроме того, в линейке остаются и несколько моделей, рассчитанных на шину 400 MHz (пять процессоров от 2A до 2,60 GHz).

Разрабатывая 90-нанометровые технологии, которые должны обеспечить нормальное
функционирование процессоров класса Prescott, инженеры Intel вынуждены
были преодолевать серьезные препятствия. Природа этих преград состояла
не в недостаточном разрешении производственного оборудования, а в проблемах
физического характера, связанных с невозможностью изготовления столь малых
транзисторов по традиционным технологиям.

Первой проявилась утечка заряда с затвора транзистора через истончившийся
слой диэлектрика между затвором и каналом. При разрешении 90 нм он "выродился"
в барьер из четырех атомов SiO2 толщиной 1,2 нм. Появилась необходимость
в новых изолирующих материалах с более высоким значением константы диэлектрической
проницаемости (high-K dielectric). За счет большей проницаемости они позволяют
наращивать толстый (до 3 нм) изолирующий слой, не создавая при этом препятствий
для электрического поля затвора. Таковыми стали оксиды гафния и циркония.
К сожалению, они оказались несовместимы с применяемыми ныне поликристаллическими
затворами, да и фононные колебания, возникающие в диэлектрике, вызывают
снижение подвижности электронов в канале.

На границе с затвором наблюдается иное явление, выражающееся в значительном
повышении порогового уровня напряжения, необходимого для изменения состояния
проводимости канала транзистора. Решение было найдено в виде металлического
затвора. В прошлом году специалисты корпорации подобрали, наконец, два
подходящих металла, которые позволили сконструировать новые миниатюрные
NМOS- и PMOS-транзисторы. Какие именно металлы они использовали — до
сих пор держится в секрете.

Чтобы увеличить быстродействие транзисторов (оно определяется скоростью
перехода в открытое/закрытое состояние), Intel прибегла к формированию
канала из единого кристалла напряженного кремния. "Напряжение"
в данном случае означает деформирование кристаллической решетки материала.
Как оказалось, сквозь структурно нарушенный кремний как электроны (+10%
для NМOS), так и дырки (+25% для PMOS) проходят с меньшим сопротивлением.
Улучшение подвижности увеличивает максимальный ток транзистора в открытом
состоянии.

Для NМOS- и PMOS-транзисторов напряженное состояние достигается различными
методиками. В первом случае все очень просто: обычно транзистор сверху
"укрыт" слоем нитрида кремния, который выполняет функцию предохраняющей
маски, а для создания напряжения в канале толщину слоя нитрида увеличивают
вдвое. Это ведет к созданию дополнительной нагрузки на области истока
и стока и, соответственно, растягивает, деформирует канал.

PMOS-транзисторы "напрягают" по другой схеме. Сначала зоны
истока и стока вытравливают, а потом наращивают в них слой SiGe. Атомы
германия превышают по размерам атомы кремния и поэтому германиевые прослойки
всегда использовались для создания напряжения в кремнии. Однако особенность
технологии Intel заключается в том, что в данном случае сжатие кремниевого
канала происходит в продольном сечении.

Новый технологический процесс также позволил увеличить количество слоев
металлизации с шести до семи (медные соединения). Любопытно, что на производственной
линии "плечом к плечу" трудятся как литографические аппараты
нового поколения с длиной волны 193 нм, так и их предшественники с длиной
волны 248 нм. Вообще процент повторно использованной техники достиг 75,
что позволило снизить стоимость модернизации фабрик.

Особенности Prescott

В дискуссиях, предшествовавших выпуску процессора на ядре Prescott, он в шутку именовался не иначе как "Pentium 5". Собственно, именно таким был типичный ответ компьютерного профи на вопрос "Что такое Prescott?". Конечно, Intel не стала менять торговую марку, да и достаточных оснований для этого не было. Вспомним практику выпуска программного обеспечения — там смена номера версии происходит только при кардинальной переработке продукта, тогда как менее значительные изменения обозначаются дробными номерами версий. В процессорной индустрии дробные номера пока не приняты, и то, что Prescott продолжил линейку Pentium 4, как раз и является отражением того факта, что перемены носят не настолько радикальный характер.

Процессоры на ядре Prescott хоть и содержат немало новшеств и модификаций по сравнению
с Northwood, однако основаны на той же архитектуре NetBurst, имеют ту же корпусировку,
что и предыдущие Pentium 4, устанавливаются в тот же разъем Socket 478 и, в принципе,
должны работать на большинстве материнских плат, поддерживающих 800 MHz FSB и
обеспечивающих должные напряжения питания (естественно, потребуется обновление
BIOS).

Детальное изучение практических вопросов, касающихся Prescott, мы оставим для отдельного материала. А пока попробуем рассмотреть, какие изменения появились в Prescott, и понять, насколько этот процессор отличается от своего предшественника и чего можно в результате ожидать.

Основные новшества, реализованные в ядре Prescott, следующие:

  • Перевод производства кристаллов на техпроцесс 90 нм.
  • Возросшая длина конвейера (с 20 до 31 стадии).
  • Вдвое увеличенные кэши L1 (кэш данных — с 8 до 16 KB) и L2 (с 512 KB до
    1 MB).
  • Изменения в архитектуре:
    -модифицированный блок предсказания переходов;
    -усовершенствованная логика работы L1-кэша (улучшенная предварительная выборка
    данных);
    -появление новых блоков в процессоре;
    -увеличенный объем некоторых буферов.
  • Усовершенствованная технология Hyper-Threading.
  • Появление поддержки нового набора SIMD-инструкций SSE3 (13 новых команд).

Главные различия трех процессорных ядер, использовавшихся в Pentium 4, сведены в табл. 2. Число транзисторов в Prescott увеличилось более чем вдвое — на 70 млн. Из них, по грубым оценкам, порядка 30 млн. можно отнести на счет удвоившегося L2-кэша (дополнительные 512 KB, по 6 транзисторов на одну ячейку). Причем остается еще вполне солидное число, и даже по одному этому значению можно косвенно судить о масштабах произошедших в ядре изменений. Заметим, что, несмотря на такой рост числа элементов, площадь ядра не только не увеличилась, но даже уменьшилась по сравнению с Northwood.

С 90-нанометровым технологическим процессом все, в общем-то, понятно (конечно, на упрощенном, "пользовательском" уровне). Меньший размер транзисторов позволит снизить напряжение питания процессора и уменьшить рассеиваемую им мощность, а следовательно, и нагрев. Это откроет дорогу для дальнейшего увеличения тактовых частот, которое хотя и будет сопровождаться ростом тепловыделения, но "начало отсчета" для этого роста будет уже другим, несколько ниже. Отметим, что с учетом большего числа транзисторов в Prescott по сравнению с Northwood правильнее было бы говорить не об уменьшении, а о сохранении или же меньшем увеличении рассеиваемой мощности.

Удлиненный конвейер . Как видно из табл. 2, по длине конвейера Prescott (31 стадия) более чем наполовину превосходит Northwood. Что за этим кроется, вполне понятно: это не первый случай, когда Intel увеличивает длину конвейера, нацеливаясь на повышение тактовых частот — известно, что чем длиннее конвейер, тем лучше "разгоняется" процессорное ядро. В принципе, сложно сказать однозначно, так ли необходимо такое "удлинение" на текущем этапе, на частотах в районе 3,5 GHz — энтузиасты-оверклокеры разгоняли Pentium 4 (Northwood) и до более высоких значений. Но рано или поздно рост числа стадий оказался бы неизбежен — так почему бы не совместить это событие с выпуском нового ядра?

Увеличенные объемы кэшей и буферов . В принципе, этот пункт напрямую связан с предыдущим. Чтобы обеспечить работой длинный конвейер на высоких частотах, желательно иметь большего объема "подручный склад" в виде кэша для уменьшения количества простоев, при которых процессор ожидает загрузки требуемых данных из памяти. Кроме того, хорошо известно, что при прочих равных из двух процессоров с разной длиной конвейера производительнее окажется тот, у которого этот параметр меньше. При ошибках предсказания перехода процессор вынужден "сбрасывать" свой конвейер и загружать его работой по-новому. И чем большее число стадий в нем содержится, тем болезненнее оказываются подобные промахи. Полностью их исключить, конечно же, нельзя, и на одинаковых частотах Northwood и Prescott последний оказался бы менее производительным… не будь у него большего L2-кэша, во многом компенсирующего отставание. Естественно, здесь все зависит от специфики конкретных приложений, что мы и попытаемся проверить в практической части.

Как говорилось выше, в Prescott увеличен не только общий L2-кэш, но и L1-кэш данных, объем которого вырос с 8 до 16 KB. Также изменились его организация и часть логики работы — к примеру, введен механизм принудительного продвижения (force forwarding ), уменьшающий задержки в случаях, когда зависимая операция загрузки данных из кэша не может спекулятивно выполняться до завершения предшествующей операции помещения этих данных в кэш.

Кроме объемов кэшей, увеличению подверглась и емкость двух планировщиков, отвечающих за хранение микроопераций (uops ), которые используются в инструкциях x87/SSE/SSE2/SSE3. Это, в частности, позволило более эффективно находить параллелизм в мультимедиаалгоритмах и выполнять их с лучшей производительностью.

Собственно, некоторых новшеств в архитектуре Pentium 4, реализованных в Prescott, мы уже успели коснуться, поскольку они "разбросаны" по ядру процессора и затрагивают многие его блоки. Следующим важным изменением является…


Модифицированный блок предсказания переходов . Как известно, точность
работы этого блока является критически важной для обеспечения высокой производительности
современного процессора. "Просматривая" программный код, следующий за
выполняемым в настоящий момент, процессор может заранее выполнять части
данного кода — это хорошо известное спекулятивное выполнение . Если же
в программе встречается ветвление в результате условного перехода (если-то-иначе ),
то возникает вопрос о том, какую из двух веток "лучше" выполнять заранее.
Алгоритмы в Northwood действовали относительно просто: переходы назад предполагались
совершающимися, вперед — нет. Это большей частью работало для циклов,
но не для других видов переходов. В Prescott используется понятие длины
перехода : исследования показали, что если дальность перехода превышает
определенный предел, то переход с большой долей вероятности совершаться не будет
(соответственно, спекулятивно выполнять эту часть кода не нужно). Также в Prescott
введен более тщательный анализ самих условий перехода, на основании которого принимаются
решения о вероятности выполнения перехода. Кроме статических алгоритмов предсказания,
изменениям подверглись и динамические алгоритмы (кстати, новые идеи были частично
заимствованы из мобильного Pentium M).

Появление новых блоков в процессоре . Два новых блока в Prescott — это блок побитовых сдвигов и циклических сдвигов (shifter/rotator) и выделенный блок целочисленного умножения . Первый позволяет осуществлять наиболее типичные операции сдвига на одном из двух быстрых ALU, работающих на удвоенной частоте ядра CPU (в предыдущих модификациях Pentium 4 эти операции выполнялись как целочисленные и занимали несколько тактов). Для осуществления целочисленного умножения ранее задействовались ресурсы FPU, что достаточно долго — нужно было передать данные в FPU, выполнить там сравнительно медленное умножение и передать результат обратно. В Prescott для ускорения этих операций добавлен новый блок, отвечающий за такие операции умножения.

Улучшенный Hyper-Threading . Конечно, все перечисленные выше новшества введены в Prescott неспроста. По словам специалистов Intel, большинство модификаций в логике работы кэшей, очереди команд и пр. так или иначе связаны с быстродействием процессора при использовании Hyper-Threading, т. е. при одновременной работе нескольких программных потоков. В то же время на производительность "однопоточных" (single-threaded) приложений эти нововведения оказывают лишь незначительное влияние. Также в Prescott увеличился набор инструкций, которым "позволено" исполняться на процессоре параллельно (например, операция с таблицей страниц и операция с памятью, разбивающая строку кэша). Опять-таки, для однопоточных приложений невозможность совмещения подобных операций практически не сказывалась на производительности, тогда как при выполнении двух потоков такое ограничение зачастую становилось "узким местом". Другой пример — если в Northwood происходило "непопадание в кэш" (cache miss) и возникала необходимость чтения данных из оперативной памяти, следующие операции просмотра кэша откладывались до окончания этого действия. В результате одно приложение, часто "промахивающееся" мимо кэша, могло существенно затормозить работу остальных потоков. В Prescott этот конфликт легко преодолевается, операции могут выполняться параллельно. Также в Prescott была переделана логика арбитража и разделения ресурсов между потоками с целью увеличения общей производительности.

Инструкции SSE3. Как мы помним, последний раз расширение набора SIMD-инструкций
Intel провела, выпустив первый Pentium 4 (Willamette) и реализовав в нем SSE2.
Очередное расширение, получившее название SSE3 и содержащее 13 новых инструкций,
осуществлено в Prescott. Все они, за исключением трех, используют SSE-регистры
и предназначены для повышения производительности в следующих областях:

  • быстрое преобразование вещественного числа в целое (fisttp );
  • сложные арифметические вычисления (addsubps, addsubpd, movsldup, movshdup,
    movddup
    );
  • кодирование видео (lddqu );
  • обработка графики (haddps, hsubps, haddpd, hsubpd );
  • синхронизация потоков (monitor, mwait ).

Естественно, детальное рассмотрение всех новых инструкций выходит за рамки материала, эта информация приведена в соответствующем руководстве для программистов. Инструкции первых четырех категорий служат как для ускорения выполнения самих операций, так и для того, чтобы сделать их более "экономными" в смысле использования ресурсов процессора (и, следовательно, оптимизации работы Hyper-Threading и механизма спекулятивного выполнения). Программный код при этом также значительно сокращается и, что немаловажно, упрощается. Например, инструкция ускоренного преобразования вещественного числа в целое fisttp заменяет семь (!) команд традиционного кода. Даже по сравнению с инструкциями SSE2 (которые сами по себе также ускоряют выполнение кода и сокращают его объем) команды SSE3 во многих случаях дают немалую экономию. Две инструкции последней группы — monitor и mwait — позволяют приложению (точнее потоку ) сообщать процессору, что в данный момент оно не выполняет полезной работы и находится в режиме ожидания (например, записи в определенную ячейку памяти, возникновения прерывания или исключительной ситуации). Процессор при этом может переводиться в режим пониженного энергопотребления или же, при использовании Hyper-Threading, отдавать все ресурсы другому потоку. В общем, с SSE3 для программистов открываются новые возможности по оптимизации кода. Проблема здесь, как всегда в таких случаях, одна: пока новый набор инструкций не стал общепринятым стандартом, разработчикам ПО придется поддерживать две ветки кода (с SSE3 и без оной), чтобы приложения работали на всех процессорах…

Камо грядеши?..

В общем, объем новшеств, реализованных в ядре Prescott, вполне можно назвать
значительным. И хотя до "настоящего Pentium 5" он недотягивает, но к
"четырем с половиной" вполне может приблизиться. Переход от ядра Northwood
к Prescott — в принципе, эволюционный процесс, хорошо укладывающийся в общую
стратегию Intel. Постепенные изменения в архитектуре Pentium 4 хорошо видны на
схеме: архитектура модифицируется и пополняется новыми особенностями — идет последовательная
оптимизация процессора под определенный набор ПО.

Чего же можно ожидать от Prescott? Пожалуй, прежде всего (хотя это может показаться и несколько странным) — новых частот. Intel сама признает, что на равных частотах производительность Prescott и Northwood будет мало отличаться. Положительное влияние большого L2-кэша и прочих новшеств Prescott во многом "компенсируется" его значительно более длинным конвейером, который болезненно реагирует на ошибки предсказания переходов. И даже с учетом того, что блок этого самого предсказателя переходов был усовершенствован, все равно идеальным он быть не может. Главное преимущество Prescott в другом: новое ядро позволит дальше наращивать частоту — до значений, недостижимых ранее с Northwood. По планам Intel ядро Prescott рассчитано на два года, пока его не сменит следующее ядро, изготовленное по технологии 65 нм (0,065 мкм).

Поэтому выпущенный сейчас процессор на новом ядре Prescott не претендует прямо со старта на лавры чемпиона производительности и во всей красе должен проявить себя в будущем. Еще одним подтверждением тому является и позиционирование процессора: Pentium 4 на ядре Prescott рассчитан на mainstream-системы, в то время как топовым CPU был и остается Pentium 4 Extreme Edition. Кстати, хотя планка частот у процессоров Intel номинально поднялась до 3,4 GHz с выходом Prescott, но появление первых OEM-систем на базе Pentium 4 3,4 GHz на новом ядре произойдет несколько позднее в этом квартале (а ведь коммерческие поставки Prescott начаты еще в IV квартале 2003 г.).

Еще одна область, где может проявить себя Prescott (и наверняка проявит), — это работа ПО, оптимизированного под SSE3. Процесс оптимизации уже начался, и на сегодня существует как минимум пять приложений с поддержкой нового набора инструкций: MainConcept (MPEG-2/4), xMPEG, Ligos (MPEG-2/4), Real (RV9), On2 (VP5/VP6). В течение 2004 г. поддержка SSE3 должна появиться в таких пакетах, как Adobe Premiere, Pinnacle MPEG Encoder, Sony DVD Source Creator, Ulead MediaStudio и VideoStudio, всевозможные аудио- и видеокодеки и т. д. Вспоминая процесс оптимизации под SSE/SSE2, можно понять, что результаты SSE3 мы увидим, но отнюдь не сразу — опять-таки, это в определенном смысле "задел на будущее".

Ну а что же "по ту сторону линии фронта"? Главный конкурент Intel по-прежнему идет своим путем, все дальше отдаляясь от "генеральной линии". AMD продолжает наращивать "голую производительность", пока что обходясь значительно более низкими частотами. Контроллер памяти, в Athlon 64 перекочевавший из северного моста в процессор, подлил масла в огонь, обеспечив невиданную ранее скорость доступа к ОЗУ. А недавно был выпущен процессор с рейтингом 3400+ (нет, о полном соответствии продукту конкурентов по частоте никто не говорит…).

Однако Intel и AMD сейчас находятся примерно в равных ситуациях — их топовые процессоры ожидают выхода соответствующего оптимизированного ПО, чтобы проявить себя на полную мощность. Intel все больше "уходит в мультимедиа": для офисного ПО производительности Pentium 4 хватает с лихвой, и чтобы Prescott реализовал свой потенциал, нужны оптимизированные мультимедиаприложения (и/или высокие тактовые частоты, в возможности достижения которых можно не сомневаться). Стоит отметить тот факт, что переработка кодеков под SSE3 — пожалуй, не самая сложная операция, а эффект от этого сразу почувствуют все приложения, использующие такие кодеки (причем переработка самих приложений при этом совсем необязательна).

С другой стороны, в середине 2004 г. выйдет 64-разрядная версия Windows для платформы AMD64, на которой как раз и должны проявиться возможности Athlon 64. Конечно, здесь встанет обычный вопрос о наборе приложений под новую ОС, без которых система остается практически бесполезной. Но вспомним, что уже как минимум существуют те же кодеки, откомпилированные под 64-битные Athlon. Так что есть вероятность того, что в недалеком будущем и платформе AMD будет где себя показать. В общем, создается впечатление, что пока титаны просто накачивают мускулы, строят оборонительные сооружения и готовят тылы перед главным… нет, скорее, очередным сражением…

Введение

Перед началом сезона летних отпусков оба ведущих производителя процессоров, AMD и Intel, выпустили последние модели процессоров в своих современных линейках CPU, нацеленных на использование в высокопроизводительных PC. Сначала сделала последний шаг перед предстоящим качественным скачком AMD и примерно с месяц назад представила Athlon XP 3200+ , который, как предполагается, станет самым быстрым представителем семейства Athlon XP. Дальнейшие же планы AMD в этом секторе рынка связываются уже с процессором следующего поколения с x86-64 архитектурой, Athlon 64, который должен появится в сентябре этого года. Intel же выждал небольшую паузу и представил последний из Penlium 4 на 0.13-микронном ядре Northwood только сегодня. В итоге, заключительной моделью в этом семействе стал Pentium 4 с частотой 3.2 ГГц. Пауза перед выходом следующего процессора для настольных PC, основанного на новом ядре Prescott, продлится до четвертого квартала, когда Intel вновь поднимет планку быстродействия своих процессоров для настольных компьютеров благодаря росту тактовой частоты и усовершенствованной архитектуре.

Следует отметить, что за время противостояния архитектур Athlon и Pentium 4, показала себя более масштабируемой архитектура от Intel. За период существования Pentium 4, выпускаемых по различным технологическим процессам, их частота выросла уже более чем вдвое и без проблем достигла величины 3.2 ГГц при использовании обычного 0.13-микронного технологического процесса. AMD же, задержавшаяся со своими Athlon XP на отметке 2.2 ГГц, не может похвастать на настоящий момент столь же высокими частотами своих процессоров. И хотя на одинаковых частотах Athlon XP значительно превосходит по быстродействию Pentium 4, постоянно увеличивающийся разрыв в тактовых частотах сделал свое дело: Athlon XP 3200+ с частотой 2.2 ГГц назвать полноценным конкурентом Penium 4 3.2 ГГц можно лишь со значительными оговорками.

На графике ниже мы решили показать, как росли частоты процессоров семейств Pentium 4 и Athlon за последние три года:

Как видим, частота 2.2 ГГц является для AMD непреодолимым барьером, покорен который будет в лучшем случае только лишь во второй половине следующего года, когда AMD переведет свои производственные мощности на использование 90-нанометровой технологии. До этих же пор даже процессоры следующего поколения Athlon 64 будут продолжать иметь столь невысокие частоты. Смогут ли они при этом составить достойную конкуренцию Prescott – сказать трудно. Однако, похоже, AMD ждут тяжелые проблемы. Prescott, обладающий увеличенным кешем первого и второго уровня, усовершенствованной технологией Hyper-Threading и растущими частотами может стать гораздо более привлекательным предложением, нежели Athlon 64.

Что касается процессоров Pentium 4, то их масштабируемости можно только позавидовать. Частоты Pentium 4 плавно увеличиваются с самого момента выхода этих процессоров. Небольшая пауза, наблюдающаяся летом-осенью этого года, объясняется необходимостью внедрения нового технологического процесса, но она не должна повлиять на расстановку сил на процессорном рынке. Включив технологию Hyper-Threading и переведя свои процессоры на использование 800-мегагерцовой шины, Intel добился ощутимого превосходства старших моделей своих CPU над процессорами конкурента и теперь может ни о чем не беспокоиться, по крайней мере, до начала массового распространения Athlon 64.

Также на графике выше мы показали и ближайшие планы компаний AMD и Intel по выпуску новых CPU. Похоже, AMD в ближайшее время не должна питать никаких иллюзий по поводу своего положения на рынке. Борьба с Intel на равных для нее заканчивается, компания возвращается в привычную для себя роль догоняющего. Впрочем, долгосрочные прогнозы строить пока рано, посмотрим, что даст для AMD выход Athlon 64. Однако, судя по сдержанной реакции разработчиков программного обеспечения на технологию AMD64, никакой революции с выходом следующего поколения процессоров от AMD не произойдет.

Intel Pentium 4 3.2 ГГц

Новый процессор Pentium 4 3.2 ГГц, который Intel анонсировал сегодня, 23 июня, с технологической точки зрения ничего особенного собой не представляет. Это все тот же Northwood, работающий на частоте шины 800 МГц и поддерживающий технологию Hyper-Threading. То есть, по сути, процессор полностью идентичен (за исключением тактовой частоты) Pentium 4 3.0 , который был анонсирован Intel в апреле.

Процессор Pentium 4 3.2 ГГц, как и предшественники, использует ядро степпинга D1

Единственный факт, который следует отметить в связи с выходом очередного процессора Pentium 4 на ядре Northwood – это вновь возросшее тепловыделение. Теперь типичное тепловыделение Pentium 4 3.2 ГГц составляет порядка 85 Вт, а максимальное - ощутимо превышает величину 100 Вт. Именно поэтому использование грамотно спроектированных корпусов является одним из необходимых требований при эксплуатации систем на базе Pentium 4 3.2 ГГц. Одного вентилятора в корпусе теперь явно недостаточно, кроме того, необходимо следить и за тем, чтобы воздух в районе размещения процессора хорошо вентилировался. Intel также говорит и о том, что температура воздуха, окружающего процессорный радиатор, не должна превышать 42 градуса.

Ну и еще раз напомним, что представленный Pentium 4 3.2 ГГц – последний CPU от Intel для высокопроизводительных настольных систем, основанный на 0.13-микронной технологии. Следующий процессор для таких систем будет использовать уже новое ядро Prescott, изготавливаемое по 90-нанометровой технологии. Соответственно, тепловыделение будущих процессоров для настольных PC будет меньше. Следовательно, Pentium 4 3.2 ГГц так и останется рекордсменом по тепловыделению.

Официальная цена на Pentium 4 3.2 ГГц составляет $637, а это значит, что данный процессор является самым дорогим CPU для настольных компьютеров на сегодняшний день. Более того, Intel рекомендует использовать новинку с недешевыми материнскими платами на базе набора логики i875P. Однако, как мы знаем, данным требованием можно пренебречь: многие более дешевые системные платы на базе i865PE обеспечивают аналогичный уровень производительности благодаря активизации производителями технологии PAT и в наборе логики i865PE.

Как мы тестировали

Целью данного тестирования являлось выяснение того уровня производительности, который может обеспечить новый Pentium 4 3.2 ГГц по сравнению с предшественниками и старшими моделями конкурирующей линейки Athlon XP. Таким образом, в тестировании помимо Pentium 4 3.2 ГГц приняли участие Petnium 4 3.0 ГГц, Athlon XP 3200+ и Athlon XP 3000+. В качестве платформы для тестов Pentium 4 мы выбрали материнскую плату на чипсете i875P (Canterwood) с двухканальной DDR400 памятью, а тесты Athlon XP проводились при использовании материнской платы на базе наиболее производительного чипсета NVIDIA nForce 400 Ultra.

Состав тестовых систем приведен ниже:

Примечания:

  • Память во всех случаях эксплуатировалась в синхронном режиме с FSB в двухканальной конфигурации. Использовались наиболее агрессивные тайминги 2-2-2-5.
  • Тестирование выполнялось в операционной системе Windows XP SP1 с установленным пакетом DirectX 9.0a.

Производительность в офисных приложениях и приложениях для создания контента

В первую очередь по сложившейся традиции мы измерили скорость процессоров в офисных приложениях и приложениях, работающих с цифровых контентом. Для этого мы воспользовались тестовыми пакетами семейства Winstone.

В Business Winstone 2002, включающем в себя типовые офисные бизнес-приложения, на высоте оказываются процессоры семейства Athlon XP, производительность которых ощутимо превосходит скорость процессоров конкурирующего семейства. Данная ситуация достаточно привычна для этого теста и обуславливается как особенностями архитектуры Athlon XP, так и большим объемом кеш-памяти у ядра Barton, суммарная емкость которой благодаря эксклюзивности L2 достигает 640 Кбайт.

В комплексном тесте Multimedia Content Creation Winstone 2003, измеряющем скорость работы тестовых платформ в приложениях для работы с цифровым контентом, картина несколько иная. Процессоры Pentium 4, имеющие NetBurst архитектуру и обладающие высокоскоростной шиной с пропускной способностью 6.4 Гбайта в секунду оставляют старшие модели Athlon XP далеко позади.

Производительность при обработке потоковых данных

Большинство приложений, работающих с потоками данных, как известно, работает быстрее на процессорах Pentium 4. Здесь раскрываются все преимущества NetBurst архитектуры. Поэтому, результат, полученный нами в WinRAR 3.2, не должен никого удивлять. Старшие Pentium 4 значительно обгоняют по скорости сжатия информации топовые Athlon XP.

Аналогичная ситуация наблюдается и при кодировании звуковых файлов в формат mp3 кодеком LAME 3.93. Кстати, данный кодек поддерживает многопоточность, поэтому высокие результаты Pentium 4 здесь можно отнести и на счет поддержки этими CPU технологии Hyper-Threading. В итоге, Pentium 4 3.2 обгоняет старший Athlon XP с рейтингом 3200+ почти на 20%.

В данное тестирование мы включили результаты, полученные при измерении скорости кодирования AVI ролика в формат MPEG-2 одним из лучших кодеров, Canopus Procoder 1.5. Как это не удивительно, Athlon XP в данном случае показывает слегка более высокую производительность. Впрочем, отнести это, скорее всего, следует на счет высокопроизводительного блока операций с плавающей точкой, присутствующего в Athlon XP. SSE2 инструкции процессоров Pentium 4 в данном случае, как мы видим, не могут являться столь же сильной альтернативой. Правда, следует отметить, что разрыв в скорости старших моделей Athlon XP и Pentium 4 совсем небольшой.

Кодирование видео в формат MPEG-4 – еще один пример задачи, где процессоры Pentium 4 с технологией Hyper-Threading и 800-мегагерцовой шиной демонстрирует свои сильные стороны. Превосходство Pentium 4 3.2 над Athlon XP 3200+ в этом тесте составляет почти 20%.

Аналогичная ситуация наблюдается и при кодировании видео при помощи Windows Media Encoder 9: это приложение имеет оптимизацию под набор команд SSE2 и отлично приспособлено для NetBurst архитектуры. Поэтому, совершенно неудивительно, что вновь верхнюю часть диаграммы оккупировали процессоры от Intel.

Производительность в игровых приложениях

После выхода пропатченной версии 3Dmark03 результаты Pentium 4 относительно Athlon XP в этом тесте стали несколько выше. Однако расклад сил это не изменило: Pentium 4 лидировали в этом бенчмарке и ранее.

Pentium 4 подтверждает свое лидерство и в общем зачете в 3Dmark03. Правда, отрыв здесь небольшой: сказывается тот факт, что 3Dmark03 в первую очередь – это тест видеоподсистемы.

После перехода Pentium 4 на использование 800-мегагерцовой шины, Pentium 4 стали обгонять Athlon XP и в более старой версии 3Dmark2001. Причем, отрыв Pentium 4 3.2 ГГц от Athlon XP 3200+ уже достаточно существенен и составляет 6%.

В Quake3 Pentium 4 традиционно обгоняет Athlon XP, поэтому результат удивления не вызывает.

Аналогичная картина наблюдается и в игре Return to Castle Wolfenstein. Это совершенно логично, поскольку данная игра использует тот же движок Quake3.

Одно из немногих приложений, где старшей модели Athlon XP удается удержать лидерство, это – Unreal Tournament 2003. Хочется отметить, что все современные игры не имеют поддержки технологии Hyper-Threading, поэтому в играх потенциал новых Pentium 4 пока раскрывается не полностью.

А вот в Serious Sam 2 Athlon XP 3200+ больше лидером не является. С выходом нового процессора от Intel пальма первенства в этой игре переходит именно к Pentium 4 3.2 ГГц.

Новая игра Splinter Cell, хотя и основана на том же движке, что и Unreal Tournament 2003, быстрее работает на процессорах от Intel.

В целом, остается признать, что быстрейшим процессором для современных 3D игр на данный момент является Pentium 4 3.2 ГГц, обходящий Athlon XP 3200+ в большинстве игровых тестов. Ситуация меняется стремительно. Еще совсем недавно старшие Athlon XP в игровых тестах нисколько не уступали процессорам от Intel.

Производительность при 3D-рендеринге

Поскольку 3ds max 5.1, который мы использовали в данном тестировании, хорошо оптимизирован под многопоточность, Pentium 4, умеющий исполнять два потока одновременно благодаря технологии Hyper-Threading, с большим отрывом оказывается лидером. Даже старший Athlon XP 3200+ не может составить ему никакой конкуренции.

Абсолютно тоже самое можно сказать и про скорость рендеринга в Lightwave 7.5. Впрочем, в некоторых сценах, например при рендеринге Sunset, старшие модели Athlon XP смотрятся не так уж и плохо, однако такие случаи единичны.

Спорить с Pentium 4, выполняющем два потока одновременно, в задачах рендеринга для Athlon XP сложновато. К сожалению, AMD не имеет планов по внедрению технологий, подобных Hyper-Threading даже в будущих процессорах семейства Athlon 64.

Абсолютно аналогичная ситуация наблюдается и в POV-Ray 3.5.

Производительность при научных расчетах

Для тестирования скорости новых CPU от AMD при научных расчетах был использован пакет ScienceMark 2.0. Подробности об этом тесте можно получить на сайте http://www.sciencemark.org . Этот бенчмарк поддерживает многопоточность, а также все наборы SIMD-инструкций, включая MMX, 3DNow!, SSE и SSE2.

То, что в задачах математического моделирования или криптографии процессоры семейства Athlon XP показывают себя с наилучшей стороны, известно давно. Здесь мы видим еще одно подтверждение этого факта. Хотя, надо сказать, свое былое преимущество Athlon XP начинает терять. Например, в тесте Molecular Dinamics на первое место выходит уже новый Pentium 4 3.2 ГГц.

Кроме теста ScienceMark в этом разделе мы решили протестировать и скорость работы новых процессоров в клиенте российского проекта распределенных вычислений MD@home, посвященному расчету динамических свойств олигопептидов (фрагментов белков). Расчет свойств олигопептидов, возможно, сможет помочь изучению фундаментальных свойств белков, тем самым, внеся вклад в развитие науки.

Как видим, задачи молекулярной динамики новые Pentium 4 решают быстрее Athlon XP. Столь высокого результата Pentium 4 достигают благодаря своей технологии Hyper-Threading. Сам клиент MD@home, к сожалению, многопоточность не поддерживает, однако запуск двух клиентских программ в параллели на системах с процессорами с технологией Hyper-Threading позволяет ускорить процесс расчета более чем на 40%.

Выводы

Проведенное тестирование явно показывает, что на очередном этапе конкурентной борьбы Intel удалось одержать победу над AMD. Последний процессор на ядре Northwood обгоняет по своей производительности старшую и последнюю модель Athlon XP в большинстве тестов. За последнее время Intel смог значительно увеличить частоты своих CPU, увеличить частоту их шины, а также внедрить хитрую технологию Hyper-Threading, дающую дополнительный прирост скорости в ряде задач. AMD же, не имея возможности наращивать тактовые частоты своих процессоров ввиду технологических и архитектурных сложностей, не смогла адекватно усилить свои CPU. Не поправило положение даже появление нового ядра Barton: последние модели Pentium 4 оказываются явно сильнее старших Athlon XP. В результате, Pentium 4 3.2 ГГц вполне можно считать наиболее производительным CPU для настольных систем в настоящее время. Такая ситуация продлится по меньшей мере до сентября, когда AMD, наконец, должна будет анонсировать свои новые процессоры семейства Athlon 64.

Необходимо отметить и тот факт, что рейтинговая система, используемая в настоящее время AMD для маркировки своих процессоров, не может больше являться критерием, по которому Athlon XP можно сопоставлять с Pentium 4. Улучшения, которые произошли с Pentium 4, в числе которых следует отметить перевод этих CPU на 800-мегагерцовую шину и внедрение технологии Hyper-Threading, привели к тому, что Pentium 4 с частотой, равной рейтингу соответствующего Athlon XP, оказывается явно быстрее.

В общем, мы с интересом будем ожидать осени, когда и AMD и Intel представят свои новые разработки, Prescott и Athlon 64, которые, возможно, смогут обострить конкурентную борьбу между давними соперниками на процессорном рынке. Сейчас же AMD оказывается оттеснена Intel в сектор недорогих процессоров где, впрочем, эта компания чувствует себя превосходно: Celeron по сравнению с Athlon XP – откровенно слабый соперник.

Серия процессоров Intel Pentium 4 является наиболее удачной, если сравнивать с другими модификациями разработчика, так как на протяжении многих лет работы было доказано право на ее существование. В представленной статье можно узнать о том, чем отличаются данные процессоры, ознакомиться с их техническими характеристиками.


Благодаря результатам проведенного тестирования и отзывам можно определиться с выбором.

Гонка за частотами

Поколения процессоров постоянно сменяются одно за другим за счет гонке разработчиков за частотами. Конечно, появились и новые технологии, однако были не на первом плане. Таким образом, не только пользователи, но и производители прекрасно понимали, что в один прекрасный день будет достигнута эффективная частота процессора. Это произошло после выхода в свет четвёртого поколения Intel Pentium.

Частота функционирования одного ядра в 4 GHz стала пределом. Это произошло по той причине, что кристаллу для работы необходимо было много электроэнергии. Таким образом, рассеиваемая мощность в форме колоссального тепловыделения поставила под сомнение функционирование всей системы. Дальнейшие модификации процессоров Intel и аналоги соперников стали производиться в районе 4 ГГц. Следует также упомянуть про технологии, в которых использовалось нескольких ядер, а также о внедрении специальных инструкций, способных оптимизировать работу по обработке данных.

Первый блин комом

В области высоких технологий монополия на рынке не привела ни к чему хорошему. Это подтверждают многочисленные производители электроники, которые смогли убедиться в этом на собственном опыте. Но компании Intel и Rambus приняли решение хорошо заработать. В результате был выпущен совместный продукт, подающий большие надежды. Таким образом, свет увидел первый процессор Intel Pentium 4, работающий на Socket 423 и на достаточно высокой скорости общался с оперативной памятью Rambus. В результате многие пользователи захотели стать обладателями этого быстрого компьютера. Правда, эти две компании так и не стали монополистами на рынке.

Этому стало помехой открытие двухканального режима памяти. Результаты проведенного тестирования показали высокий прирост производительности. Таким образом, новой технологией сразу заинтересовались все разработчики компьютерных комплектующих. А Что касается первого процессора Pentium 4, он и сокет 423 стали историей, так как производителем не была обеспечена платформа возможностью модернизации. На сегодняшний день комплектующие под данную платформу являются востребованными. Оказывается, несколько государственных предприятий закупили сверхбыстрые компьютеры. Таким образом, замена комплектующих несколько дешевле полного апгрейда.

Шаг в правильном направлении

Большинство обладателей персональных компьютеров, играющих в игры и предпочитающих работать с документацией и смотреть мультимедиа контент, имеют установленный Intel Pentium 4 (Socket 478). Многие тесты, которые были проведены профессионалами и энтузиастами, свидетельствуют о том, что мощности этой платформы вполне хватает для выполнения всех задач, поставленных перед рядовым пользователем. Такая платформа задействует две модификации ядер:

Willamette;
Prescott.

Их характеристики свидетельствуют о том, что отличия между двумя процессорами небольшие. Последняя модификация предусматривает поддержку 13 новых инструкций, предназначенных для оптимизации данных, которые получили краткое название SSE3. Частотный диапазон функционирования кристаллов пребывает в промежутке 1,4-3,4 ГГц, что вполне удовлетворяет требования рынка. Разработчик пошел на риск и ввел дополнительную ветку процессоров под сокет 478. Данные устройства должны были привлечь внимание ценителей игр и оверлокеров. Новая серия стала называться Intel Pentium 4 CPU Extreme Edition.

Плюсы и минусы 478 сокета

Отзывы ИТ-специалистов свидетельствуют о том, что процессор Intel Pentium 4, который функционирует на платформе 478 сокета, до сих пор считается востребованным. Далеко не каждый пользователь может позволить себе модернизацию, требующую покупки трёх базовых комплектующих. Стоит отметить, что для решения многих задач, предназначенных для улучшения производительности всей системы, стоит просто установить более мощный кристалл. Хорошо, что вторичный рынок ими переполнен, так как процессор долговечнее даже материнской платы.

Если разрабатывать апгрейд, первостепенное внимание следует уделить наиболее мощным представителям этой категории Extreme Edition, которые сегодня показывают высокие результаты при проведении проверки на производительность. В качестве минусов процессоров под Socket 478 стоит выделить рассеиваемую мощность, требующую достойного охлаждения. Таким образом, к расходам пользователя добавляется и потребность покупки достойного кулера.

Процессоры по низкой стоимости

Наверняка, многие пользователи сталкивались с моделями процессоров Intel Pentium 4, представленными на рынке. Они имеют в маркировке надпись Celeron. Данные устройства являются младшей линейкой агрегатов, которые обладают меньшей мощностью благодаря уменьшению инструкций, а также отключения блоков внутренней памяти микропроцессора (кэш). Intel Celeron предусмотрен для пользователей, которым важна в первую очередь стоимость компьютера, а не его производительность. Многие владельцы подобных устройств высказывают мнение, что младшая линейка процессоров считается отбраковкой в ходе производства кристаллов Intel Pentium 4.

Это предположение возникло на рынке в 1999 году, когда некоторые энтузиасты доказали, что Pentium 2 и его младшая модель Celeron представляют собой один и тот же процессор. Правда, за прошлые годы ситуация сильно изменилась. Теперь разработчик обладает отдельной линией по выпуску сравнительно дешевого устройства, предназначенного для нетребовательных покупателей. Кроме того, стоит помнить о том, что существует еще конкурент AMD, претендующий на вытеснение компании Intel с рынка. Таким образом, все ценовые ниши должны быть заняты высококачественной продукцией.

Новый виток эволюции

Большинство специалистов, работающих в области компьютерных технологий, имеют мнение, что именно возникновение на рынке процессора Intel Pentium 4 Prescott ознаменовало начало эпохи устройств с несколькими ядрами, а также завершило гонку за гигагерцами. С внедрением новых технологий разработчику потребовалось перейти на сокет 775, который и позволил раскрыть потенциал персональных компьютеров в работе с программами и динамическими играми, нуждающимися в больших объемах ресурсов.

Данные статистики свидетельствуют о том, что более 50% всех устройств, существующих на планете, способны работать на легендарном разъёме Socket 775, представленном компанией Intel. Выход процессора Intel Pentium D вызвал ажиотаж на рынке, так как у разработчика на одном ядре получалось запустить два потока инструкций, создавая тем самым прообраз двухъядерного устройства.

Данная технологи стала называться Hyper-threading. На сегодняшний день она является передовым решением в процессе производства кристаллов, обладающих высокой мощностью. Не стала останавливаться на достигнутом компания Intel и презентовала технологии Dual Core, Core 2 Duo и Core 2 Quad, имеющие на аппаратном уровне по несколько микропроцессоров на одном кристалле.

Двуликие процессоры

Если взять ориентир на критерий «цена-качество», то в преимуществе оказываются процессоры, имеющие два ядра. Они отличаются такими важными характеристиками, как низкая себестоимость и высокая производительность. Микропроцессоры Intel Pentium Dual Core и Core 2 Duo считаются наиболее продаваемыми в мире. Основное отличие заключается в том, что последний обладает двумя физическими ядрами, работающими независимо друг от друга. Что касается процессора Dual Core, он выполнен в виде двух контроллеров, установленных на одном кристалле, совместная работа которых неразрывно связана между собой.

Правда, частотный диапазон устройств, обладающих двумя ядрами, слегка занижен и находится в промежутке 2-2,66 ГГц. Основная проблема заключается в рассеиваемой мощности кристалла. Он довольно сильно нагревается на повышенных частотах. В качестве примера можно привести восьмую линейку Intel Pentium D (D820-D840). Они первыми получили два раздельных ядра, а также рабочие частоты, превышающие 3 ГГц. Потребляемая мощность данных процессоров достигает около 130 Вт.

Перебор с четырьмя ядрами

Усовершенствованные устройства, имеющие четыре ядра ядрами Intel(R) Pentium(R) 4 были рассчитаны на потребителей, которые стремятся приобрести комплектующие с запасом на будущее. Но рынок программного обеспечения вдруг остановился. Таким образом, разработка, тестирование, а также внедрение приложений осуществляется для оборудования, которые имеют одно или два ядра максимум. Что же делать с системами, которые обладают 6, 8 и более микропроцессорами?

Это обыкновенный маркетинговый ход, который ориентирован на потенциальных покупателей, желающих приобрести компьютер или ноутбук самой высокой мощности, существующей в мире. Можно провести аналогию с мегапикселями на фотоаппарате – лучшим оказывается не тот, на котором написано 20 Мп, а устройство с большей матрицей и фокусным расстоянием. В процессорах значение имеет набор инструкций, обрабатывающиеся программным кодом приложения. Они и выдают результат пользователю.

Таким образом, программисты должны оптимизировать этот ход, чтобы микропроцессор его без проблем и с высокой скоростью мог обработать. Стоит отметить, что слабых компьютеров на рынке много, поэтому производителям становится выгодно разрабатывать нересурсоёмкие программы. Из этого можно сделать вывод, что большая мощность компьютера на этом этапе эволюции не требуется.

Советы по модернизации

Обладателям процессора Intel Pentium 4 (775 сокет), которые хотят провести модернизацию с минимальными затратами, рекомендуется посмотреть в сторону вторичного рынка. Сначала необходимо ознакомиться с техническими характеристиками материнской платы, установленной в системе. Совершить это легко на официальном сайте разработчика. Там следует найти раздел «поддержка процессоров». Затем в средствах массовой информации нужно отыскать таблицу производительности процессоров, а после этого сравнить ее с характеристиками материнской платы, отобрав несколько оптимальных вариантов. Также необходимо изучить отзывы по выбранным устройствам.

Затем предлагается приступить к поиску требуемого процессора, который уже был в употреблении. Для большинства платформ, где осуществляется поддержка работы микропроцессоров с четырьмя ядрами, желательно устанавливать Intel Core Quad 6600. Когда система способна работать лишь с двухъядерными кристаллами, следует найти серверный вариант Intel Xeon или инструмент, предназначенный для оверлокера Intel Extreme Edition. Их цена на рынке пребывает в промежутке 800-1000 рублей, что значительно дешевле любого апгрейда.

Рынок мобильных устройств

Кроме стационарных компьютеров, процессоры Intel Pentium 4 могут быть установлены на ноутбуки. Для этого разработчики предусмотрели отдельную линейку, которая в собственной маркировке содержала букву «М». Что касается характеристик мобильных процессоров, они были аналогичны стационарным компьютерам. Правда, наблюдался заниженный частотный диапазон. Таким образом, наибольшей мощностью среди процессоров для ноутбуков обладает Pentium 4M 2,66 ГГц. Хотя, с развитием платформ в мобильных версиях настолько все напутано, что даже сам разработчик Intel до сегодняшнего дня не предоставил дерево развития процессоров на собственном официальном сайте.

С применением 478-контактной платформы в ноутбуках компания изменяла только технологию обработки процессорного кода. Как результат, на одном сокете получается развести множество процессоров. Наибольшей популярностью, о чем свидетельствуют данные статистики, пользуется кристалл Intel Pentium Dual Core. Стоит отметить, что он является самым дешёвым устройством в производстве, а его рассеиваемая мощность достаточно мала, если сравнивать с аналогами.

Гонка за энергосбережением

Следует заметить, что для компьютеров потребляемая процессором мощность не считается критичной для системы. В ситуации с ноутбуком дело обстоит несколько иначе. В данном случае устройства Intel Pentium 4 вытеснены менее энергозависимыми микропроцессорами. Если пользователь ознакомится с тестами мобильных процессоров, он сможет убедиться, что по производительности старый Core 2 Quad, входящий в линейку Pentium 4, не особо отстаёт от современного кристалла Core i5. Что касается энергопотребления последнего, оно в 3,5 раза меньше. Таким образом, различие отражается на автономности работы устройства. Если проследить за рынком мобильных процессоров, легко определить, что разработчик снова вернулся к технологиям, которые были популярны в прошлом десятилетии.

Новые "весенние" процессоры продолжают радовать нас своим появлением. На этот раз отличилась компания Intel, представившая на украинском рынке сразу два топовых процессора Pentium 4 c частотой 3,4 GHz, однако построенных на различных ядрах — Northwood и Prescott соответственно. Надеемся, данный обзор поможет определиться с тем, что же способны дать пользователю такие похожие и вместе с тем настолько разные CPU.
На сей раз мы решили не делать громоздкий материал, тем более что совсем недавно
уже рассматривали детально предыдущие поколения этих процессоров с частотами 3,2
GHz. С особенностями ядра Northwood наверняка знакомо большинство читателей нашего
издания, следовательно, изменения в производительности при переходе на новую частоту
3,4 GHz можно просчитать даже на калькуляторе, имея необходимую базу предыдущих
результатов тестирования. Но конструктив процессора несколько обновился. Основное
(внешнее) изменение коснулось элементов питания самого кристалла. Как известно,
на тыльной стороне процессорной подложки расположены навесные элементы (в основном
шунтирующие конденсаторы). Так вот, если раньше в 200 (800) MHz серии Northwood
их количество и расположение было одинаковым, то модель 3,4 GHz кардинально отличается
от своих предшественников. Его подложка как две капли воды похожа на Pentium 4
Extreme Edition. Почти двукратное увеличение числа конденсаторов наверняка вызвано
желанием уменьшить всплески и уровень помех, возникающих в цепях питания процессора.
Как оказалось, данные метаморфозы положительно сказались на разгонном потенциале,
но об этом позже.

Prescott также отметился, но в данном случае изменения касаются исключительно
программной части. С технической точки зрения отличий новой модели с частотой
3,4 GHz от 3,2 нам обнаружить не удалось. Так что же это за изменения, которые
позволят новым массовым CPU от Intel показать себя во всей красе?

Конфигурации
тестовых систем
Платформа
Intel
AMD
Процессор Intel Pentium 4 (Prescott) 3,2/3,4E GHz Intel Pentium 4 (Northwood) 3,4C GHz AMD Athlon 64 3400+ 2,2 GHz
Материнская плата Abit IC7-MAX3 (чипсет i875P) ASUS K8V Deluxe (чипсет VIA K8T800)
Память Kingston HyperX PC3500 (2?512
MB)
Видеокарта HIS Radeon 9800XT 256 MB
Жесткий диск Western Digital WD300BB 30
GB 7200 об/мин
ОС Windows XP Professional SP2

Экосистема процессорного ядра Prescott

Пожалуй, одно из значимых достижений
последнего времени — корректное "понимание" Prescott операционной
системой Windows XP с установленным Service Pack 2. До официального выхода этого
"апгрейда" рано говорить о возможных преимуществах и новом уровне
управления технологией Hyper-Threading, но сама тенденция все-таки положительная.
Также в ходе тестирования нами была замечена еще одна интересная особенность
— материнские платы, для которых есть новые версии BIOS с заявленной 100%-ной
совместимостью с ядром Prescott, демонстрируют весьма необычное поведение. Действительно,
после перепрошивки скорость работы с памятью существенно возрастает, а ее латентность
несколько снижается (напомним, в случае установки CPU Prescott). Но если в плату
с новым BIOS установить Northwood, быстродействие подсистемы памяти хоть и незначительно,
но все же упадет. Выводов из всего этого пока два: а) если вы владелец Pentium
4 серий B/C, не спешите обновлять BIOS на своей материнской плате; б) пока рано
говорить о "нюансах" BIOS как о сложившейся закономерности, но тот
факт, что три популярные модели материнских плат все же демонстрируют такой
результат, по крайней мере, заставляет задуматься.

Также отметим медленное внедрение поддержки SSE3 в современное мультимедийное
ПО. Обещанные драйверы от ATI и NVidia пока не появились, а авторы медиакодеков
пока не спешат использовать преимущества SSE3 в своих продуктах. Хотя в Японии
— стране, так любящей высокие технологии, — новый набор команд уже достаточно
интенсивно применяется "национальным" ПО. Нам даже удалось найти результаты
тестирования, где сообщалось о 10%-ном приросте производительности в случае
медиакодирования. Опять-таки, когда "реальность" SSE3 дойдет до нас
— еще неизвестно. Но тот факт, что, по крайней мере, это будет "в плюс",
а не "в минус", уже радует.


Результаты тестирования

Тест Primordia из набора Science Mark 2.0 хоть и косвенно, но свидетельствует
о том, что Prescott не создан для сложной математики. Даже с новой частотой
3,4 GHz он далек от своих конкурентов. А вот Northwood 3,4 GHz доказал, что
при использовании технологии Hyper-Threading его вычислительные способности
практически не уступают Athlon 64 3400+.

Остальные результаты вполне можно рассматривать с точки зрения глобальных закономерностей.
Налицо действительное соответствие рейтинга 3400+ у Athlon 64 2,2 GHz реальной
производительности Pentium 4 (Northwood) 3,4 GHz. При некоторых отклонениях
(Unreal Tournament всегда демонстрировал более высокие результаты на процессорах
AMD, а "мультимедиа" всегда лучше удается CPU от Intel, особенно с
использованием ПО, поддерживающего SMP) мы наблюдаем в принципе схожее быстродействие.
Теперь посмотрим, где же новый 90-нанометровый процессор Intel занял первые
места — архивирование WinRAR, 3DMark 2003, SPECviewperf 7.1.1. Опять-таки примечательно
— если Prescott отстает, то отстает значительно, если лидирует, то тоже весьма
ощутимо. Еще одно подтверждение тому, что новый процессор Intel нельзя однозначно
назвать ни "хорошим", ни "наоборот". Во-первых, пока полностью
не сформировалась та самая экосистема, где он сможет себя проявить на все 100%,
а во-вторых, он просто другой (отличный от всего того, к чему мы так
долго привыкали).

Выводы

После довольно революционного появления семейства AMD64, пошатнувшего
и взбудоражившего IT-общественность, снова наблюдается некоторое спокойствие.
Как показало наше тестирование, новые массовые процессоры Intel Pentium 4 (Northwood)
3,4 GHz и AMD Athlon 64 3400+ 2,2 GHz действительно являются "топовыми"
для обеих компаний и ничем друг другу не уступают, а выбор остается исключительно
за пользователем. Хотя платформа от AMD обойдется покупателю несколько дешевле,
но той разительной разницы, которая была в случае с Athlon XP, уже не будет.
Теперь при желании приобрести новые High-End-системы вне зависимости от производителя
платформы придется заплатить сопоставимые суммы. Ну а посоветовать приобретение
Prescott можно тем, кто хочет стать обладателем передовых технологий, которые
должны проявить себя в будущем. Так сказать, платформа "на вырост".

Но все же выскажем некоторые претензии к Prescott. Заключаются они в слишком
высоком тепловыделении. Даже выполнив все рекомендации касательно циркуляции
воздуха, мы получили в закрытом корпусе около 70 °С на чипе. В случае применения
мощной видеокарты и модулей памяти PC3200 это может привести к тому, что температура
внутри корпуса превысит 50 °С — согласитесь, многовато. Надеемся, что в
будущих степпингах Intel вплотную займется решением данной проблемы, иначе дальнейший
рост частот может оказаться небезопасным.

Разгон

Для серьезного и стабильного разгона новых процессоров от Intel придется
как минимум сменить штатные кулеры на что-то более мощное и добавить в корпус
пару-тройку вентиляторов. CPU с индексом "С" смог стабильно работать
на частоте 3,72 GHz (наверняка сказались дополнительные элементы в цепи питания,
о которых мы говорили вначале). Prescott достиг порога в 3,8 GHz, однако в открытом
корпусе и с кулером Zalman CNPS7000ACu, как нам кажется, достичь более высоких
частот, используя традиционные методы охлаждения, просто не удастся.

С одной стороны, время в IT-индустрии летит настолько быстро, что не успеваешь замечать новые продукты и технологии, а с другой… ну-ка, вспомним — сколько лет мы не видели нового ядра от Intel? Не старого с переделками: тут частоту FSB подняли, там виртуальную многопроцессорность с серверного процессора на десктопный перенесли (на самом деле — просто разрешили последнему честно рассказать, что она у него есть), но действительно полностью нового? Если не с нуля разработанного, то хотя бы не латаного, а заново по тем же лекалам сшитого, но с другими рюшечками и по последней моде? А ведь целых два года, оказывается! Даже с хвостиком небольшим. И все это время горячие головы рассуждали на излюбленную тему: а каким же оно будет, новое ядро? Чего только не предсказывали — вплоть до полной анафемы архитектуре NetBurst и воцарения сплошного Banias на декстопной платформе. Правда (как часто бывает), оказалась менее сказочной: новое ядро оказалось честным и последовательным продолжателем Northwood. Разумеется, с некоторыми архитектурными нововведениями, но стремления «до основанья, а затем…» в нем не прослеживается. Поэтому чисто эмоционально Prescott можно оценивать по-разному: кто-то похвалит инжереров Intel за последовательность и целеустремленность, кто-то, наоборот — посетует на отсутствие свежих идей. Однако эмоции — личное дело каждого, мы же обратимся к фактам. Теория

Основные изменения в ядре (Prescott vs. Northwood)

Для начала мы предлагаем вам небольшую табличку, в которой сведены воедино наиболее существенные различия между ядрами Prescott и Northwood во всем что касается «железа» (а точнее — кремния, и прочих «минеральных составляющих»).

Остается только добавить, что новое ядро содержит 125 миллионов транзисторов (куда там бедному Northwood с его 55 миллионами!), и его площадь равна 112 кв. мм (немного меньше площади Northwood — 146/131 кв. мм, в зависимости от ревизии). Произведя несложный арифметический подсчет, видим, что увеличив количество транзисторов в ~2,3 раза, за счет нового техпроцесса инженерам Intel удалось, тем не менее, уменьшить площадь ядра. Правда, не так значительно — «всего» в 1,3 (1,2) раза.

Что же касается технологии «напряженного» (некоторые предпочитают термин «растянутый») кремния — то она, если объяснять на пальцах, довольно проста: с целью увеличения расстояния между атомами кремния, он помещается на подложку, расстояние между атомами у которой больше. В результате, для того чтобы «хорошо усесться», атомам кремния приходится растягиваться по предложенному формату. Выглядит это примерно вот так:

Ну а понять, почему электронам проще проходить через напряженный кремний, вам поможет вот этот простенький рисунок:

Как видите, геометрическая ассоциация в данном случае вполне уместна: путь электрона просто становится короче.

Ну а теперь рассмотрим гораздо более интересные отличия: в логике ядра. Их тоже немало. Однако для начала будет нелишним напомнить об основных особенностях архитектуры NetBurst как таковой. Тем более что не так уж и часто мы это делали в последнее время.

Немного предыстории

Итак, одним из основных отличий ядер, разработанных в рамках архитектуры NetBurst, сама компания Intel считает уникальную особенность, выражающуюся в разделении собственно процесса декодирования x86-кода во внутренние инструкции, исполняемые ядром (uops), и процедуры их выполнения. Между прочим, такой подход породил в свое время немало споров относительно корректности подсчета стадий конвейера у Pentium 4: если подходить к данному процессору с классической точки зрения (эпохи до-NetBurst), то стадии декодера следует включать в общий список. Между тем, официальные данные Intel о длине конвейера процессоров Pentium 4 содержат информацию исключительно о количестве стадий конвейера исполняющего блока, вынося декодер за его рамки. С одной стороны — «крамола!», с другой — это объективно отражает особенность архитектуры, поэтому Intel в своем праве: она же ее и разработала. Спорить, можно, разумеется, до посинения, однако… какая, собственно, разница? Главное — понимать суть подхода. Не нравится вам, что декодер исключен? Ну так прибавьте его стадии к «официальным» — и получите искомую величину конвейера по классической схеме, вместе с декодером.

Таким образом, основная идея NetBurst — асинхронно работающее ядро, в котором декодер инструкций работает независимо от Execution Unit. С точки зрения Intel, существенно бо льшая, чем у конкурентов, частота работы ядра, может быть достигнута только при асинхронной модели т.к. если модель синхронная, то расходы на синхронизацию декодера с исполняющим блоком возрастают пропорционально частоте. Именно поэтому вместо обычного L1 Instructions Cache, где хранится нормальный x86-код, в архитектуре NetBurst применяется Execution Trace Cache, где инструкции хранятся уже в декодированном виде (uops). Trace — это и есть последовательность uops.

Также в историческом экскурсе хотелось бы окончательно развеять мифы, связанные с излишне упрощенной формулировкой, согласно которой ALU у Pentium 4 работает на «удвоенной частоте». Это и так… и не так. Однако для начала взглянем на условную блок-схему процессора Pentium 4 (уже Prescott):

Легко заметить, что ALU состоит из нескольких частей: в нем присутствуют блоки Load / Store, Complex Instructions, и Simple Instructions. Так вот: с удвоенной скоростью (0,5 такта на операцию) обрабатываются лишь те инструкции, что поддерживаются исполняющими блоками Simple Instructions. Блок ALU Complex Instructions, исполняющий команды, отнесенные к сложным — наоборот, может тратить до четырех тактов на исполнение одной инструкции.

Вот, собственно, и все, что хотелось бы напомнить относительно внутреннего устройства процессоров сконструированных на базе архитектуры NetBurst. Ну а теперь перейдем к нововведениям в самом свежем NetBurst-ядре — Prescott.

Увеличение длины конвейера

Вряд ли это изменение можно назвать усовершенствованием — ведь общеизвестно, что чем длиннее конвейер, тем бо льшие накладные расходы вызывает ошибка механизма предсказания ветвлений, и, соответственно, уменьшается средняя скорость выполнения программ. Однако, видимо, другого способа увеличить разгонный потенциал ядра, инженеры Intel найти не смогли. Пришлось прибегнуть к непопулярному, но проверенному. Итог? Конвейер Prescott увеличен на 11 стадий, соответственно, общее их количество равняется 31. Честно говоря, мы намеренно вынесли эту «приятную новость» в самое начало: фактически, описание всех последующих нововведений можно условно назвать «а вот теперь мы вам расскажем, как инженеры Intel боролись с последствиями одного-единственного изменения, чтобы оно окончательно не угробило производительность»:).

Усовершенствования в механизме предсказания ветвлений

В основном, тонкий тюнинг коснулся механизма предсказания переходов при работе с циклами. Так, если ранее по умолчанию обратные переходы считались циклом, то теперь анализируется длина перехода, и исходя из нее механизм пытается предсказать: цикл это, или нет. Также было обнаружено, что для ветвей с определенными типами условных переходов, независимо от их направления и расстояния, использование стандартного механизма предсказания ветвлений чаще всего неактуально — соответственно, теперь в этих случаях он не используется. Однако кроме теоретических изысканий, инженеры Intel не побрезговали и голой эмпирикой т.е. просто-напросто отслеживанием эффективности работы механизма предсказания ветвлений на примере конкретных алгоритмов. С этой целью было исследовано количество ошибок механизма предсказания ветвлений (mispredictions) на примерах из теста SPECint_base2000, после чего по факту были внесены изменения в алгоритм с целью их уменьшения. В документации приводятся следующие данные (количество ошибок на 100 инструкций):

Подтест SPECint_base2000 Northwood (130 nm) Prescott (90 nm)
164.gzip 1.03 1.01
175.vpr 1.32 1.21
176.gcc 0.85 0.70
181.mcf 1.35 1.22
186.crafty 0.72 0.69
197.parser 1.06 0.87
252.eon 0.44 0.39
253.perlbmk 0.62 0.28
254.gap 0.33 0.24
255.vortex 0.08 0.09
256.bzip2 1.19 1.12
300.twolf 1.32 1.23

Ускорение целочисленной арифметики и логики (ALU)

В ALU был добавлен специализированный блок для исполнения инструкций shift и rotate, что позволяет теперь исполнять данные операции на «быстром» (двухскоростном) ALU, в отличие от ядра Northwood, где они исполнялись в блоке ALU Complex Instructions, и требовали бо льшего количества тактов. Кроме того, ускорена операция целочисленного умножения (integer multiply), ранее исполнявшаяся в блоке FPU. В новом ядре для этого выделен отдельный блок.

Также есть информация о присутствии некоторого количества мелких усовершенствований, позволяющих увеличить скорость обработки инструкций FPU (и MMX). Впрочем, ее мы лучше проверим в практической части — при анализе результатов тестов.

Подсистема памяти

Разумеется, одним из основных плюсов нового ядра являются увеличенные размеры L1-кэша данных (в 2 раза т.е. до 16 килобайт) и кэша второго уровня (также в 2 раза т.е. до 1 мегабайта). Однако есть и еще одна интересная особенность: в ядро введена специальная дополнительная логика, обнаруживающая page faults в инструкциях software prefetch. Благодаря этому нововведению, инструкции software prefetch теперь имеют возможность осуществлять не только предвыборку данных, но и предвыборку page table entries т.е., другими словами, prefetch умеет не останавливаться на загруженной странице, но еще и обновлять страницы памяти в DTLB. Разбирающиеся в вопросе наверняка заметят на этом примере, что Intel внимательно следит за отзывами программистов, пусть даже и не кается прилюдно по поводу каждого обнаруженного ими негативного фактора, влияющего на производительность.

Новые инструкции (SSE3)

Кроме всего прочего, в Prescott добавлена поддержка 13 новых инструкций. Назван этот набор, по устоявшейся традиции, SSE3. В их числе присутствуют команды преобразования данных (x87 to integer), работы с комплексной арифметикой, кодирования видео (правда, всего одна), новые команды, предназначенные для обработки графической информации (массивов вершин), а также две инструкции, предназначенные для синхронизации потоков (явно последствия появления Hyper-Threading). Впрочем, о SSE3 мы в скором времени выпустим отдельную статью, поэтому рассматривать возможности данного набора в этом материале воздержимся, чтобы не портить излишней популяризацией серьезную и интересную тему.

Ну а теперь, пожалуй, довольно с нас теории и спецификаций. Попытаемся, как говорилось в одном известном анекдоте, «вместе со всем этим взлететь»:). Тестирование

Конфигурации стендов и ПО

Тестовый стенд

  • Процессоры:
    • AMD Athlon 64 3400+ (2200 МГц), Socket 754
    • Intel Pentium 4 3,2 ГГц «Prescott» (FSB 800/HT), Socket 478
    • Intel Pentium 4 2,8A ГГц «Prescott» (FSB 533/нет HT), Socket 478
    • Intel Pentium 4 3,4 ГГц «Northwood» (FSB 800/HT), Socket 478
    • Intel Pentium 4 3,2 ГГц «Northwood» (FSB 800/HT), Socket 478
  • Материнские платы:
    • ABIT KV8-MAX3 (версия BIOS 17) на чипсете VIA K8T800
    • ASUS P4C800 Deluxe (версия BIOS 1014) на чипсете Intel 875P
    • Albatron PX875P Pro (версия BIOS R1.00) на чипсете Intel 875P
  • Память:
    • 2x512 МБ PC3200 DDR SDRAM DIMM TwinMOS (тайминги 2-2-2-5)
  • Видеокарта: Manli ATI Radeon 9800Pro 256 МБ
  • Жесткий диск: Western Digital WD360 (SATA), 10000 об/мин



Pentium 4 2,8A ГГц «Prescott»
Единственный Prescott с частотой FSB 533 МГц
и без поддержки Hyper-Threading



Pentium 4 3,4 ГГц «Northwood»
Просто еще один Northwood…

Системное ПО и драйверы устройств

  • Windows XP Professional SP1
  • DirectX 9.0b
  • Intel Chipset Installation Utility 5.0.2.1003
  • VIA Hyperion 4.51
  • VIA SATA Driver 2.10a
  • Silicon Image Driver 1.1.0.52
  • ATI Catalyst 3.9
Плата ABIT KV8-MAX3 ASUS P4C800 Deluxe Albatron PX875P Pro
Чипсет VIA K8T800 (K8T800 + VT8237) Intel 875 (RG82004MC + FW82801ЕB) Intel 875 (RG82875 + FW82801ЕB)
Поддержка процессоров Socket 754, AMD Athlon 64 Socket 478, Intel Pentium 4, Intel Celeron
Разъемы памяти 3 DDR 4 DDR 4 DDR
Слоты расширения AGP/ 5 PCI AGP Pro/ 5 PCI AGP/ 5 PCI
Порты ввода/вывода 1 FDD, 2 PS/2 1 FDD, 2 COM, 1 LPT, 2 PS/2 1 FDD, 2 COM, 1 LPT, 2 PS/2
USB 4 USB 2.0 + 2 разъема по 2 USB 2.0 2 USB 2.0 + 3 разъема по 2 USB 2.0
FireWire 1 порт + 2 разъема на 2 порта (планка в комплекте), Texas Instruments TSB43AB23 1 порт + 1 разъем на 1 порт (нет планки в комплекте), VIA VT6307 —
Интегрированный в чипсет ATA-контроллер ATA133 + SATA RAID (0, 1) ATA100 + SATA ATA100 + SATA
Внешний ATA-контроллер Silicon Image Sil3114CT176 (SATA RAID 0, 1, 0+1, Spare) Promise PDC20378 (ATA133+SATA RAID 0, 1, 0+1) —
Звук AC"97-кодек Avance Logic ALC658 AC"97-кодек Analog Devices AD1985 AC"97-кодек Avance Logic ALC655
Сетевой контроллер 3Com Marvell 940-MV00 (Gigabit Ethernet) 3Com Marvell 920-MV00 (Fast Ethernet)
I/O-контроллер Winbond W83627HF-AW Winbond W83627THF-A Winbond W83627THF
BIOS 4 Мбит Award BIOS v6.00PG 4 Мбит AMI BIOS v2.51 3 Мбит Phoenix AwardBIOS v6.00
Форм-фактор, размеры ATX, 30,5x24,5 см ATX, 30,5x24,5 см ATX, 30,5x24,5 см
Средняя текущая цена (количество предложений) Н/Д(0) Н/Д(0) Н/Д(0)

В завершение описания, хотелось бы разъяснить алгоритм подбора участников тестирования. С одной стороны, полностью исключить из тестов процессоры AMD было бы неправильно, ведь эта платформа — основной конкурент Intel, как сейчас, так и в обозримом будущем. С другой стороны — совмещать в одной статье сравнение двух поколений Pentium 4 с процессорами другого производителя, означало бы не сравнить толком ни то, ни другое. Поэтому мы решили в первом материале, посвященном Prescott, пойти на определенный компрормисс: во-первых, полностью исключить всевозможные «экстремальные» варианты в виде Pentium 4 eXtreme Edition и Athlon 64 FX, во-вторых же, взять в качестве представителя альтернативной платформы только один, но быстрый из обычных десктопных процессоров AMD: Athlon 64 3400+.

Да и то, по большому счету, его результаты здесь приводятся лишь в качестве опции. В этом материале нас более всего интересует сравнение нового ядра Intel со старым. Если кто-то желает получить одновременно информацию о том, как производительность Prescott соотносится с ближайшим конкурентом — что ж, она представлена на диаграммах. Комментарии? Пожалуй, они просто излишни. Вы сами в этом убедитесь. Зная, какова производительность Prescott и Northwood, работающих на одинаковой частоте, и то, как соотносятся производительность Northwood и топовых процессоров AMD (а этот вопрос мы уже неоднократно освещали) — вы знаете вполне достаточно для того, чтобы самостоятельного сделать все остальные выводы.

Кроме того, хотелось бы разъяснить наличие на диаграммах двух столбиков для Prescott 3,2 ГГц. Дело просто в том, что мы решили… подстраховаться. Всем известно, что с выходом процессора на другом ядре, среди производителей системных плат сразу же начинается суматоха с обновлением BIOS, всяческих microcode update, и прочего «железно-ориентированного» ПО. Нам показалось логичным использовать такой ресурс нашей тестовой лаборатории как «официально Prescott-ready» системные платы максимально полно, чтобы уберечься от возможных последствий некорректной работы конкретной модели. Впрочем, как вы увидите далее, опасения оказались напрасными: в большинстве случаев новый процессор вел себя на обеих платах совершенно одинаково.

Все характеристики Prescott 2,8A ГГц программа
CPU-Z определяет вполне корректно:
как наличие SSE3, так и шину 533 МГц

Разумеется, не ошиблась она и в случае с
Prescott 3,2E ГГц

Низкоуровневые тесты в CPU RightMark

Для начала, мы решили проверить функционирование нового ядра в двух режимах — традиционно самом лучшем для процессоров Pentium 4 и самом худшем: SSE/SSE2 и MMX/FPU. Начнем с вычислительного блока (Math Solving).

Результаты неутешительные. Новое ядро медленнее старого, более того — в режиме MMX/FPU его отставание даже больше, чем при использовании SSE/SSE2. Делаем первый вывод: если что-то в FPU и «подкручивали», то явно в CPU RightMark используются другие команды. Ну а что у нас с рендерингом?

Во-первых, рассмотрим варианты работы модуля рендеринга в однопоточном и двухпоточном режимах с максимальной производительностью (SSE/SSE2). Картина достаточно интересная: если используется один поток — преимущество Prescott минимально, а больший по частоте Northwood его легко обгоняет. Однако стоит нам задействовать Hyper-Threading, как Prescott тут же резко вырывается вперед, причем настолько, что обгоняет всех других участников. Возникает впечатление, что некая работа над ядром в плане улучшения обработки параллельно выполняющихся потоков, была проведена, и заключалась она не только в расширении набора команд. Посмотрим теперь, как себя ведут те же процессоры в режиме MMX/FPU.

Абсолютно аналогичная картина. Причем если сопоставить ее с предыдущей — хорошо видно, что тщательность анализа себя оправдала: если бы, к примеру, мы ограничились рассмотрением лучшего (двухпотокового) результата, можно было бы ошибочно сделать вывод о том, что ядро Prescott быстрее в плане исполнения инструкций, причем даже в режиме MMX/FPU. Сейчас же хорошо видно, что быстродействие возросло исключительно благодаря оптимизации использования ресурсов виртуальных CPU.

Тесты в реальных приложениях

Перед тем как начать рассмотрение результатов тестов в реальных приложениях, сделаем небольшое вводное разъяснение. Дело в том, что процессор Pentium 4 на ядре Prescott с частотой 3,4 ГГц, к сожалению, до сих пор для нас недоступен, поэтому то, что вы видите на диаграммах под названием "Virtual" Prescott 3,4 ГГц — это не более чем аппроксимация результатов Prescott 3,2 ГГц, рассчитанная исходя из идеальных условий роста производительности пропорционально частоте. Кто-то может заметить, что это слишком топорный подход. Дескать, намного корректнее было бы, к примеру, разогнать имеющийся Prescott 3,2 ГГц с помощью выставления большей частоты FSB, или хотя бы выстроить кривую аппроксимации по трем точкам: Prescott 2,8 ГГц -> 3,0 ГГц -> 3,2 ГГц. Разумеется, так было бы корректнее. Однако «на всякого мудреца довольно простоты», и… просто обратите внимание на то, какие поправки вносит в общую картину наличие на диаграммах даже «идеального» Prescott 3,4 ГГц (а реальный будет либо таким же, либо медленнее — третьего не дано). Рискуя навлечь на себя немилось преждевременным разглашением тайны, скажем сразу: да практически никаких. Где ядро Prescott выигрывает — там это и так видно. А где проигрывает — не помогают ему даже идеализированные 3,4 ГГц…

Работа с графикой

Самые предсказуемые результаты у Northwood 3,4 ГГц (немного лучше, чем у Northwood 3,2 ГГц) и Prescott 2.8 ГГц (отсутствие поддержки Hyper-Threading сразу же выбросило его в аутсайдеры). Prescott 3,2 ГГц пытается быть хотя бы наравне с одночастотным Northwood, но у него не получается даже это. Ну а наш «виртуальный Prescott 3,4 ГГц», в свою очередь, не смог обогнать реальный Northwood 3,4 ГГц — что тоже естественно. C другой стороны, можно заметить, что все процессоры кроме Prescott 2,8 ГГц почти равны. Вряд ли это будет аргументом для апгрейда на Prescott, но хотя бы не станет существенным доводом против его покупки для тех, кто задумывается над приобретением новой системы.

В Lightwave ситуация аналогичная, только Prescott отстает еще больше. Здесь уместно будет вспомнить, что Lightwave (судя по сравнению результатов 6-й ветки с 7-й), затачивался под Pentium 4 очень тщательно и скрупулезно. Можно предположить, что именно поэтому он оказался так чувствителен к малейшим архитектурным изменениям в ядре. Также отметим, что впервые протестированный нами в этой программе Athlon 64 3400+ демонстрирует пусть и не лучший, но вполне приличный результат.

Для Photoshop в современных процессорных архитектурах, видимо, самым главным параметром является размер кэша. Мы уже неоднократно обращали внимание на то, что эта программа весьма «кэшелюбива», и результаты Prescott это подтверждают.

Кодирование медиаданных

Вообще, поскольку мы тестируем новую (или существенно модифицированную, если вам так больше нравится) архитектуру — то для нас любое приложение может стать маленьким открытием. По сути, сейчас количество даже важнее качества, потому что нам просто необходимо набрать как можно больше данных о том, как старые (еще не оптимизированные под Prescott) программы ведут себя с новым процессорным ядром. Вот, тот же LAME: оказывается, для него Prescott по всем статьям новый процессор — результаты совершенно не ложатся на то, что мы ранее знали про Northwood. Правда, они стали хуже. Что ж, бывает. Продолжаем коллекционировать…

Ogg Encoder демонстрирует практически идентичную картину: Prescott существенно проигрывает всем остальным процессорам без исключения, несмотря на удвоенный кэш данных первого уровня и L2. Остается предположить, что виновато увеличение длины конвейера при оставшемся неизменным объеме Trace Caсhe.

Даже тяготеющий к архитектуре NetBurst кодек DivX невзлюбил новое ядро. Не то что бы очень сильно, но все-таки оно ему не понравилось. Впрочем, тут есть определенная надежда на SSE3 — разработчики DivX просто обожают различные оптимизации (во всяком случае, судя по анонсам), поэтому весьма велик шанс, что единственная и неповторимая инструкция, предназначенная для ускорения кодирования видео, найдет свое место в будущем релизе данного кодека. Однако это все в будущем, а пока — увы…

А вот результаты XviD мы опять не приводим по причине совершенно невообразимого «фортеля», который в очередной раз выкинула эта нежно нами любимая программа. Дело в том, что прирост производительности Prescott по отношению к Northwood в ней составил… 232% ! Такие тесты, пардон, мы использовать просто отказываемся. Похоже, что их результаты могут зависеть вообще от чего угодно…

Ну, вот и первая победа. Впрочем, возвращаясь к теме о предпочтениях различного ПО, можно заметить, что Windows Media Video 9 весьма неплохо поддерживает Hyper-Threading, а данные низкоуровневых тестов показали, что эффективность задействования виртуальных CPU в случае с новым ядром возрастает. Похоже, что это первый положительный результат, достигнутый за счет качественного, а не количественного изменения в Prescott. Во всех предыдущих случаях он «выезжал» исключительно за счет большого объема кэша…

Очень, очень интересный результат. Mainconcept MPEG Encoder, которому мы пеняли за «корявую» работу с Hyper-Threading при кодировании в формат MPEG1 — вполне адекватно работает с виртуальными процессорами, если они эмулируются Prescott, а не Northwood! Впору даже задуматься: быть может, программисты не виноваты, просто «затык» был в процессорном ядре, которое некорректно распараллеливало потоки? Вполне возможно, по крайней мере, глядя на результаты Prescott, понимаешь, что и это предположение имеет право на жизнь. C другой стороны вполне неплохо себя показал Prescott 2,8A ГГц, про Hyper-Threading и слыхом не слыхавший. Забавная ситуация. Пожалуй, мы находимся на пороге интересного открытия: напрашивается предположение, что вся «оптимизация работы Hyper-Threading в Prescott» сводится всего лишь к тому… что этой технологии в Northwood не хватало объема кэша, чтобы развернуться в полную силу!

И снова можно порадоваться за новое ядро: в Mainconcept MPEG Encoder не только пропал «глюк» с кодированием MPEG1, но и преобразование в MPEG2 стало работать существенно быстрее. Имея в виду результаты предыдущих тестов, можно почти однозначно утверждать, что основным виновником торжества является улучшенная работа Hyper-Threading (и не забываем о том, за счет чего она могла стать лучше — если наши предположения верны). Что самое интересное — не понадобились даже специальные команды для управления потоками из набора SSE3, процессор сам отлично разобрался (поддержку SSE3 в данной версии кодировщика предполагать не приходится — она вышла довольно давно).

А вот Canopus ProCoder просто почти ничего не заметил. В принципе, небольшая разница в производительности присутствует, и она даже в пользу Prescott. Но, по сути, это копейки, мелочь. Учитывая «кэшелюбивость» ProCoder, можно даже сказать так: весь большой кэш, судя по всему, ушел на компенсацию других недостатков нового ядра. Он просто вытянул Prescott на ту же высоту, что и Northwood, но, увы — не более.

Архивирование

Традиционно, мы протестировали 7-Zip как со включенной поддержкой многопоточности, так и без нее. Ожидаемый эффект достигнут в этой программе не был: не заметно, чтобы многопоточность на Prescott давала намного больший эффект, чем на Northwood. Да и вообще — особой разницы между старым и новым ядром не видно. Похоже, что мы наблюдаем упомянутый выше эффект: все, что смогли сделать количественные показатели Prescott (объемы кэша L1 Data и L2) — это компенсировать его же удлиненный конвейер.

К слову: один из немногих тестов, где хоть как-то видна разница между платами. В остальном — все та же картина: Prescott и Northwood одинаковой частоты идут рядом, практически не отличаясь по скорости. Пессимисты скажут: «плохо», оптимисты: «могло быть и хуже»:). Мы — просто промолчим…

Игры

Картина во всех трех играх схожая, поэтому особенно расписываться нет нужды: Prescott все же медленнее. Правда, ненамного.

Обобщая результаты

Что ж, если делать какие-то выводы на основании тех тестов, что присутствуют в статье, то ситуация выглядит следующим образом: ядро Prescott в целом медленнее Northwood. Иногда это удается компенсировать бо льшим объемом кэша, вытянув производительность на уровень старого ядра. Ну а если программа особенно чувствительна к объему L2, Prescott даже способен выиграть. Кроме того, несколько улучшилась эффективность Hyper-Threading (но похоже, что причина снова кроется в увеличении объема L2-кэша). Соответственно, если программа умеет использовать обе сильные стороны нового ядра — большой кэш и виртуальную многопроцессорность — то выигрыш получается ощутимым. В целом же, производительность Prescott примерно такая же, как у Northwood, а применительно с старому, неоптимизированному ПО — даже более низкая. Ожидаемой революции, увы, не получилось. С другой стороны… а был ли мальчик? Но об этом — ниже.

Что же касается Prescott 2,8A ГГц с 533-мегагерцевой системной шиной и без поддержки Hyper-Threading, то как раз тут все предельно ясно. Во-первых, для Intel это просто очень хороший способ сделать хотя бы что-то из тех экземпляров, которые в «настоящем Prescott"овском» режиме банально не заработали. Этакий «Celeron среди Prescott"ов» (хотя будет, судя по всему, на базе этого ядра и официальный Celeron). Во-вторых — отсутствие Hyper-Threading скорее всего свидетельствует о принципиальном нежелании Intel видеть HT на устаревшей, низкоскоростной шине. Действительно: единственным представителем 533 МГц FSB + HT так и остался первый процессор с поддержкой этой технологии — Pentium 4 3,06 ГГц. Да и то по вполне понятной, извиняющей его причине: не было еще на тот момент CPU с 800-мегагерцевой шиной.

Таким образом, да простят нам инженеры Intel эту вольность, Pentium 4 2,8A ГГц — это «как бы не Prescott». А просто сравнительно недорогой (другим его выпускать нельзя — не купит ведь никто…), но высокочастотный Pentium 4. И совершенно неважно, на каком он сделан ядре, не в этом суть. Честно говоря, было искушение его в этот материал вообще не включать, но потом мы решили поступить наоборот: дать ему один раз «засветиться», и более к данному чу дному процессору не возвращаться. Из простого сравнения одночастотных ядер Prescott и Northwood понятно, что без Hyper-Threading Prescott 2.8 ГГц даже с Pentium 4 2.8C (800 МГц FSB + HT) по усредненным показателям производительности соперничать не сможет. Версии

Да, именно «версии», а не «выводы». Слишком неоднозначным получился этот материал. Проще было бы ограничиться анализом диаграмм и сделать напрашивающийся, лежащий на поверхности вывод: «если новое не быстрее (а то и медленнее) старого — значит, оно хуже». Списать, так сказать, в расход. Однако самый простой ответ — не всегда самый правильный. Поэтому мы решили коснуться аналитики, и рассмотреть выход Prescott в исторически-рыночной перспективе. Получилось, что ответов на вопрос «в чем для Intel состоит смысл выпуска Pentium 4 на ядре Prescott?» на самом деле несколько, и каждый из них можно логично аргументировать.

Версия первая или Большая ошибка

Почему бы и нет? Жила-была компания Intel, и появилась у нее идея: сделать процессорное ядро, ориентированное не на максимальный КПД (если рассматривать КПД как соотношение производительности к частоте), а на легкую масштабируемость. Дескать, если наши 2000 МГц проигрывают 1000 МГц от конкурента — не беда, догоним частоту до 4 ГГц и оставим всех позади. Между прочим, с чисто инженерной точки зрения, это вполне адекватное решение. Не все ли равно? Пользователя-то (грамотного) все равно интересуют не мегагерцы, а производительность, какая ему разница, за счет чего она достигается? Главное чтобы масштабируемость оказалась именно такой, какую предполагалось достичь. И вот, выясняется, что с масштабируемостью начались большие проблемы. Догнали до 3,4 ГГц, остановились… и пришлось придумывать новое ядро, у которого КПД еще ниже… и неизвестно, какими темпами будет расти у него частота… и так далее. Напомним, что это версия. Рассмотрим ее внимательнее в сопоставлении с реальными фактами.

Факт, свидетельствующий в пользу данной версии — рост частоты Pentium 4 за прошедший 2003 год. Все-таки 200 МГц, да еще и по отношению к такой «частотолюбивой» архитектуре как NetBurst — явно мало. Однако… как общеизвестно, рассматривать какой-то факт в отрыве от других — не очень хорошая практика. Был ли смысл в активном наращивании частоты Pentium 4 в прошлом году? Вроде бы нет… Основной конкурент решал другие вопросы — у него новая архитектура, новое ядро, ему нужно наладить массовое производство процессоров на базе этого ядра, обеспечить им соответствующую обвязку в виде чипсетов, системных плат, программного обеспечения, в конце концов! Поэтому один из вариантов ответа на вопрос «почему практически не росла частота (и производительность) Pentium 4 в 2003 году» звучит просто: не было особого смысла ее наращивать. Ни догонять, ни перегонять — вроде некого. Стало быть, можно особенно не торопиться.

Получить ответ на главный вопрос мы, увы, пока не можем: как будет «гнаться» новое ядро? Пока что, если судить по внешним признакам, фактов, подтверждающих хорошую масштабируемость Prescott — нет. Впрочем, равно как и опровергающих ее. Анонсированы 3,4-гигагерцевые версии как Prescott, так и Northwood. Northwood 3,4 ГГц, наверное, будет последним процессором на этом ядре (хотя, официальных подтверждений этого предположения нет). А то, что Prescott стартовал с 3,4 ГГц, а не с 3,8 или 4,0 тоже легко объяснимо: зачем прыгать через ступеньки? Подводя итог: версия «Большой ошибки», в принципе, имеет право на существование. Но если частота (а еще точнее, — производительность) Prescott будет быстро расти, это однозначно подтвердит ее несостоятельность.

Версия вторая или Переходное ядро

Ни для кого не секрет, что иногда производителю требуется выпустить некое устройство, достаточно ординарное само по себе (в другой ситуации совершенно не заслуживающее звания релизного продукта). Но в том-то и дело, что выпуск данного устройства необходим для продвижения на рынок других, анонсируемых одновременно с ним или чуть позже. Таким был Pentium 4 Willamette, вряд ли достойный звания «хорошего и быстрого процессора», однако явно обозначивший факт перехода одного из самых крупных игроков на процессорном рынке, на новое ядро, и под конец своего существования сменивший «промежуточный» Socket 423 на «долгоиграющий» Socket 478. Что, если аналогичная роль уготована Prescott?

Уже всем известно, что с выходом Grantsdale-P, нас ждет появление еще одного процессорного разъема для Pentium 4 (Socket T / Socket 775 / LGA775), и поначалу устанавливаться в него будут именно CPU на ядре Prescott. Лишь впоследствии Pentium 4 «Tejas» начнет постепенно их замещать. И тут вполне логично задаться вопросом: а насколько быстро будет происходить это замещение? Поскольку мы все равно лишь выдвигаем версии, ограничивать свою фантазию не будем, и предположим, что Intel желает этот процесс максимально ускорить. С помощью чего? Скорее всего — оставив Socket 478 мирно почивать в нижних строчках на диаграммах производительности, и сделав Socket 775 символом обновленной, мощной и скоростной платформы для Pentium 4. Тогда все становится ясно: Prescott нужен для того, чтобы на рынке присутствовал процессор, способный работать как в платах с разъемом Socket 478, так и с новым Socket 775. Tejas же, если наши предположения верны, будет устанавливаться только в Socket 775, и станет, таким образом, могильщиком как для Prescott, так и для устаревшей платформы Socket 478. Логично? Нам кажется, что да. В таком случае, правдоподобно смотрится и следующее предположение: жизнь Prescott’у уготована весьма недолгая…

Версия третья или «Кто с мечом к нам придет…»

Не секрет, что соперничество между двумя основными конкурентами — Intel и AMD, почти всегда строилось на противопоставлении двух основных аргументов. Intel: «наши процессоры — самые быстрые!», AMD: «зато у наших лучше соотношение цены и производительности!». Соперничество давнее, аргументы тоже. Причем, они не изменились даже с выходом процессоров AMD на ядрах K7/K8, — несмотря на то, что у последних с производительностью дела обстоят намного лучше, чем у K6. Ранее Intel не делала исключений из основного своего правила: продавать свои CPU с производительностью, аналогичной процессорам конкурента, немного дороже. Рынок местами очень прост, поэтому причина такого поведения понятна: если их и так покупают — то зачем снижать цену? Опять-таки: хоть участвовать в ценовых войнах Intel и приходилось, но развязывала их всегда AMD, это уже стало традицией. Третья версия базируется на очевидном предположении: а что если на этот раз Intel решила повести себя агрессивнее, чем обычно, и развязать ценовую войну первой?

В списке достоинств нового ядра Prescott числится не только новизна, объемы кэшей, и потенциально хорошая (правда, пока не подтвержденная) масштабируемость, но и… цена! Это сравнительно дешевое в производстве ядро: если при использовании 90-нанометровой технологии будет достигнут показатель выхода годных чипов хотя бы такой же, как у Northwood — то, ничуть не теряя в абсолютных показателях прибыли, Intel сможет продавать свои процессоры за гораздо меньшую цену. Напомним одну очевидную зависимость: такую характеристику CPU как «соотношение цена / производительность», можно улучшать, не только повышая производительность, но и снижая цену. Вообще-то, никто не мешает быстродействие даже понизить (!) — главное, чтобы цена упала еще больше:). Судя по появляющимся в Сети неофициальным анонсам цен на Pentium 4 Prescott, стоить они будут намного дешевле Pentium 4 Northwood. Таким образом, мы можем предположить, что Intel решила осуществить своего рода «обход с флангов»: пока основной конкурент, по старинке, все гонится и гонится за производительностью, ему будет нанесен удар в секторе middle-end систем, где пользователи тщательно анализируют именно такой показатель как price / performance.

Версия четвертая или Тайное оружие

Здесь следует сделать небольшое лирическо-историческое отступление для тех, кто «во времена оные» не очень активно отслеживал разные мелкие нюансы в процессорном секторе. Так, к примеру, можно вспомнить, что сразу после появления первых процессоров с поддержкой Hyper-Threading (а ими были вовсе не Pentium 4 «Northwood» + HT, а Xeon «Prestonia»), многие задались вопросом: «если ядра Prestonia и Northwood настолько похожи, что практически не отличаются по основным характеристикам, но у Prestonia поддержка Hyper-Threading присутствует, а у Northwood ее нет — то не логично ли предположить, что и у Northwood она тоже есть, просто искусственно заблокирована?». Впоследствии это предположение косвенно подтвердилось — анонсом Pentium 4 3,06 ГГц на все том же ядре Northwood, но уже с Hyper-Threading. Более того, самые смелые выдвигали и вовсе крамольную мысль: Hyper-Threading была даже в Willamette!

А теперь вспомним: что у нас в последнее время известно по части новых технологических инициатив Intel. Сразу всплывают два названия: «La Grande» и «Vanderpool». Первое — технология аппаратной защиты приложений от вмешательства извне, которую вкратце можно описать словами «сделать так, чтобы одно ПО не могло вмешиваться в функционирование другого». Впрочем, о La Grande вы можете почитать на нашем сайте . Об Vanderpool информации меньше, но исходя из обрывков доступной на сегодня, можно сделать вывод, что она представляет собой вариацию на тему полной виртуализации PC, включая все без исключения аппаратные ресурсы. Таким образом (самый простой, но и самый эффектный пример), на одном компьютере смогут работать параллельно две операционные системы, причем одна из них может быть даже перезагружена — но это совершенно не отразится на работе другой.

Так вот: есть очень большие подозрения, что и La Grande и Vanderpool в ядре Prescott уже реализованы, но (как было ранее с Hyper-Threading) пока не активированы. Если это предположение истинно, то многое относительно самого ядра становится понятным. В частности — то, почему оно такое большое, почему так долго разрабатывалось, но, несмотря на это, не выирывает в скорости у предыдущего. Если исходить из гипотезы «Тайного оружия», можно предположить, что основные ресурсы команды разработчиков были направлены вовсе не на достижение быстродействия, а на отладку новых функций. Частично данная версия перекликается со второй — так или иначе, но мы имеем дело с переходным ядром. Соответственно, быть совершенным оно вовсе не обязано, ибо не в том его основное предназначение. Между прочим, также удачно вторую и четвертую версии дополняет третья: низкая цена в данном случае является именно той конфеткой, что подсластит для конечного пользователя пилюлю «переходности».

Подводя итоги

Мы не зря назвали эту статью «полшага вперед». Prescott получился более сложным и неоднозначным, чем ожидаемый «Northwood с увеличенным объемом кэша и более высокой частотой» (как многие его воспринимали). Разумеется, можно обвинить производителя в том, что прирост скорости в среднем близок к нулю (а местами и отрицательный), в очередной чехарде с поддержкой процессоров на базе нового ядра системными платами… И, между прочим, вполне справедливо это сделать. Это, в конце концов, не наши проблемы — а между тем, именно мы с ними и столкнемся. Поэтому просто поставим в конце статьи «жирное троеточие». На стоп-кадре видно только начало шага: нога, зависшая в воздухе, или, если угодно, лайнер на взлете. Что нас ждет дальше? Благоприятным ли окажется «приземление» (Tejas?..) Пока можно только догадываться.