Какой он был Pentium (6 фото)
В конце 1991 года, когда была завершен макет процессора, инженеры смогли запустить на нем программное обеспечение. Проектировщики начали изучать под микроскопом разводку и прохождение сигналов по подложке с целью оптимизации топологии и повышения эффективности работы.
Проектирование в основном было завершено в феврале 1992 года. Началось всеобъемлющее тестирование опытной партии процессоров, в течение которого испытаниям подвергались все блоки и узлы. В апреле 1992 года было принято решение, что пора начинать промышленное освоение Pentium процессора. В качестве основной промышленной базы была выбрана 5 Орегонская фабрика. Более 3 миллионов транзисторов были окончательно перенесены на шаблоны. Началось промышленное освоение производства и доводка технических характеристик, завершившиеся через 10 месяцев, 22 марта 1993 года широкой презентацией Pentium процессора.
Объединяя более, чем 3.1 миллион транзисторов на одной кремниевой подложке, 32-разрядный Pentium процессор характеризуется высокой производительностью с тактовой частотой 60 и 66 МГц. Его суперскалярная архитектура использует усовершенствованные способы проектирования, которые позволяют выполнять более, чем одну команду за один период тактовой частоты, в результате чего Pentium в состоянии выполнять огромное количество PC-совместимого программного обеспечения быстрее, чем любой другой микропроцессор. Кроме существующих наработок программного обеспечения, высокопроизводительный арифметический блок с плавающей запятой Pentium процессора обеспечивает увеличение вычислительной мощности до необходимой для использования недоступных ранее технических и научных приложений, первоначально предназначенных для платформ рабочих станций.
Многочисленные нововведения - характернаяособенность
Pentium процессора в виде уникального сочетания высокой производительности, совместимости, интеграции данных и наращиваемости. Это включает:- Суперскалярную архитектуру;
- Раздельное кэширование программного кода и данных;
- Блок предсказания правильного адреса перехода;
- Высокопроизводительный блок вычислений с плавающей запятой;
- Расширенную 64-битовую шину данных;
- Поддержку многопроцессорного режима работы;
- Средства задания размера страницы памяти;
- Средства обнаружения ошибок и функциональной избыточности;
- Управление производительностью;
- Наращиваемость с помощью Intel OverDrive процессора. Cуперскалярная архитектура Pentium процессора представляет
собой совместимую только с Intel двухконвейерную индустриальную архитектуру, позволяющую процессору достигать новых уровней производительности посредством выполнения более, чем одной команды за один период тактовой частоты. Термин "суперскалярная" обозначает микропроцессорную архитектуру, которая содержит более одного вычислительного блока. Эти вычислительные блоки, или конвейеры, являются узлами, где происходят все основные процессы обработки данных и команд.
Появление суперскалярной архитектуры Pentium процессора представляет собой естественное развитие предыдущего семейства процессоров с 32-битовой архитектурой фирмы Intel. Например, процессор Intel486 способен выполнять несколько своих команд за один период тактовой частоты, однако предыдущие семейства процессоров фирмы Intel требовали множество циклов тактовой частоты для выполнения одной команды.
Возможность выполнять множество команд за один период тактовой частоты существует благодаря тому, что Pentium процессор имеет два конвейера, которые могут выполнять две инструкции одновременно. Так же, как и Intel486 с одним конвейером, двойной конвейер Pentium процессора выполняет простую команду за пять этапов: предварительная подготовка, первое декодирование ( декодирование команды ), второе декодирование ( генерация адреса ), выполнение и обратная выгрузка.
В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество команд может быть выполнено за одно и то же время.
Другое важнейшее революционное усовершенствование, реализованное в Pentium процессоре, это введение раздельного кэширования. Кэширование увеличивает производительность посредством активизации места временного хранения для часто используемого программного кода и данных, получаемых из быстрой памяти, заменяя по возможности обращение ко внешней системной памяти для некоторых команд. Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти, используемой одновременно для кэширования программного кода и данных.
Проектировщики фирмы Intel обошли это ограничение использованием дополнительного контура, выполненного на 3.1 миллионах транзисторов Pentium процессора (для сравнения, Intel486 содержит 1.2 миллиона транзисторов) создающих раздельное внутреннее кэширование программного кода и данных. Это улучшает производительность посредством исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем это было возможно ранее. Например, во время фазы предварительной подготовки, используется код команды, полученный из КЭШа команд. В случае наличия одного блока кэш-памяти, возможен конфликт между процессом предварительной подготовки команды и доступом к данным. Выполнение раздельного кэширования для команд и данных исключает такие конфликты, давая возможность обеим командам выполняться одновременно. Кэш-память программного кода и данных Pentium процессора содержит по 8 KB информации каждая, и каждая организована как набор двухканального ассоциативного КЭШа - предназначенная для записи только предварительно просмотренного специфицированного 32-байтного сегмента, причем быстрее, чем внешний кэш. Все эти особенности расширения производительности потребовали использования 64-битовой внутренней шины данных, которая обеспечивает возможность двойного кэширования и суперскалярной конвейерной обработки одновременно с загрузкой следующих данных. Кэш данных имеет два интерфейса, по одному для каждого из конвейеров, что позволяет ему обеспечивать данными две отдельные инструкции в течение одного машинного цикла. После того, как данные достаются из КЭШа, они записываются в главную память в режиме обратной записи. Такая техника кэширования дает лучшую производительность, чем простое кэширование с непосредственной записью, при котором процессор записывает данные одновременно в кэш и основную память. Тем не менее, Pentium процессор способен динамически конфигурироваться для поддержки кэширования с непосредственной записью.
Таким образом, кэширование данных использует два различных великолепных решения: кэш с обратной записью и алгоритм, названный MESI (модификация, исключение, распределение, освобождение) протокол. Кэш с обратной записью позволяет записывать в кэш без обращения к основной памяти в отличие от используемого до этого непосредственного простого кэширования. Эти решения увеличивают производительность посредством использования преобразованной шины и предупредительного исключения самого узкого места в системе. В свою очередь MESI-протокол позволяет данным в кэш-памяти и внешней памяти совпадать - великолепное решение в усовершенствованных мультипроцессорных системах, где различные процессоры могут использовать для работы одни и те же данные.
Блок предсказания правильного адреса перехода - это следующее великолепное решение для вычислений, увеличивающее производительность посредством полного заполнения конвейеров командами, основанное на предварительном определении правильного набора команд, которые должны быть выполнены.
Pentium процессор позволяет выполнять математические вычисления на более высоком уровне благодаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвейер и аппаратно реализованные основные математические функции. Четырехтактовые конвейерные команды вычислений с плавающей запятой дополняют четырехтактовую целочисленную конвейеризацию. Большая часть команд вычислений с плавающей запятой могут выполняться в одном целочисленном конвейере, после чего подаются в конвейер вычислений с плавающей запятой. Обычные функции вычислений с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью ускорения вычислений.
В результате этих инноваций, Pentium процессор выполняет команды вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростных численных вычислений, являющихся неотъемлемой частью таких усовершенствованных видеоприложений, как CAD и 3D-графика.
Pentium процессор снаружи представляет собой 32-битовое устройство. Внешняя шина данных к памяти является 64-битовой, удваивая количество данных, передаваемых в течение одного шинного цикла. Pentium процессор поддерживает несколько типов шинных циклов, включая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.
Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенно повышает скорость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Эта расширенная шина данных способствует высокоскоростным вычислениям благодаря поддержке одновременной подпитки командами и данными процессорного блока суперскалярных вычислений, благодаря чему достигается еще большая общая производительность Pentium процессора по сравнению с процессором Intel486 DX.
Давая возможность разработчикам проектировать системы с управлением энергопотреблением, защитой и другими свойствами, Pentium процессор поддерживаем режим управления системой (SMM), подобный режиму архитектуры Intel SL.
Вместе со всем, что сделано нового для 32-битовой микропроцессорной архитектуры фирмы Intel, Pentium процессор сконструирован для легкой наращиваемости с использованием архитектуры наращивания фирмы Intel. Эти нововведения защищают инвестиции пользователей посредством наращивания производительности, которая помогает поддерживать уровень продуктивности систем, основанных на архитектуре процессоров фирмы Intel, больше, чем продолжительность жизни отдельных компонентов. Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в уже существующих системах с помощью простой инсталляции средства однокристального наращивания производительности. Например, первое средство наращивания - это OverDrive процессор, разработанный для процессоров Intel486 SX и Intel486 DX, использующий технологию простого удвоения тактовой частоты, использованную при разработке микропроцессоров Intel486 DX2.
Первые модели процессора Pentium работали на частоте 60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-битовой шине данных, работающей на полной скорости процессорного ядра. Hо если скорость процессора Pentium растет, то системному разработчику все труднее и дороже обходится его согласование с материнской платой. Поэтому быстрые процессоры Pentium используют делитель частоты для синхронизации внешней шины с помощью меньшей частоты. Hапример, у 100 МГц процессора Pentium внешняя шина работает на 66 МГц, а у 90 МГц - на 60 МГц. Процессор Pentium использует одну и ту же шину для доступа к основной памяти и к периферийным подсистемам, таким как схемы PCI.
Pentium II
Intel Pentium II (произносится: Интел Пентиум два) — процессор архитектуры x86, анонсированный 7 мая 1997 года. Ядро Pentium II представляет собой модифицированное ядро P6 (впервые использованное в процессорах Pentium Pro). Основными отличиями от предшественника являются увеличенный с 16 до 32 Кб кэш первого уровня и наличие блока SIMD-инструкций MMX (появившихся немногим ранее в Pentium MMX), повышена производительность при работе с 16-разрядными приложениями. В системах, построенных на базе процессора Pentium II, повсеместное применение нашли память SDRAM и шина AGP.
Процессор Pentium II представляет собой картридж SECC или SECC2 (отличающийся более простой конструкцией), содержащий процессорную плату («субстрат») с установленными на ней ядром процессора, микросхемами кэш-памяти BSRAM и tag-RAM. Кэш-память второго уровня работает на половине частоты ядра. Процессор предназначен для установки в 242-контактный щелевой разъём Slot 1.
Существует также вариант Pentium II OverDrive в корпусе PGA (устанавливается в гнездовой разъём Socket 8) с полноскоростным кэшем второго уровня, предназначенный для замены Pentium Pro.Первые процессоры Pentium II (Klamath) были предназначены для рынка настольных персональных компьютеров и производились по 350 нм техпроцессу. Дальнейшим развитием семейства десктопных Pentium II стало 250 нм ядро Deschutes. Через некоторое время вышли процессоры Mobile Pentium II, предназначенный для установки в ноутбуки, и Xeon, ориентированный на высокопроизводительные системы и серверы. На базе ядра Deschutes выпускались также процессоры Celeron (Covington), предназначенные для использования в недорогих компьютерах. Они представляли собой Pentium II, лишённый картриджа и кэша второго уровня.
Технология MMX
Аббревиатура MMX происходит от выражения MultiMedia eXtension - расширение для мультимедиа, которое реализовано фирмой Intel в своей новой серии процессоров MMX с тактовой частотой 166 и более МГц. Исторически сложилось так, что почти любое новое решение в области персональных компьютеров широко рекламируется и преподносится как эпохальное, сулящее невиданный доселе расцвет компьютерным технологиям, однако все мы помним, сколько раз подобная шумиха оборачивалась весьма скромным реальным эффектом. Процессоры MMX сейчас в моде, и хотя их цена довольно быстро падает - она все же существенно превышает цену обычного Pentium с той же тактовой частотой. Надеюсь, что после прочтения этой статьи Вы более уверенно сможете ответить на собственный вопрос: Pentium или Pentium MMX?
В чем отличия от Pentium?
Процессор Pentium MMX отличается от "обычного" Pentium по шести основным пунктам:
добавлено 57 новых команд обработки данных;
увеличен в два раза объем внутреннего кэша (16 кб для команд и столько же - для данных);
увеличен объем буфера адресов перехода (Branch Target Buffer - BTB), используемого в системе предсказания переходов (Branch Prediction);
оптимизирована работа конвейера (Pipeline);
увеличено количество буферов записи (Write Buffers);
введено так называемое двойное электропитание процессора.
Набор из 57 новых команд и является основным отличием; остальные два - не более, чем "сопутствующие изменения". Хотя увеличенный объем кэша и внутренних буферов и оптимизированный конвейер несколько ускоряют работу любых приложений, однако основное увеличение производительности - до 60% - возможно только при использовании программ, правильно применяющих технологию MMX в обработке данных.
Предпосылки MMX
Фактически вся история развития компьютеров представляет собой непрерывную гонку между быстродействием центрального процессора и прочих систем - памяти и внешних устройств. Особенно это заметно в системах мультимедиа, где идет обработка звука и изображения, цифровое представление которых занимает большие объемы памяти. Для эффективной обработки звука и видео при относительно низкой пропускной способности системной магистрали (шины) все большее количество функций переносится в аппаратуру - модемы, видео- и звуковые адаптеры. Это вызывает их заметное удорожание в сравнении с общей стоимостью компьютера, что особенно неприятно в обстановке быстрого морального старения всей компьютерной аппаратуры.
На самом деле, неспособность современного компьютера с процессором Pentium эффективно обрабатывать в реальном времени звук и видео без специальных карт происходит уже не столько от общего быстродействия процессора или шины, которые в большинстве случаев вполне достаточны, а от характера его набора команд обработки данных, известного под названием CISC (Common Instruction Set Computer - компьютер с общим набором команд). Этот набор, состоящий из относительно сложных арифметико-логических команд, ориентирован на типовые задачи обработки данных, без специальной "заточки" под особые приложения. Эта выгодная для большинства приложений, архитектура оказывается совершенно неэффективной при скоростной и специфической обработке больших массивов данных, поскольку сложная система команд используется на считанные проценты, а накладные расходы составляют десятки и сотни процентов.
Технология MMX представляет собой компромиссное решение, объединяющее пути, используемые в компьютерах SPARC и Silicon Graphics (технология RISC - Reduced Instruction Set Computer, компьютер с упрощенным набором команд), а также в компьютерах с параллельной архитектурой (технология SIMD: Single Instruction, Multiple Data - одна команда, много данных): классический процессор Pentium (CISC) с добавлением ряда простых (RISC) команд параллельной обработки данных (SIMD).
Обработка данных в MMX
Как уже говорилось, в Pentium MMX добавлено 57 новых команд обработки данных и, соответственно - четыре новых типа данных. За одну операцию команда MMX обрабатывает 64-разрядное двоичное слово (так называемое квадраслово, или QWord). Новые типы данных образуются от упаковки в квадраслово обычных типов - байтов (по 8), слов (по 4) или двойных слов (по 2). Четвертый тип представляет собой само квадраслово.
Таким образом, одна элементарная MMX-операция имеет дело либо с одним квадрасловом, что похоже на обычную операцию большой разрядности, либо с двумя двойными словами, четырьмя словами или восемью байтами, причем выполнение происходит одновременно и каждый элемент данных обрабатывается независимо от других. Подобные групповые операции преобладают во время обработки изображения (группы точек) и звука (группы значений амплитуды).
Набор MMX-команд состоит из команд пересылки данных, упаковки/распаковки, сложения/вычитания, умножения, сдвига, сравнения и поразрядных логических. Команды упаковки и сложения/вычитания могут работать в двух режимах: обычном, когда переполнение разрядной сетки вызывает "заворачивание" (wraparound) значения результата, и специальном, когда оно приводит к ограничению (clipping) результата до минимально или максимально допустимого значения. Режим ограничения в терминологии Intel называется Saturation (смешивание) - в нем особенно удобно выполнять смешивание цветов изображение или амплитуд звуковых сигналов, поскольку при обычном переполнении результат не имеет никакого смысла.
Команда умножения представлена тремя видами: первые два выполняют попарное умножение четырех слов с выбором либо старшей, либо младшей части результата, а третий выполняет операцию вида ab + cd для каждой пары из четырех слов операндов, что очень удобно при вычислении математических рядов.
Команды сдвига реализуют логический и арифметический сдвиги своих операндов (арифметический сдвиг отличается от логического тем, что при сдвиге вправо освободившиеся разряды заполняются копией знакового разряда, а не нулями, отчего он пригоден для умножения/деления знаковых операндов на степени двойки). Логические поразрядные команды выполняют операции И (AND), ИЛИ (OR), Исключающее ИЛИ (XOR), а также комбинированную команду И с инверсией одного из операндов (AND NOT), удобную для реализации "обратного выбора" по битовой маске.
Команды сравнения работают несколько необычно по сравнению с общепринятой логикой: вместо установки признаков для последующих команд перехода они генерируют единичные битовые маски для тех операндов, которые удовлетворяют условию, и нулевые - для остальных операндов. Последующие логические поразрядные операции могут выделить, погасить или как-то иначе обработать отмеченные таким образом операнды, которые в этом случае могут представлять собой точки изображения или отсчеты звукового сигнала.
Процессоры Pentium III с тактовыми частотами 766, 800, 850, 866 и 1 ГГц (1000 MГц) и выше, являлись самыми совершенными и наиболее мощными процессорами корпорации Intel (до выпуска процессоров Intel Pentium 4) для настольных ПК и обладали производительностью Internet-приложений следующего поколения, а также качеством, надежностью и совместимостью.
Процессор Pentium III идеально соответствует требованиям активных пользователей ПК, любителей компьютерных игр и Internet. Этот процессор полностью реализует мультимедийные возможности ПК, прежде всего, в области работы полноэкранного видео и высококачественной графики и восприятия Internet. В процессоре Pentium III воплощено все лучшее от процессоров Intel® и реализованы новейшие технологии. Среди них, в частности, 70 новых команд, обеспечивающих широкие возможности при работе с новым программным обеспечением и путешествиях по Internet.
Поставляемые версии процессоров имеют тактовую частоту системной шины либо 133 МГц, либо 100 МГц и поддерживают работу с чипсетами Intel R 840, 820, 815, 810e, 440GX и 440BX и их аналогами.
Процессоры Pentium III доступны в двух различных типах корпусов: Картридж с одним рядом контактов типа 2 (Single Edge Contact Cartridge 2 - S.E.C.C .2) и Корпус с перевернутым кристаллом и с матрицей штырьковых выводов (Flip-Chip Pin Grid Array - FC-PGA). Корпус FC-PGA разработан для нового поколения персональных компьютеров с низким профилем корпуса.
Pentium III процессор имеет два отдельных 16 КБ-х кэша первого уровня (L1), один для команд и один для данных. Кэш L1 обеспечивает быстрый доступ к недавно использованным данным, увеличивая общие эксплуатационные показатели системы. 256 КБ-й кэш второго уровня (L2) с улучшенной передачей данных (Advanced Transfer Cache-ATC). Кэш ATC содержит ряд микро архитектурных усовершенствований, для обеспечения более скоростного интерфейса между кэшем L2 и ядром процессора, и работает с частотой ядра процессора. Особенностью ATC является:
Не блокирующий, полно скоростной кэш второго уровня
Ассоциативность набора с 8 путями
256-разрядная шина данных
Интерфейс с уменьшенным временем ожидания по сравнению с дискретными кэшами
Pentium 4 (произносится: Пентиум четыре) — x86-совместимый процессор, разработанный Intel. Микроархитектура процессора была полностью изменена, по сравнению с предыдущими поколениями процессоров. Новая микроархитектура получила новое название — NetBurst. Оригинальный Pentium 4 носил кодовое имя «Willamette», работал на частотах 1,4 и 1,5 ГГц и был анонсирован 20 ноября 2000 года (изначально анонс был запланирован на октябрь, однако дата анонса была перенесена) и предназначался для установки в разъём Socket 423. Первые процессоры, основанные на новой архитектуре, вызвали множество нареканий. Во-первых — это производительность, производительность Pentium 4 была ниже чем у Pentium III, работающего на частоте в 1,5 раза меньшей. Во-вторых, для работы нового процессора требовалась материнская плата, основанная на чипсете i850, которая стоили весьма недёшево. В-третьих, все материнские платы предназначались для работы с дорогой памятью Rambus (RDRAM). В-четвертых, для работы материнской платы требовалась замена блока питания, а иногда и корпуса.
За более чем 5 лет было выпущено множество ядер и моделей Pentium 4, основанных на них. Причем с выходом новой модели к названию процессора добавлялись либо новая буква, либо еще какие-нибудь цифры, а иногда и то, и другое; всё это существенно запутывает идентификацию конкретной модели.
Процессор Pentium 4 построен на совершенной новой архитектуре — NetBurst. Ниже приведены некоторые отличительные особенности оригинальной архитектуры NetBurst (некоторые из них в последующем были изменены).
Конвейер. Длина конвейера была увеличена до 20 шагов, то есть для завершения одной команды процессору требовалось 20 циклов. Данный шаг позволял значительно легче наращивать тактовую частоту, кроме того, в перспективе это позволяло значительно повысить быстродействие, но производительность в расчете на 1 МГц была меньше, чем у предыдущих процессоров. Отчасти этим объясняется низкая производительность Pentium 4, работающего на низких частотах. Так же в результате такого нововведения увеличилось и время ожидания.
Модуль предсказания переходов (ветвлений). Чтобы компенсировать недостатки применения длинного конвейера инженеры Intel улучшили схему предсказания ветвлений, в результате правильность перехода предсказывалась с вероятностью до 95 %.
Системная шина. В Pentium 4 используется совершенно новая 128-битная системная шина с двумя 64-битными линиями. Частота новой шины(FSB) составляет 100 МГц (у последних, тогда, моделей Pentium III она составляла 133 МГц), однако за счет передачи за 1 такт одновременно 4 пакетов (QPB — Quad Pumped Bus), эффективная частота шины составляла 400 МГц, а пропускная способность шины составляла 3200 Мб/с.
Арифметико-логическое устройство (АЛУ или ALU). В АЛУ обрабатываются целочисленные команды. В новом процессоре АЛУ работает на удвоенной частоте ядра (у Pentium 4 1,5ГГц АЛУ работает на частоте 3 ГГц за счет использования обоих фронтов сигнала). Таким образом, некоторые инструкции выполняются за половину такта. В Pentium 4 используются два АЛУ.
Кэш-память первого уровня (L1). Как и прежде кэш L1 разделен на две части: для команд и для данных. В кэше теперь хранятся декодированные команды и располагаются в порядке их выполнения (технология Trace Cache), что увеличивает производительность.
Математический Сопроцессор (FPU). Математический сопроцессор содержит два модуля для операций с плавающей запятой. Но реальную вычислительную работу выполняет лишь один модуль — это операции сложения (FADD) и умножения (FMUL), второй модуль выполняет операции обмена между регистрами и памятью (FSTORE). Для процессора Pentium 4 1,4 ГГц сопроцессор обеспечивает производительность в 1,4 GFLOPS. К примеру, в процессорах Athlon используется сопроцессор, состоящий из трех модулей (один для операций типа FSTORE, два других для операций типа FADD и FMUL) и обеспечивающий производительность в 2 GFLOPS (для процессора Athlon 1 ГГц).
SIMD-расширения. В процессор Pentium 4 был добавлен новый набор SIMD-расширений (SSE2), который добавил 144 новые инструкции (68 целочисленных инструкций и 76 инструкций для вычислений с плавающей запятой).