Преподаватель который помогает студентам и школьникам в учёбе.

Процессор персонального компьютера. Назначение, функции, классификация процессора

Содержание:

Введение

Процессоры персональных компьютеров отвечает стандартам, которые были заданы Intel своим первым микропроцессором, который был Intel 4004. На данный момент процессоры персональных компьютеров развиваются не так быстро как в прошлом в связи с усложнением поддержания правила Фон Неймана и отсутствия сильной конкурентных решений. Параллельно Intel существует AMD, которая не так популярна и доходна, но в попытках предугадать будущее индустрии выпускает технологии, которым применение будет через несколько лет, благодаря чему и существует и даже такие гиганты современной индустрии, как Intel берут на вооружение некоторые технологии разработанные компанией AMD.

В основе домашнего, а так же любого компьютера лежит использование процессора. Процессор является одним из важных устройств компьютера, с его помощью определяют множество возможностей, начиная от обработки графики до сверхточных вычислений для траектории полёта ракет. Процессор является важным элементом осуществляющий выполнение программ и управляет работой остальных комплектующих, так же от него зависит просчёт анимации и скорость архивации. Учитывая выше изложенное считаю, что тема данной курсовой работы актуальна.

Цель работы состоит в создание полного представления о работе процессора, о его назначениях функциях, как он классифицируется и чем так важен в современном мире.

1. История появления Процессоров.

История развития производства процессоров полностью соответствует истории развития технологии производства прочих электронных компонентов и схем.

Первым этапом, затронувшим период с 1940-х по конец 1950-х годов, было создание процессоров с использованием электромеханических реле, ферритовых сердечников (устройств памяти) и вакуумных ламп. Они устанавливались в специальные разъёмы на модулях, собранных в стойки. Большое количество таких стоек, соединённых проводниками, в сумме представляли процессор. Отличительной особенностью была низкая надёжность, низкое быстродействие и большое тепловыделение.

Вторым этапом, с середины 1950-х до середины 1960-х, стало внедрение транзисторов. Транзисторы монтировались на близкие к современным по виду платам, устанавливаемым в стойки. Как и ранее, в среднем процессор состоял из нескольких таких стоек. Возросло быстродействие, повысилась надёжность, уменьшилось энергопотребление.

Третьим этапом, наступившим в середине 1960-х годов, стало использование микросхем. Первоначально использовались микросхемы низкой степени интеграции, содержащие простые транзисторные и резисторные сборки, затем, по мере развития технологии, стали использоваться микросхемы, реализующие отдельные элементы цифровой схемотехники (сначала элементарные ключи и логические элементы, затем более сложные элементы — элементарные регистры, счётчики, сумматоры). Позднее появились микросхемы, содержащие функциональные блоки процессора — микропрограммное устройство, арифметически-логическое устройство, регистры, устройства работы с шинами данных и команд.

Четвёртым этапом, в начале 1970-х годов, стало создание, благодаря прорыву в технологии создания БИС и СБИС (больших и сверхбольших интегральных схем, соответственно), микропроцессора — микросхемы, на кристалле которой физически были расположены все основные элементы и блоки процессора. Фирма Intel в 1971 году создала первый в мире 4-разрядный микропроцессор 4004, предназначенный для использования в микрокалькуляторах. Постепенно практически все процессоры стали выпускаться в формате микропроцессоров. Исключением долгое время оставались только мало серийные процессоры, аппаратно оптимизированные для решения специальных задач (например, суперкомпьютеры или процессоры для решения ряда военных задач), либо процессоры, к которым предъявлялись особые требования по надёжности, быстродействию или защите от электромагнитных импульсов и ионизирующей радиации. Постепенно, с удешевлением и распространением современных технологий, эти процессоры также начинают изготавливаться в формате микропроцессора.

Сейчас слова «микропроцессор» и «процессор» практически стали синонимами, но тогда это было не так, потому что обычные (большие) и микропроцессорные ЭВМ мирно сосуществовали ещё, по крайней мере, 10—15 лет, и только в начале 1980-х годов микропроцессоры вытеснили своих старших собратьев. Тем не менее, центральные процессорные устройства некоторых суперкомпьютеров даже сегодня представляют собой сложные комплексы, построенные на основе микросхем большой и сверхбольшой степени интеграции.

Переход к микропроцессорам позволил потом создать персональные компьютеры, которые проникли почти в каждый дом.

Первым общедоступным микропроцессором был 4-разрядный Intel 4004, представленный 15 ноября 1971 года корпорацией Intel. Он содержал 2300 транзисторов, работал на тактовой частоте 92,6 кГц и стоил 300 долл.

Далее его сменили 8-разрядный Intel 8080 и 16-разрядный 8086, заложившие основы архитектуры всех современных настольных процессоров. Из-за распространённости 8-разрядных модулей памяти был выпущен дешевый 8088, упрощенная версия 8086, с 8-разрядной шиной данных. Затем последовала его модификация, 80186.

В процессоре 80286 появился защищённый режим с 24-битной адресацией, позволявший использовать до 16 Мб памяти.

Процессор Intel 80386 появился в 1985 году и привнёс улучшенный защищённый режим, 32-битную адресацию, позволившую использовать до 4 Гб оперативной памяти и поддержку механизма виртуальной памяти. Эта линейка процессоров построена на регистровой вычислительной модели.

Параллельно развиваются микропроцессоры, взявшие за основу стековую вычислительную модель.

За годы существования микропроцессоров было разработано множество различных архитектур. Многие из них (в дополненном и усовершенствованном виде) используются и поныне. Например, Intel x86, резвившаяся вначале в 32-битную IA-32, а позже в 64-битную x86-64 (которая у Intel называется EM64T). Процессоры архитектуры x86 вначале использовались только в персональных компьютерах компании IBM (IBM PC), но в настоящее время всё более активно используются во всех областях компьютерной индустрии, от суперкомпьютеров до встраиваемых решений. Также можно перечислить такие архитектуры, как Alpha, POWER, SPARC PA-RISC, MIPS (RISC-архитектуры) и IA-64 (EPIC-архитектура).

В современных компьютерах процессоры выполнены в виде компактного модуля (размерами около 5×5×0,3 см), вставляющегося в ZIF-сокет (AMD) или на подпружинивающую конструкцию — LGA (Intel). Особенностью разъёма LGA является то, что выводы перенесены с корпуса процессора на сам разъём — socket, находящийся на материнской плате. Большая часть современных процессоров реализована в виде одного полупроводникового кристалла, содержащего миллионы, а с недавнего времени даже миллиарды транзисторов.

1.1. Архитектура фон Неймана

Большинство современных процессоров для персональных компьютеров, в общем, основаны на той или иной версии циклического процесса последовательной обработки данных, изобретённого Джоном фон Нейманом. Джон фон Нейман придумал схему постройки компьютера в 1946 году. Отличительной особенностью архитектуры фон Неймана является то, что инструкции и данные хранятся в одной и той же памяти.

В различных архитектурах и для различных команд могут потребоваться дополнительные этапы. Например, для арифметических команд могут потребоваться дополнительные обращения к памяти, во время которых производится считывание операндов и запись результатов. Во время процесса процессор считывает последовательность команд, содержащихся в памяти, и исполняет их. Такая последовательность команд называется программой и представляет алгоритм работы процессора. Очерёдность считывания команд изменяется в случае, если процессор считывает команду перехода, — тогда адрес следующей команды может оказаться другим. Другим примером изменения процесса может служить случай получения команды останова или переключение в режим обработки прерывания.

Команды центрального процессора являются самым нижним уровнем управления компьютером, поэтому выполнение каждой команды неизбежно и безусловно. Не производится никакой проверки на допустимость выполняемых действий, в частности, не проверяется возможная потеря ценных данных. Чтобы компьютер выполнял только допустимые действия, команды должны быть соответствующим образом организованы в виде необходимой программы.

Скорость перехода от одного этапа цикла к другому определяется тактовым генератором. Тактовый генератор вырабатывает импульсы, служащие ритмом для центрального процессора. Частота тактовых импульсов называется тактовой частотой.

2. Архитектуры и технологии использующееся в современных процессорах.

Главной особенностью является Архитектура и методы обработки данных. В истории создания процессоров было множество архитектур, и сейчас рассмотрим эти архитектуры:

2.1. Архитектура CISC

Полный набор команд, в данной архитектуре стремились иметь отдельную машину команд для каждого возможного действия по обработке данных. Основные черты организации CISC процессоров: 1) Большое количество различных машинных команд, каждая из которых выполняется за пару тактов ЦП 2) Устройство Управления с программируемой логикой. 3) Небольшое количество регистров общего назначения 4) Различные форматы команд с разной длинной Но такой подход привёл к тому, что некоторые команды стало невозможно выполнять чисто аппаратными средствами в результате в процессорах появились блоки которые выполняли сложные команды последовательностями из более простых команд.

2.2. Архитектура RISC

Архитектуре обусловлено тем, что большинство команд современных процессоров, которые относятся к классу СISC, сложные команды на стадии декодирования сводят к набору простых команд RISC, а ядро процессора реализуется как RISC-процессор. Главная особенность в том, что эта архитектура построена на максимально эффективном конвейере команд, это значит, что все команды извлекаются из памяти и поступают в ЦП на обработку в виде потока. В архитектуре RISC в основном находятся только часто используемые команды (10-20%) от всех команд и чаще востребованы в основном пересылка данных и арифметические и логические операции.

2.3. Архитектура VLIW

Архитектура с командными словами сверхбольшой длинны известна с начала 80-х годов. Идея базируется на том, что задача эффективного планирования параллельного выполнения команд, которая возлагается на компилятор. Компилятор анализирует программу, ищет команды, которые можно выполнить одновременно без возникновения конфликта. Компилятор может частично имитировать работу программа. После компилятор объеденяет несколько простых команд в одну сверхдлинную. Длинна команд от 256 до 1024 битов.В качестве простых команд, образующих сверхдлинную, обычно используются команды RISC-типа, поэтому архитектуру VLIW иногда называют постRISC-архитектурой.

2.4. Архитектура EPIC

Дальнейшее развитие идеи VLIV, это своего рода усовершенствованная технология VLIV. Команды упаковываются(группируются) компилятором в сверхдлинную команду длинной в 128 разрядов. Связка содержит три команды и шаблон в котором указана зависимость между командами (можно ли с командой I0 запустить параллельно I1, или же I1 должна выполниться только после I0), а также между другими связками (можно ли с командой I2 из связки S0 запустить параллельно команду I3 из связки S1) Суть в том, что еще компилятор указывает, что обе ветви выполняются на процессоре параллельно.

2.5. Архитектура CISC-процессора с RISC-ядром.

В микропроцессор встраивается аппаратный транслятор, превращающий команды CISC в команды внутреннего RISC-процессора. При этом одна команда CISC может порождать несколько RISC-команд. Исполнение команд происходит на суперскалярном конвейере одновременно по несколько штук.

Это потребовалось для увеличения скорости обработки CISC-команд, так как известно, что любой CISC-процессор уступает RISC-процессорам по количеству выполняемых операций в секунду. В итоге, такой подход и позволил поднять производительность CPU.

Так же одной из особенностей именно процессора является систем прерывания для перераспределения задач или для выполнения более важной задачи Во время выполнения программы внутри ЭВМ и во внешней среде могут возникать события, требующие немедленной реакции на них со стороны машины.

2.6. Прерывания

Реакция состоит в том, что машина прерывает обработку текущей программы и переходит к выполнению некоторой другой программы, специально предназначенной для данного события. По завершении этой программы ЭВМ возвращается к выполнению прерванной программы.

Характеристики систем прерывания:

-время реакции TР — время между появлением запроса прерывания и началом

выполнения первой команды обработчика прерывания;

-затраты времени на переключение программ — суммарный расход времени на

запоминание TЗ и восстановление TВ состояния программы;

-эффективность прерывания η — отношение времени выполнения прерывающей

программы к общему времени, необходимому для обслуживания прерывания;

- Глубина прерывания - это максимальное число программ, которые могут прерывать друг друга.

Обычно прерывание допускается после завершения выполнения текущей команды. В этом случае время реакции определяется в основном временем выполнения одной команды. Имеются ситуации, в которых желательно немедленное прерывание. Например, если аппаратура контроля обнаружила ошибку, то целесообразно сразу прервать операцию, пока ошибка не оказала влияние на следующие такты работы машины.

Процедура организации перехода к прерывающей программе выделяет из всех выставленных запросов тот, который имеет наибольший приоритет, выполняет передачу текущего состояния прерываемой программы из регистров процессора в стек, загружает в регистры процессора вектор прерывания и передает управление прерывающей программе.

2.7. Основополагающие функции данного оборудования:

2.7.1. Арифметические операции – это базовые математические операции, такие как сложение, вычитание, умножение и деление.

2.7.2. Логические операции (логическое умножение, логическое сложение, отрицание) представляют собой некоторые специальные операции, которые чаще используются при проверке соотношений между различными величинами. Это необходимо для работы компьютера.

2.8. В состав процессора входят:

2.8.1.Арифметико – логическое устройство (АЛУ), выполняющее арифметические и логические операции.

2.8.2.Устройство управления (УУ) – Устройство управления координирует взаимодействие различных частей компьютера, выполняет следующие основные функции:

- формирует и подает во все блоки машины в нужные моменты времени определенные сигналы управления (управляющие импульсы), обусловленные спецификой выполнения различных операций;

- формирует адреса ячеек памяти, используемых выполняемой операцией, и передает эти адреса в соответствующие блоки компьютера;

- получает от генератора тактовых импульсов обратную последовательность импульсов. В обобщенной структуре УУ можно выделить две части: управляющую и адресную. Управляющая часть УУ предназначена для координирования работы операционного блока Адресная часть УУ обеспечивает формирование адресов команд и исполнительных адресов операндов в основной памяти.

2.8.3.Прямой доступ к памяти - это метод непосредственного обращения к памяти, минуя процессор. Процессор отвечает только за программирование ПДП: настройку на определенный тип передачи, задание начального адреса и размера массива обмениваемых данных. Обычно ПДП используется для обмена массивами данных между системной памятью и устройствами ввода-вывода.

2.9. Последовательная обработка команд в процессоре.

2.9.1.Начало выполнения любой команды в процессоре начинается с выборки её из памяти, размещении в регистре команд.

2.9.2.На втором этапе осуществляется декодирование команды её полей, содержащих информацию о месте нахождения операндов; кода операции для логических и арифметических команд

2.9.3.По окончании декодирования и подготовительных операций начинается выполнение команд. Блок управления координирует работу всех узлов процессора «разбивая» выполнение команды на временные интервалы (такты, микрокоманды, микрооперации) в зависимости от архитектуры его реализации «жесткая логика» или «микропрограммное управление».

2.9.4.На четвёртом этапе процессор получает значение после выполнения операций и производит запись в оперативную память.

2.10. Системы предикации и реализация её возможностей..

Предикация – это способ обработки условных ветвлений. Суть в том, что компилятор указывает, что обе ветви выполняются на процессоре параллельно, ведь EPIC-процессоры должны иметь много функциональных блоков. Если в исходной программе встречаются условное ветвление, то команды из различных ветвей помечаются разными регистрами предиката, далее эти команды выполняются, но не записываются пока значения регистра предиката не определены. Предикаты формируются как результат сравнения значений, хранящихся в двух регистрах. Результат сравнения («Истина» или «Ложь») заносится в один из РП, но одновременно с этим во второй РП записывается инверсное значение полученного результата.

2.11. Микропрограммный автомат и его разновидности.

2.11.1Микропрограммный автомат можно считать центральным узлом УУ. Именно МПА формирует последовательность сигналов управления, в соответствие с которыми производится все действия, необходимые для выборки команд из память и их выполнения. Исходной информацией для МПА служат преобразованный в дешифраторе код операции, состояние признаков, характеризующие результат предшествующих вычислений и внешних запросов на прерывание программы.

2.11.2.Микропрограммный автомат с аппаратной логикой – В микропрограммном автомате с аппаратной логикой входные сигналу управления реализуются за счёт когда-то соединённых логических схем. Код операции хранящийся в регистре команд используется для определения того, какие сигналы управления и в какой последовательности должны формироваться. Сигналы управления, с помощью которых реализуются команды должны генерироваться в строго определённое время.

2.11.3.Микропрограммный автомат с программируемой логикой – Отличительной особенностью микропрограммного автомата с программируемой логикой является наличие памяти микропрограмм. Каждой команде вычислительного устройства в этой памяти соответствует микропрограмма.

2.11.4. Нано команды используются непосредственно для формирования сигналов управления. Каждой микрокоманде соответствует нано команда, хранящаяся в управляющей памяти нижнего уровня. Основным недостатком нанопрограммирования является невысокое быстродействие, поскольку для выполнения микрокоманды требуются два обращения к памяти, что, однако, частично компенсируется исключением из схемы дешифратора.

2.12. Кодирование команд

Информация о том, какие сигналы управления должны быть сформированы в процессе выполнения текущей команды, в закодированном виде содержится в микрооперационной части команды. Способ кодирования операций во многом определяет сложность аппаратных средств устройства управления и его скоростные характеристики. Применяемые в командах варианты кодирования сигналов управления можно свести к трем группам: горизонтальное кодирование, вертикальное и смешанное кодирование.

2.12.1. При горизонтальном кодировании под каждый сигнал управления в операционной части команды выделен один разряд это позволяет в рамках одной команды формировать любые сочетания СУ, чем обеспечивается максимальный параллелизм выполнения операций.

2.12.2. При вертикальном кодировании каждой операции присваивается определенный код, например, ее порядковый номер в полном списке возможных операций. Такой способ кодирования требует минимальных аппаратных затрат, однако возникает необходимость в дешифраторе команд, который должен преобразовать код операции в соответствующий сигнал управления.

2.12.3. В горизонтально-вертикальном методе(смешанном) в каждую группу включаются взаимно несовместимые сигналы управления, то есть сигналы управления, которые никогда не встречаются вместе в одной команде. При этом сигналы, обычно формируемые в одном и том же такте, оказываются в разных группах. Внутри каждой группы сигналы управления кодируются вертикальным способом, а группы —горизонтальным способом.

2.13. Архитектура простейшей микропрограммной системы по принцыпу построения MPP- SMP систем.

Причина появления системы с массовой параллельной обработкой (MPP) – это, во-первых, необходимость построения ВС с гигантской производительностью, во-вторых, стремление раздвинуть границы производства ВС в большом диапазоне производительности и стоимости.

MPP-система состоит из множества однородных вычислительных узлов, число которых может исчисляться тысячами. Узел состоит из полного комплекса устройств необходимых для независимого функционирования (ЦП,ОЗУ, система ВВ\ВЫВ) т.е является полноценной вычислительной машиной. Каждый узел содержит сетевой адаптер, используемый для объединения узлов; система хорошо масштабируется (до тысяч узлов); работа системы координируется главной ВМ (хост-компьютером) или одним из узлов, выполняющим роль главной ВМ;

SMP- Симметричная многопроцессорная система, где два или более одинаковых процессоров подключены к одной ОП имеющая доступ ко всем устройствам ВВ/ВЫВ и управляется с помощью ОС в котором все процессоры равны.

2.14. Работа первичного управляющего автомата в режиме захвата шин.

Первичный автомат вырабатывает микроприказы, переводящие буферные схемы шин адреса и данных в высокоимпедансное состояние. Таким образом, реализуется принцип захвата циклов МП-системы для ввода-вывода данных. В режиме обмен данными между памятью и периферией производится без участия МП. В этом случае в процедурах обмена не участвует аккумулятор, а, следовательно, содержимое МП сохраняется неизменным. Наиболее целесообразен режим при обмене специально упакованными блоками данных. Режим дает возможность МП-системе отказаться от программного управления обменом данными, что приводит к повышению эффективности МП-системы, так как позволяет достаточно простыми средствами осуществить согласование работы медленно действующих периферийных устройств с высокой скоростью обработки данных в МП

2.15. Регистры общего назначения в микропроцессорах.

Регистры общего назначения на примере простых версий микропроцессоров в лице микроконтроллеров AVR: Для хранения информации микроконтроллеры имеют 32 регистра общего назначения(РОH) они имеют собственное имя, вот эти имена: R0, R1…R31 все команды преобразования данных (сложение, вычитание и т.д) Каждая команда в качестве операндов использует либо содержимое двух разных POH, либо содержимое POH и константу. Так же их используют для перемещения данных. Некоторые команды имеют ограничения по использованию РОH, команды обмена данными с регистрами ввода-вывода не могут использовать регистры R0-R15. AVR РОH восьмиразрядные. Регистры ввода-вывода- эти регистры позволяют обмениваться информацией лишь со встроенными периферийными устройствами самой микросхемы. Такие как таймер, компараторы и АЦП. Каждый регистр имеет свой номер, от $00 до $3F. Каждый регистр ввода-вывода имеет так же своё уникальное имя. Например, ЕЕAR, EEDR (это имена первого и второго регистра микроконтроллера семейства Tiny) то, что называют портами ввода-вывода в микроконтроллерах AVR называют регистрами ввода-вывода. Смещение понятия произошло из-за того, что для обмена информацией с внешними устройствами используются достаточно сложные схемы, имеющие несколько разных режимов. Область памяти совмещенная с регистрами ввода-вывода. Они существуют во всех микроконтроллерах AVR, адреса $0000 по $001F все ячейки области память одновременно являются регистрами общего назначения т.е записывая байт в адрес $0000 вы записываете данные в R0.

Исходя из вышеизложенных технологий и архитектур, можно понять, что процессоры являются важной частью компьютера и не заменимы в нём. Так же они являются важной частью, благодаря которой появилась возможность разрабатывать всё более продвинутые технологии в других сферах деятельности человека.

3. Назначение процессоров.

Назначение процессоров самое разное, от расчёта простых математических вычислений до сложных вычислений графики, обработки изображения и просчёта построения точек теней и т.д.

На данный момент процессоры являются орудием для реализации и создания 3d моделей, обозначения их действий в созданных для данных моделей мире. Так с помощью процессоров можно просчитать направление солнечных лучей при движение объекта в созданной игре, показать как падает его тень, как идёт взаимодействие разных объектов и просчёта разрушаемости. В индустрии процессоры используют для игр, мультанимаций, траекторий полётов и всего где нужны вычисления, прогназирования.

4. Классификация процессоров.

Классификацию процессоров начнём с 2008-го года в связи с тем, что процессоры этого года повсеместно ещё находятся в эксплуатации, процессоры семейств предыдущих поколений рассматриваться не будут в связи с неактуальностью данной информации и незаинтересованностью современного потребителя в более старых моделях процессоров.

В 2008-м году Intel выпускает микроархитектуру Nehalem в котором используется ядра Bloomfield в исполнении LGA 1366 и для ядра Lynnfield в исполнении LGA 1156соответственно. Процессоры Nehalem содержат не менее 731 млн транзисторов. Но площадь кристалла значительно увеличилась по сравнению с предшественником -- с 214 до 263 мм?. Процессоры Nehalem поддерживаются большинством современных операционных систем, работающих на платформе x86/x64.

Архитектура Nehalem построена на базе Core, но содержит такие кардинальные изменения, как:

Встроенный контроллер памяти, поддерживающий 2 или 3 канала DDR3 SDRAM или 4 канала FB-DIMM.

Новая шина QPI, пришедшая на смену шине FSB (только в процессорах для LGA 1366; процессоры для LGA 1156 используют шину DMI).

Возможность выпуска процессоров со встроенным графическим процессором (в бюджетных решениях на базе 2-х ядерных процессоров).

В отличие от Kentsfield и Yorkfield, которые состоят из двух кристаллов по 2 ядра в каждом, все 4 ядра Bloomfield находятся на одном кристалле. Добавлен кэш 3-го уровня.

Добавлена поддержка SMТ (организация 2-х логических ядер из 1 физического).

В 2011-м году анонсирован Sandy Bridge - архитектура, процессоры которой будут производиться по 32-нм техпроцессу. Отличительной особенностью всех процессоров Sandy Bridge станет наличие в них интегрированного графического ядра нового поколения (Intel HD Graphics 2000/3000). Причем если в процессорах предыдущего поколения вычислительные ядра процессора и графическое ядро размещались на разных кристаллах и производились по разным техпроцессам, то в процессорах Sandy Bridge все компоненты процессора изготавливаются по 32-нм техпроцессу и располагаются на одном кристалле.

Графическое ядро и вычислительные ядра процессора имеют доступ к кэшу L3. Процессоры Sandy Bridge будут иметь интегрированный интерфейс PCI Express 2.0 для использования дискретных видеокарт. Причем все процессоры поддерживают 16 линий PCI Express 2.0, которые могут быть сгруппированы либо как один порт PCI Express x16, либо как два порта PCI Express x8. Все процессоры Sandy Bridge имеют интегрированный двухканальный контроллер памяти DDR3.

Еще одна особенность процессоров на базе микроархитектуры Sandy Bridge заключается в том, что вместо шины QPI, которая раньше использовалась для связи отдельных компонентов процессора друг с другом, теперь применяется иной интерфейс, называемый кольцевой шиной. Архитектура процессора Sandy Bridge подразумевает модульную, легко масштабируемую структуру.

Еще одной особенностью микроархитектуры Sandy Bridge является то, что в ней реализована поддержка набора инструкций Intel AVX. Intel AVX представляет собой новый набор расширений для архитектуры Intel, предусматривающий 256-битные векторные вычисления с плавающей запятой на базе SIMD.

Говоря о Sandy Bridge, нужно отметить, что она является развитием архитектуры Nehalem. Различия между Nehalem и Sandy Bridge довольно существенные, но всё же назвать эту архитектуру новой, какой в свое время была микроархитектура Intel Core, нельзя.

В 2012-м году представили новое поколение Ivy Bridge - кодовое название 22-нм версии микроархитектуры Sandy Bridge третьего поколения процессоров Intel Core. Представлена 23 апреля 2012 года.

22-нм процессоры Intel Ivy Bridge будут использовать транзисторы с вертикально расположенным затвором. Согласно оценкам компании, производительность 22-нм Tri-Gate транзисторов на 37 % выше производительности планарных 32-нм структур. При этом энергопотребление у них до 50 % меньше. Тем не менее, несмотря на пониженное энергопотребление, оверклокеры, испытав разгонный потенциал новых процессоров, пришли к неутешительному заключению, что процессоры, произведенные по техпроцессу 22-нм на повышенных частотах греются сильнее своих предшественников. Это связано в основном с уменьшением размеров кристалла, а как следствие - меньшей площади контакта кристалла с теплоотводящий крышкой, что приводит к перегревам и нестабильной работе. Интегрированное GPU доработано до соответствия требованиям API, DirectX 11 с поддержкой стандарта HDMI 1.4a и подключения до 3 мониторов; будут применяться два варианта графического ядра:

HD Graphics 2500 с частотами 650/1050 МГц в i3/i5 (схоже по уровню производительности с предыдущим поколением).

HD Graphics 4000 с частотами 650/1150 МГц (высокопроизводительное решение, ориентировано главным образом на ноутбуки, где использование дискретной графики наносит серьёзный удар по мобильности, в десктопных же процессорах можно получить лишь в составе редких специальных предложений.

Особенности архитектуры:

переход на 22-нм техпроцесс (улучшение производительности и снижение энергопотребления).

увеличение IPC (количества инструкций выполняемых за такт), дополнение системы команд четырьмя инструкциями ускоренного доступа к базовым регистрам (Front Side и Graphics Side), ускорение строковых инструкций REP MOVSB/STOSB, ускорение преобразования чисел с плавающей точкой из 16-битного формата в 32-битный формат.

кольцевая шина Ring Interconnect (более производительная чем QPI) объединяющая процессорные ядра, графическое ядро и системный агент через общий кэш последнего уровня (LLC, L3).

обратная совместимость с сокетом второго поколения процессоров Sandy Bridge.

новый 2- или 4-канальный контроллер DDR3, поддерживающий память до DDR3-2800 MT/s[2], и DDR3L.

встроенный контроллер PCI Express 3.0 (кроме процессоров i-3).

встроенная поддержка интерфейса Thunderbolt.

чипсет Panther Point с новым интерфейсом FDI, рассчитанным на одновременное подключение до трех дисплеев.

улучшенные технологии энергосбережения (конфигурируемое TDP, режим пониженного энергопотребления).

добавлен высокоскоростной и высококачественный аппаратный генератор случайных чисел с поддержкой стандартов ANSI X9.82, NIST SP 800-90 и NIST FIPS 140-2/3 сертификации уровня 2.

новая инструкция RDRAND для работы с генератором случайных чисел, возвращающая случайное число в 16-, 32- или 64-битный регистр.

добавлен новый режим защиты в режиме супервизора, предотвращающий исполнение кода из пользовательских страниц.

В 2013-м году выпустили Haswell - кодовое название микроархитектуры четвёртого поколения процессоров Intel Core, которая является третьим значительным изменением микроархитектуры, использующей транзисторы с трёхмерной структурой затвора. Для процессоров Haswell предназначено новое семейство чипсетов Intel 8-й серии, включающее в себя модели B85, H87, Q85, Q87 и Z87 для процессорного разъёма LGA 1150, которые осуществляют поддержку до 6 портов USB 3.0 (а также функция I/O Port Flexibility, позволяющую задавать, какие именно USB-порты будут функционировать как 3.0) и до 6 шин SATA III (при этом отсутствуют SATA II). Также, оптимизирована работа с SSD, используются улучшенные технологии Rapid Storageи Intel vPro, внедрена поддержка 4-потокового чтения через последовательный интерфейс, понижено энергопотребление и внесены другие улучшения.

Особенности архитектуры:

Конструктивное исполнение LGA 1150 (Socket H3).

Базовое количество ядер -- 2 или 4.

Полностью новый дизайн кэша.

Улучшенные механизмы энергосбережения.

Поддержка технологии Thunderbolt.

Интегрированный векторный сопроцессор.

Добавление инструкций AVX 2, FMA 6-битовых, инструкций BMI1 и BMI2.

Расширение команд TSX (Transactional Synchronization Extensions (англ.) русск.) для аппаратной поддержки транзакционной памяти (кроме процессоров с индексом K). В начале августа 2014 один из разработчиков обнаружил неправильную работу инструкций TSX, что Intel впоследствии подтвердила собственными тестами и выпустила новый микрокод, который полностью отключает новый набор команд. К “дефектным” процессорам относятся все модели Haswell и Haswell-E.

Память eDRAM объёмом 64 Мбайт (по некоторым сведениям -- 128 МБ) как отдельный кристалл, но в общей упаковке -- только в процессорах для BGA, например Core i7-4770R.

Энергопотребление на 30 % ниже по сравнению с аналогами из линейки Sandy Bridge, в некоторых режимах - в 20 раз ниже.

В чипе реализована возможность одновременной работы с четырьмя операндами, позволяющая за одну инструкцию совершать сразу две операции умножения и сложения либо вычитания.

Процессоры, построенные на архитектуре Haswell имеют дополнительный интегрированный регулятор напряжений (VRM, FIVR), выполненный в виде отдельного кристалла под общей теплораспределительной крышкой. FIVR имеет размеры около 13?8 мм и изготовлен по 90 нм процессу.

В 2014-м году выпустили Broadwell представляет собой перенос архитектуры Haswell на техпроцесс "14 нм". В отличие от предыдущих архитектур, Broadwell не заменит весь диапазон применений Haswell. На её основе не будут выпускаться дешевые процессоры для настольных компьютеров.

Ожидается запуск трёх основных вариантов Broadwell:

Чипы с BGA-корпусом (не используют сокет, а распаиваются непосредственно на материнской плате):

Broadwell-Y: Система на кристалле (СнК, SoC); тепловыделение не более 4.5 W и 3.5 Вт, для планшетных компьютеров и некоторых ноутбуков. В качестве графического решения используют GT2; поддерживают до 8 ГБ оперативной памяти LPDDR3-1600.

Broadwell-U: СнК; тепловыделение до 15 Вт для процессоров с 2 процессорными ядрами и графическим решением GT2 или GT3; до 28 Вт для двухъядерных процессоров с GT3. Предназначены для использования с чипсетом PCH-LP в ноутбуках и компактных настольных компьютерах NUC. Поддерживают либо до 16 ГБ ОЗУ DDR3L-1600, либо до 8 ГБ LPDDR3-1600.

Broadwell-H: варианты с тепловыделением до 37 Вт или до 47 Вт, для плат с чипсетами HM86, HM87, QM87 и HM97 для систем «всё-в-одном», плат размера Mini-ITX и других компактных форматов. 2 или 4 ядра (4 или 8 потоков соответственно), графическое решение GT3e или GT2. Поддержка до 32 ГБ ОЗУ DDR3L-1600. These are scheduled for Q2 2015.

Десктопная версия с разъёмом LGA 1150 2-го поколения:

Broadwell-C: четырёхядерная версия для настольных компьютеров с интегрированной графикой GT3e (Iris Pro 6200) и тепловыделением не более 65 Вт.

Разъём LGA 2011-v3:

Broadwell-EP: (обозначения Xeon E5-XXXX v4), для использования с серверным чипсетом C610 Wellsburg. До 18 ядер (до 36 потоков), до 45 МБ кеш-памяти, 40 линий PCI Express 3.0, тепловыделение до 70-160 Вт. Поддержка памяти - до 4 каналов DDR4-2400.

Broadwell-EX: платформа Brickland для серверов. Будут использовать Intel QuickPath Interconnect (QPI) версии 1.1, что позволяет создавать системы с более чем 8 процессорами (сокетами). Поддержка памяти - до DDR3-1600 либо до DDR4-3200.

Расширения инструкций:

ADX (инструкции ADOX/ADCX) для работы с числами произвольной точности.

Инструкция rdseed для генерации случайного числа размером 16, 32 или 64 бита. Для её использования в <immintrin.h> добавлены функции int _rdseedXX_step(uintXX_t *random_val, где XX -- размер бита).

В 2015-м году анонсировали Skylake -- кодовое название шестого поколения архитектуры центральных процессоров Intel Core, которая является четвёртым значительным изменением микроархитектуры Core согласно стратегии разработки микропроцессоров «Тик-так» компании Intel вслед за «тиком» Broadwell без изменения технологического процесса 14-нм уйдёт.

Особенности архитектуры:

14-нм технологический процесс.

Конструктивное исполнение LGA 1151.

Поддержка памяти DDR3L и DDR4 SDRAM (неофициально процессоры Skylake могут работать и с обычной DDR3 памятью, но нужно понимать, что напряжение выше 1,35 В может оказаться губительным для встроенного контроллера памяти процессора).

Поддержка технологии Thunderbolt 3.0 (Alpine Ridge).

IGP девятого поколения от HD Graphics 510ULT с 12 EU до Iris Pro Graphics 580 с 72 исполнительными устройствами, встроенным eDRAM-буфером ёмкостью 128 Мбайт, с суммарной пиковой производительностью до 1152 гигафлопс и поддержкой программных API DirectX 12, OpenGL 4.4 и OpenCL 2.0.

Поддержка 512-битных векторных инструкций AVX 3.2 (в серверных процессорах, MPX (Memory Protection Extensions) и ADX (Multi-Precision Add-Carry Instruction Extensions).

Поддержка SATA Express.

Новая шина — DMI 3.0 с пропускной способностью до 3,9 Гбайт/с в каждую сторону.

Встроенный процессор обработки изображений – ISP (Image Signal Processing), обладающий встроенным интерфейсом CSI (Camera Sensor Interface) с поддержкой до четырех внешних цифровых камер/сенсоров с разрешением до 13 Мп.

В 2015-м году Kaby Lake — кодовое название микроархитектуры процессоров Intel Core 7-го и 8-го поколения, которая является незначительным изменением микроархитектуры Core согласно стратегии разработки микропроцессоров «Тик-так» компании Intel вслед за «тиком» Broadwell и является усовершенствованным «таком» Skylake без изменения техпроцесса 14-нм. Анонс новой архитектуры состоялся 16 июля 2015 года, а появление процессоров в рознице состоялось в начале 2017 года

Особенности архитектуры:

14-нм технологический процесс 14FF+.

Конструктивное исполнение LGA 1151.

Базовое количество ядер — 2 или 4.

Чипсет 200-ой серии (Union Point); поддерживаются чипсеты 100-й серии (может потребоваться обновление BIOS).

Требования по теплоотводу (TDP) до 95 Вт (LGA 1151).

Поддержка DDR3L SDRAM и DDR4 SDRAM, ограниченная поддержка UniDIMM SO-DIMM.

Поддержка PCI Express 3.0.

Поддержка USB 3.1, в отличие от Skylake, где требуется наличие дополнительных контроллеров на материнской плате для работы USB 3.1 портов.

Поддержка Thunderbolt 3 с возможностью подключения до двух мониторов с разрешением 4K, либо один с разрешением 5K.

Опциональная память eDRAM 4-го уровня от 64 до 128 МБ.

Новая графическая архитектура для повышения производительности при работе с трёхмерной графикой и воспроизведения 4K видео.

Поддержка технологии памяти Intel Optane (3D Xpoint).

Поддержка формата видеосжатия HEVC (H.265) с глубиной цвета 10 бит и VP9 с глубиной цвета 10 бит и ускорением декодирования.

Нативная поддержка технологии защиты медиаконтента HDCP 2.2.

Официальная совместимость только с Microsoft Windows 10 и отсутствие таковой с предыдущими операционными системами Microsoft.

Заключение

В 2017-м году был выпущен Coffee Lake — кодовое название микроархитектуры восьмого поколения процессоров Intel Core, которая является незначительным изменением микроархитектуры Core согласно стратегии разработки микропроцессоров «Тик-так» компании Intel вслед за «тиком» Broadwell и является усовершенствованным «таком» Kaby Lake без изменения техпроцесса 14 нм. Основным отличием архитектуры является увеличение до шести количества ядер процессора в настольных (Coffee Lake-S) и мобильных (Coffee Lake-H) вариантах процессора. Тепловой пакет (TDP) для настольных процессоров составляет 95 Вт, мобильных — до 45 Вт, а «ультрабучной» категории Coffee Lake-U — 28 Вт. Настольные процессоры имеют встроенную графику Intel UHD Graphics 630 c eDRAM и поддержкой DP 1.2 на HDMI 2.0 и HDCP 2.2. Производительность процессоров Coffee Lake на 15 процентов больше по сравнению с процессорами Kaby Lake.

Компания Intel сообщает о 30-процентном приросте производительности процессоров Coffee Lake в тесте SYSmark 2014 в сравнении с процессорами Skylake U-серии с TDP 15 Вт.

Чипы официально анонсированы 24 сентября 2017 года и стали доступны для покупки, начиная с 5 октября 2017 года. Из-за повышенных требований к системе питания гнезда LGA 1151 процессоры Coffee Lake совместимы только с материнскими платами на чипсете 300-й серии. Однако данный факт опровергли энтузиасты из Китая, модифицировав микрокод BIOS. После чего экспертам удалось запустить процессоры 7-го поколения на плате с чипсетом Z370 и наоборот, 4-ядерные процессоры 8-го поколения на плате с чипом Z170.

Ключевые отличия от архитектуры Kaby Lake:

Микроархитектура новых CPU практически не претерпела изменений.

Увеличена производительность многопоточных вычислений: до 4 процессорных ядер в моделях процессоров i3; До 6 ядер в моделях i5 и i7;

Увеличен размер кэша уровня 3 в соответствии с количеством ядер; Увеличены частоты в турбо режиме в моделях процессоров i5 и i7 на 200 МГц;

Увеличена тактовая частота встроенной графики на 50 МГц; Добавлена поддержка памяти DDR4 до 2666 МГц (для процессоров i5 и i7) и 2400 МГц (для i3 процессора); Память DDR3 больше не поддерживается;

Тепловая мощность (TDP) до 95 Вт (в LGA 1151), при активации турборежима доходящая до 145 Вт.

Тесты IPC (Instructions per cycle) не показывают никакой разницы в сравнении со Skylake или Kaby Lake.

21 августа 2017 года Intel заявила, что восьмое поколение процессоров Core будет базироваться на нескольких микроархитектурах, включая Kaby Lake, Coffee Lake и Cannonlake.

Список литературы

Цилькер Б. Я., Орлов С.А. Организация ЭВМ и систем. СПб.: Питер, 2006. - 668 с.
Гук М., Юров В. Процессоры Pentium 4, Athlon и Duron. - СПб.: Питер, 2002. - 512 c.
Таненбаум Э. Архитектура компьютеров. СПб.: Питер, 2007. - 848 с.
В.В.Корнеев, А.В.Киселев Современные микропроцессоры, 3-е изд., перераб. и доп. - СПб.: БХВ-Петербург, 2003. - 440 с.
Корнеев В.В. Параллельные вычислительные системы. - М.: Нолидж, 1999. - 311 c.
Касперски К. Техника оптимизации программ. Эффективное использование памяти. - СПб.: БХВ-Петербург, 2003. - 464 с.
Грушин В.В. Выполнение математических операций в ЭВМ. Погрешности компьютерной арифметики: Учебное пособие / СПбГЭТУ "ЛЭТИ". СПб., 1999. 56 с.
Папков В.И. Система памяти ЭВМ (Функциональный подход). Учеб. пособие. СПб.: Изд.центр СПбГМТУ. 2002. 238 с.
Столлингс В. Структурная организация и архитектура компьютерных систем. 5-е издание. - М.: Издательский дом "Вильямс", 2002. - 896 с.
Антошина И.В., Котов Ю.Т. Микропроцессоры и микропроцессорные системы (аналитический обзор): Учебное пособие. - М.: МГУЛ, 2005. - 432 с.
Зубков С.В. Assembler для DOS, Windows и UNIX. - М. ДМК, 2006. - 608 с.
Шнитман В. Современные высокопроизводительные компьютеры, информационно-аналитические материалы Центра Информационных Технологий, 1996. (http://www.citforum.ru/hardware/svk/contents.shtml)
Информационно-аналитические материалы по параллельным вычислениям (http://www.parallel.ru, http://www.ccas.ru , www.mcs.anl.gov).
Top 500 Supercomputer Sites (http://www.top500.org).
The Green 500 List, http://green500.org
Суперкомпьютеры Top 50 (http://supercomputers.ru).
Хеннинг Дж. SPEC CPU 2000: определение производительности в новом тысячелетии (http://www.osp.ru/os/2000/07-08/178080/).
D. Sima, T. Fountain, P. Kacsuk. Advanced computer architectures. New York: Addison Wesley Longman Inc., 1997.
Intel64 and IA-32 Architectures Software Developer's Manual, 2007.
PowerPC User Instruction Set Architecture, 2005.
IBM PowerPC 970FX RISC Microprocessor User's Manual, 2005.
Intel Itanium Architecture Software Developer's Manual, 2006.
Ulrich Drepper, What Every Programmer Should Know About Memory, 2007. - P. 114.
Эндрюс Г.Р. Основы многопоточного, параллельного и распределенного программирования.: Пер.с англ. - М.: Издательский дом "Вильямс", 2003. - 512 c.
В.В.Воеводин, Вл.В.Воеводин. Параллельные вычисления. - СПб.: БХВ-Петербург, 2002. - 608 с.
Список микропроцессоров Intel (https://ru.wikipedia.org/wiki/Список_микропроцессоров _Intel)