Designer | Intel, AMD |
---|---|
Биты | 16-бит, 32-бит и 64-бит |
Введены | 1978 (16-бит), 1985 (32-бит), 2003 (64-бит) |
Дизайн | CISC |
Тип | Регистр – память |
Кодирование | Переменная (от 1 до 15 байтов) |
Ветвление | Код условия |
Endianness | Little |
Размер страницы | 8086 - i286 : нет. i386, i486 : страницы 4 КБ. P5 Pentium : добавлены страницы 4 МБ. (Legacy PAE : 4 КБ → 2 МБ). x86-64 : добавлены страницы 1 ГБ |
Расширения | x87, IA-32, x86-64, MMX, 3DNow!, SSE, SSE2, SSE3, SSSE3, SSE4, SSE4.2, SSE5, AES-NI, CLMUL, RDRAND, SHA, MPX, SGX, XOP, F16C, ADX, BMI, FMA, AVX, AVX2, AVX512, VT-x, AMD-V, TSX, ASF |
Open | Частично. Для некоторых расширенных функций x86 может потребоваться лицензия от Intel; x86-64 может потребоваться дополнительная лицензия от AMD. Процессор 80486 находится на рынке более 20 лет и поэтому не может быть предметом патентных притязаний. Таким образом, подмножество архитектуры x86 до 586 является полностью открытым. |
Регистры | |
Общее назначение |
|
с плавающей запятой |
x86 - это семейство архитектуры наборов команд, первоначально разработанные Intel на основе Intel 8086 микропроцессор и его вариант 8088. 8086 был представлен в 1978 году как полностью 16-битное расширение 8-битного 8080 микропроцессора Intel с сегментацией памяти в качестве решение для адресации большего объема памяти, чем может покрыть простой 16-битный адрес. Термин «x86» появился потому, что имена нескольких преемников процессора Intel 8086 заканчиваются на «86», включая 80186, 80286, 80386 и 80486 процессоров.
Многие дополнения и расширения были добавлены к набору инструкций x86 на протяжении многих лет, почти постоянно с полной обратной совместимостью. Архитектура реализована в процессорах Intel, Cyrix, AMD, VIA Technologies и многих других компаний; есть также открытые реализации, такие как платформа Zet SoC (в настоящее время неактивна). Тем не менее, из них только Intel, AMD, VIA Technologies и DMP Electronics имеют лицензии на архитектуру x86, и из них только первые два активно производят современные 64-битные разработки.
Этот термин не является синонимом совместимости с IBM PC, так как это подразумевает множество другого компьютерного оборудования ; встроенные системы, а также компьютеры общего назначения использовали чипы x86 до того, как открылся рынок ПК-совместимых, некоторые из них - до IBM PC (1981) сам.
По состоянию на 2018 год большинство проданных персональных компьютеров и ноутбуков основаны на архитектуре x86, в то время как мобильные категории, такие как смартфоны или планшеты преобладают ARM ; в верхнем сегменте x86 продолжает доминировать в сегментах рабочих станций и облачных вычислений, требующих интенсивных вычислений.
В 1980-х и начале 199 0s, когда 8088 и 80286 все еще использовались, термин x86 обычно представлял любой 8086-совместимый процессор. Сегодня, однако, x86 обычно подразумевает двоичную совместимость также с 32-битным набором инструкций 80386. Это связано с тем, что этот набор инструкций стал чем-то вроде самого низкого общий знаменатель для многих современных операционных систем, а также, вероятно, потому, что этот термин стал общепринятым после введения 80386 в 1985 году.
Через несколько лет после появления 8086 и 8088, Intel добавила некоторая сложность в схеме именования и терминологии, поскольку «iAPX» амбициозного, но неудачного процессора Intel iAPX 432 был опробован на более успешном семействе чипов 8086, примененном как своего рода префикс системного уровня. Таким образом, система 8086, включающая сопроцессоры, такие как 8087 и 8089, а также более простые системные микросхемы Intel, была описана как система iAPX 86. Были также термины iRMX (для операционных систем), iSBC (для одноплатных компьютеров) и iSBX (для многомодульных плат на основе архитектуры 8086) - все вместе под заголовком Microsystem 80. Однако эта схема именования была довольно временной., просуществовавшей несколько лет в начале 1980-х.
Хотя 8086 в первую очередь разрабатывался для встроенных систем и небольших многопользовательских или однопользовательских компьютеров, в основном как ответ на успешный 8080-совместимый Zilog Z80, линейка x86 вскоре расширилась по функциям и вычислительной мощности. Сегодня x86 повсеместно используется как на стационарных, так и на портативных персональных компьютерах, а также используется в компьютерах среднего уровня, рабочих станциях, серверах и большинстве новых суперкомпьютеров кластеров. из списка TOP500. Большое количество программного обеспечения, включая большой список операционных систем x86, используют оборудование на базе x86.
Однако современные x86 относительно редко встречаются в встроенных системах и небольших маломощных приложениях (использующих крошечные батареи), а также на рынках недорогих микропроцессоров, таких как бытовая техника и игрушки не имеют значительного присутствия x86. Здесь распространены простые 8- и 16-разрядные архитектуры, хотя x86-совместимые VIA C7, VIA Nano, AMD Geode, Athlon Neo и Intel Atom являются примерами 32- и 64-битных конструкций, используемых в некоторых относительно маломощных и недорогих сегментах.
Было несколько попыток, в том числе самой Intel, положить конец рыночному доминированию «неизящной» архитектуры x86, созданной непосредственно из первых простых 8-битных микропроцессоров. Примерами этого являются iAPX 432 (проект, первоначально названный «Intel 8800»), Intel 960, Intel 860 и Intel / Hewlett-Packard Itanium архитектура. Однако постоянное совершенствование x86 микроархитектур, схем и производства полупроводников затруднит замену x86 во многих сегментах. 64-разрядное расширение AMD для x86 (на которое Intel в конечном итоге ответила совместимым дизайном) и масштабируемость чипов x86 в виде современных многоядерных процессоров подчеркивают x86 как пример того, как можно сопротивляться постоянному совершенствованию установленных отраслевых стандартов. конкуренция со стороны совершенно новых архитектур.
В таблице ниже перечислены модели процессоров и серии моделей, реализующие варианты набора команд x86 , в хронологическом порядке. Каждая позиция характеризуется значительно улучшенными или коммерчески успешными процессорами микроархитектурой.
Поколение | Введение | Известные модели процессоров | Адресное пространство | Основные особенности | |||
---|---|---|---|---|---|---|---|
Линейный | Виртуальный | Физический | |||||
x86 | 1-й | 1978 | Intel 8086, Intel 8088 (1979) | 16-битный | NA | 20-битный | 16 -бит ISA, IBM PC (8088), IBM PC / XT (8088) |
1982 | Intel 80186, Intel 80188. NEC V20 / V30 (1983) | 8086-2 ISA, встроенный (80186/80188) | |||||
2nd | Intel 80286 и клоны | 30-битный | 24-битный | защищенный режим, IBM PC XT 286, IBM PC AT | |||
3-й (IA-32 ) | 1985 | Intel 80386, AMD Am386 (1991) | 32-бит | 46-бит | 32-битный | 32-битный ISA, разбиение на страницы, IBM PS / 2 | |
4-й (конвейерная обработка, кэш) | 1989 | Intel 80486. Cyrix Cx486 S /D LC (1992). AMD Am486 (1993) / Am5x86 (1995) | конвейерная обработка, на кристалле x87 FPU (486DX), на кристалле кэш | ||||
5-й. (Суперкалар ) | 1993 | Intel Pentium, Pentium MMX (1996) | Суперскаляр, 64-битная шина данных, более быстрый FPU, MMX (Pentium MMX), APIC, SMP | ||||
1994 | NexGen. AMD 5k86 /K5 (1996) | Дискретная микроархитектура (µ-op перевод) | |||||
1995 | Cyrix Cx5x86. Cyrix 6x86 / MX (1997) / MII (1998) | динамическое выполнение | |||||
6-й . (PAE, трансляция µ-op) | 1995 | Intel Pentium Pro | 36-бит (PAE ) | преобразование μ-op, условные инструкции перемещения, динамическое выполнение, спекулятивное выполнение, 3-процессорный суперскаляр x86, суперскалярный FPU, PAE, встроенный в кристалл кэш L2 | |||
1997 | Intel Pentium II, Pentium III (1999). Celeron (1998), Xeon (1998) | на корпусе (Pentium II) или на кристалле ( Celeron) L2 кэш, SSE (Pentium III), Socket 370 или (Xeon) | |||||
1997 | AMD K6 / K6-2 (1998) / K6-III (1999) | 32-бит | 3DNow!, Трехуровневая система кэширования (K6-III) | ||||
Enhanced Platform | 1999 | AMD Athlon, Athlon XP /MP (2001). Duron (2000), Sempron (2004) | 36-bit | MMX +, 3DNow! +, Шина с двойной прокачкой, Слот A или Socket A | |||
2000 | Transmeta Crusoe | 32-бит | CMS процессор платформы x86 с питанием, VLIW -128 ядро, встроенный контроллер памяти, логика встроенного моста PCI | ||||
Intel Pentium 4 | 36-битный | SSE2, HTT (Northwood), NetBurst, четырехканальный накачанная шина, Trace Cache, Socket 478 | |||||
2003 | Intel Pentium M. Intel Core (2006), Pentium Dual-Core ( 2007) | µ-op fusion, XD bit (Dothan) (Intel Core "Yonah") | |||||
Transmeta Efficeon | CMS 6.0.4, VLIW -256, NX бит, HT | ||||||
IA-64 | 64-битный переход. 1999 ~ 2005 | 2001 | Intel Itanium (2001 ~ 2017) | 52-битная | 64-битная архитектура EPIC, 128-битный пакет инструкций VLIW, встроенное аппаратное обеспечение IA-32 H / W для работы с ОС x86 и приложениями x86 (ранние поколения), программное обеспечение IA-32 EL, позволяющее использовать приложения x86 (Itanium 2), файлы регистров Itanium переназначены на регистры x86 | ||
x86-64 | 64-битный расширенный. с 2001 года | x86-64 - это 64-разрядная расширенная архитектура x86, в ее Legacy Mode сохраняется вся неизмененная архитектура x86. В собственной архитектуре процессоров x86-64, работающих в 64-битном режиме, отсутствует режим доступа при сегментации, поскольку в настоящее время реализовано только 48-битное линейное адресное пространство с 64-битным архитектурным разрешением; адаптированная архитектура IA-32, находящаяся в режиме совместимости наряду с 64-битным режимом, предоставляется для поддержки большинства приложений x86 | |||||
2003 | Athlon 64 /FX /X2 (2005), Opteron. Sempron (2004) / (2008). Turion 64 (2005) / X2 (2006) | 40-битный | AMD64 (кроме некоторые процессоры Sempron представлены исключительно как процессоры x86), контроллер памяти на кристалле, HyperTransport, двухъядерный процессор на кристалле (X2), AMD-V (Athlon 64 Orleans), Socket 754 / 939 / 940 или AM2 | ||||
2004 | Pentium 4 (Prescott). Celeron D, Pentium D (2005) | 36-битный | EM64T (включен на некоторых моделях Pentium 4 и Celeron D), SSE3, 2-го поколения. Конвейерная обработка NetBurst, двухъядерный (на кристалле: Pentium D 8xx, на кристалле: Pentium D 9xx), Intel VT (Pentium 4 6x2), сокет LGA 775 | ||||
2006 | Intel Core 2. Pentium Dual-Core (2007). Celeron Dual-Core (2008) | Intel 64 (<<== EM64T), SSSE3 (65 нм), широкий динамическое выполнение, объединение микроопераций, объединение макроопераций в 16-битном и 32-битном режиме, четырехъядерный процессор на кристалле (Core 2 Quad), интеллектуальный общий кэш L2 (Intel Core 2 "Merom") | |||||
2007 | AMD Phenom /II (2008). Athlon II (2009), (2009) | 48-бит | Монолитный четырехъядерный процессор (X4) / трехъядерный (X3), SSE4a, Rapid Virtualization Indexing (RVI), HyperTransport 3, AM2 + или AM3 | ||||
2008 | Intel Core 2 (45 нм) | 40-бит | SSE4.1 | ||||
Intel Atom | для нетбука или процессора интеллектуальных устройств с низким энергопотреблением, повторно используется ядро P54C | ||||||
Intel Core i7. Core i5 (2009), Core i3 (2010) | QuickPath, встроенный GMCH (Clarkdale ), SSE4.2, Расширенные таблицы страниц (EPT) для виртуализация, объединение макросов в 64-битном режиме (Intel Xeon «Bloomfield» с микроархитектурой Nehalem) | ||||||
VIA Nano | аппаратное шифрование ; адаптивное управление питанием | ||||||
2010 | AMD FX | 48-битное | восьмиядерное ядро, CMT (кластерная многопоточность), FMA, OpenCL, AM3 + | ||||
2011 | AMD APU серии A и E (Llano ) | 40-битный | встроенный GPGPU, PCI Express 2.0, Socket FM1 | ||||
AMD APU C, E и Серия Z (Bobcat ) | 36-бит | APU интеллектуального устройства с низким энергопотреблением | |||||
Intel Core i3, Core i5 и Core i7. (Sandy Bridge / Ivy Bridge ) | Внутреннее кольцо, декодированный кэш µ-op, LGA 1155 разъем. | ||||||
2012 | AMD APU A Series ( Bulldozer, Trinity и новее) | 48-бит | AVX, APU на базе Bulldozer, Socket FM2 или Socket FM2 + | ||||
Intel Xeon Phi (Knights Corner) | 48-бит | сопроцессор с питанием от ОС PCI-E Card Сформированный сопроцессор для системы на базе XEON, много ядерных чипов, в порядке P54C, очень широкий VPU (512-битный SSE), инструкции LRBni (8 × 64-бит) | |||||
2013 | AMD Jaguar. (Athlon, Семпрон) | 48- бит | SoC, игровая консоль и процессор интеллектуальных устройств с низким энергопотреблением | ||||
Intel Silvermont. (Atom, Celeron, Pentium) | 36-бит | SoC, процессор интеллектуальных устройств с низким / сверхнизким энергопотреблением | |||||
Intel Core i3, Core i5 и Core i7 (Haswell / Broadwell ) | 39-битные | AVX2, FMA3, TSX, BMI1 и BMI2 инструкции, LGA 1150 socket | |||||
2015 | Intel Broadwell-U. (Intel Core i3, Core i5, Core i7, Core M, Pentium, Celeron ) | SoC, на кристалле Broadwell-U PCH-LP (многокристальный модуль) | |||||
2015/2016 | Intel Skylake / Kaby Lake / Cannon Lake. (Intel Core i3, Core i5, Core i7 ) | 46-бит | AVX-512 (только Cannon Lake-U и рабочие станции / серверы Skylake) | ||||
2016 | Intel Xeon Phi ( Knights Landing) | 48-бит | Многоядерный процессор и сопроцессор для системы Xeon s, ядро Airmont (Atom) на базе | ||||
2016 | AMD Bristol Ridge. (AMD (Pro) A6 / A8 / A10 / A12) | 48-бит | Встроенный FCH на кристалле, SoC, разъем AM4 | ||||
2017 | AMD Ryzen Series / AMD Epyc Series | Реализация AMD SMT, несколько кристаллов на кристалле. | |||||
2017 | Zhaoxin WuDaoKou (KX-5000, KH-20000) | Zhaoxin - первая новая архитектура x86-64 | |||||
2018/2019 | Intel Sunny Cove (Ice Lake-U и Y) | 57-bit | Первая реализация Intel AVX-512 для потребительского сегмента. Добавление инструкций векторной нейронной сети | ||||
Программная эмуляция. ARM64 | 2017 | Windows 10 на ARM64 | Сотрудничество между Microsoft и Qualcomm по переносу Windows 10 на платформу ARM64 с поддержкой приложений x86 эмулятором CHPE, начиная с 1709 (16299.15) | ||||
Era | Release | Модели ЦП | Физическое адресное пространство | Новые функции |
В разное время такие компании, как IBM, NEC, AMD, TI, STM, Fujitsu, OKI, Siemens, Cyrix, Intersil, CT, NexGen, UMC и DMP приступили к разработке или производству процессоров x86 (CPU), предназначенных для персональных компьютеров. а также встроенные системы. Такие реализации x86 редко являются простыми копиями, но часто используют различные внутренние микроархитектуры, а также различные решения на электронном и физическом уровнях. Вполне естественно, что ранние совместимые микропроцессоры были 16-битными, тогда как 32-битные конструкции были разработаны намного позже. На рынке персональных компьютеров реальные количества начали появляться примерно в 1990 году с процессорами, совместимыми с i386 и i486, часто называемыми аналогично оригинальным чипам Intel. Другие компании, которые разработали или изготовили процессоры x86 или x87, включают ITT Corporation, National Semiconductor и Weitek.
, следуя полностью конвейерный i486, Intel представила торговую марку Pentium (которая, в отличие от цифр, могла быть торговой маркой ) для своих новых наборов суперскалярных проектов x86. Теперь, когда схема именования x86 была официально разрешена, поставщики x86 должны были быть выбраны другие названия для своих x86-совместимых продуктов, и другие решили продолжить использование вариантов схемы нумерации: IBM сотрудничает с Cyrix для создания линий 5x86, а затем очень эффективных линий 6x86 (M1) и 6x86 MX (MII ) конструкций Cyrix, которые были первыми микропроцессорами x86, в которых реализовано переименование регистров для обеспечения возможности спекулятивного выполнения. Тем временем AMD спроектировала и изготовила усовершенствованный, но с задержкой 5k86 (K5 ), который внутренне установлен на более ранней конструкции AMD 29K RISC ; Подобно NexGen Nx586, он использовал стратегию, в которой выделенные этапы конвейера преобразовали инструкции x86 в унифицированные и легко обрабатываемые микрооперации, метод, который имеет по сей день остается функцией для многих проектов x86.
Некоторые ранние версии этих микропроцессоров имели проблемы с отводом тепла. 6x86 также пострадал от незначительных проблем совместимости, в Nx586 не хватало блока с плавающей запятой (FPU) и (тогда решающей) совместимости по выводам, в то время как K5 был представлен несколько разочаровывающая информация, когда (в конце концов) был представлен. Незнание альтернативной серии Pentium, что эти конструкции были сравнительно неудачными, несмотря на то, что K5 имел очень хорошую совместимость с Pentium, а 6x86 был значительно быстрее, чем Pentium на целочисленный код. AMD позже смогла зарекомендовать себя как серьезный соперник с набором процессоров K6, который уступил место очень успешным Athlon и Оптерон. Были и другие претенденты, такие как Centaur Technology (ранее IDT ), Rise Technology и Transmeta. VIA Technologies 'энергоэффективные процессоры C3 и C7, разработанные компанией Centaur, продаются уже много лет. Новейшая разработка Centaur, VIA Nano, является их первым процессором с суперскалярным и спекулятивным исполнением. Он представлен в том виде, в котором представлен первый процессор Intel «в порядке очереди», начиная с P5 Pentium, Intel Atom.
Архитектура набора команд дважды была расширена до большего размера слова. В 1985 году Intel выпустила 32-битный 80386 (позже известный как i386), который постепенно заменил более ранние 16-битные чипы в компьютерах (хотя обычно не во встроенных систем ) в последующие годы; эта расширенная модель устанавливаемой называлась архитектурой i386 (как и ее первая реализация), но позже Intel назвала ее IA-32, когда представила свою (несвязанную) архитектуру IA-64.
В 1999–2003 гг. AMD расширила эту 32-битную архитектуру до 64 бит и ранних документах называла ее x86-64, а позже - AMD64. Вскоре Intel архитектурные расширения AMD под названием IA-32e, позже использовала имя EM64T и, наконец, Intel 64. Microsoft и Sun Microsystems / Oracle также используют термин «X64», в то время как многие дистрибутивы Linux и BSD также используют термин «amd64». Microsoft Windows, например, обозначает свои 32-разрядные версии как «x86» и 64-разрядные версии как «x64», в то время как установочные файлы 64-разрядных версий Windows необходимо поместить в каталог с именем «AMD64».
Архитектура x86>Архитектура x86 представляет собой конструкцию, в основном дизайн «CISC » с упором на обратную совместимость. Однако набор команд не является типичным CISC, а в основном представляет собой расширенную версию простых восьмибитных архитектур 8008 и 8080. Включена байтовая адресация, и слова сохраняются в памяти с порядком байтов little-endian. Доступ к памяти по невыровненным адресам разрешен для всех допустимых размеров слова. Наибольший собственный размер для целых чисел арифметических адресов и адресов (или смещений ) составляет 16, 32 или 64 бита в зависимости от поколения архитектуры (новые процессоры также включают прямую поддержку меньших целых чисел). Множественные скалярные значения могут обрабатываться одновременно через модуль SIMD, представленный в более поздних поколениях, как описано ниже. Немедленное смещение адресации и немедленные данные могут быть выражены как 8-битные величины для часто встречающихся случаев или контекстов, где достаточно диапазона128..127. Поэтому типичные инструкции имеют длину 2 или 3 байта (хотя некоторые из них намного ниже, а некоторые - однобайтовые).
Для дальнейшего сохранения пространства кодирования большинства регистров выражаются в кодах операций с использованием трех или четырех битов, последний - через префикс кода операции в 64-битном режиме, в то время как не более одного операнда инструкции может быть ячейкой памяти. Этот операнд памяти также может быть адресатом (или комбинированным устройством и назначением), в то время как другой источник операнд, может быть либо регистровым, либо непосредственным. Среди прочего, это увеличивает размер кода, который конкурирует с восьмиразрядными машинами, и позволяет эффективно использовать кэш-память инструкций. Относительно небольшое количество регистров общего назначения (также унаследованных от его 8-битных предков) сделало относительную адресацию (с использованием немедленных смещений) важным методом доступа к операндам, особенно в стеке. Поэтому много работы было вложено в то, чтобы сделать такие доступными быстрыми средствами, как и доступ к регистрам, чтобы получить пропускную способность инструкции за один цикл, в большинстве случаев, когда данные доступны, доступны в кэше верхнего уровня.
Специальный процессор с плавающей точкой с 80-битными внутренними регистрами, 8087, разработан для оригинального 8086. Этот микропроцессор превратился в расширенный 80387, более поздние процессы включали обратно совместимую версию функциональности на том же микропроцессоре, что и главный процессор. В дополнение к этим, современные проекты x86 также содержат SIMD -блок (см. SSE ниже), где инструкции могут работать с (одним или двумя) 128-битными словами, каждый из которых содержат два или четыре числа с плавающей запятой (каждое размером 64 или 32 бита соответственно) или альтернативно, 2, 4, 8 или 16 целых чисел (каждое 64, 32, 16 или 8 бит соответственно).
Наличие широких регистров SIMD означает, что необходимые процессоры x86 могут загружать или хранить до 128 бит данных в одной инструкции, а также выполнять побитовые операции над полными 128-битными количествами в параллельно. Процессоры Intel Sandy Bridge добавили инструкции Advanced Vector Extensions (AVX), расширивры регистры SIMD до 256 бит. Первоначальные многие основные инструкции Intel, реализованными процессорами Knights Corner Xeon Phi, и инструкции AVX-512, реализованными процессорами Knights Landing Xeon Phi и Skylake-X используют регистры SIMD шириной 512 бит.
Во время выполнения текущие процессы x86 используют несколько дополнительных шагов декодирования для разделения инструкций на более мелкие части, называемые микрооперациями. Затем они передаются в блок управления, который буфери обеспечивает их в соответствии с семантикой x86, чтобы они могли происходить частично, одним из нескольких (более или менее привлекательных) исполнений. ед.. Таким образом, эти современные архитектуры x86 представляют собой конвейерными, суперскалярными, а также способны вне очереди и спекулятивным исполнением (через ветвь предсказание, переименование регистров и прогнозирование зависимости от памяти ), что означает, что они могут выполнять несколько (частичных или полных) инструкций x86 одновременно, и не обязательно в том же порядке, что и заданный в потоке инструкций. Некоторые процессоры Intel (Xeon Foster MP, некоторые Pentium 4 и некоторые процессоры Nehalem и более поздние Intel Core ) и процессоры AMD (начиная с с из Zen ) также способны совместной многопоточности с двумя потоками на ядро (Xeon Phi имеет четыре потока на ядро). Некоторые процессоры Intel транзакционной памяти (TSX ).
Когда этот метод представлен в середине 1990-х годов, этот метод иногда назывался «ядро RISC» или «перевод RISC», отчасти по маркетинговым причинам, но также потому, что эти микрооперации имеют общие свойства с видом типа инструкций RISC. Однако использование микрокод (используемый с 1950-х годов). Новый метод отличается главным образом тем, что происходит в микрооперации теперь происходит асинхронно. Отсутствие необходимости синхронизировать исполнительные блоки с этапами декодирования открывает возможности для большего анализа (буферизованного) кодового потока и, следовательно, позволяет обнаруживать операции, которые могут одновременно загружать одного исполнительного блока.
Последние процессоры также делают обратное, когда это необходимо; они объединяют стандарты выполнения x86 (например, сравнение с последующим условным переходом) в более сложную микрооперацию, которая лучше соответствует модели выполнения, таким образом, может работать быстрее или с меньшим задействованными машинными ресурсами.
Другой способ попытаться повысить производительность - кэшировать декодированные микрооперации, чтобы процессор мог напрямую обращаться к данным микрооперациям из специального кеша вместо их повторного декодирования. Intel последовала этому подходу с помощью функций Execution Trace Cache в своей микроархитектуре NetBurst (для процессоров Pentium 4) и в Decoded Stream Buffer (для процессоров Core, начиная с Sandy Bridge).>использовали совершенно другой метод в своих Crusoe x86-совместимых процессоров. Они использовали своевременную трансляцию для собственного преобразования x86 в набор инструкций VLIW ЦП. Transmeta утверждала, что их подход позволяет создать более энергоэффективные конструкции, поскольку ЦП может отказаться от сложного этапа преобразования более эффективных реализаций x86.
Миникомпьютеры в конце 1970-х годов работали с ограничением по адресу 16-битных 64- КБ, поскольку память стала дешевле. Некоторые миникомпьютеры, такие как PDP-11, использовали сложные схемы переключения банков или в случае Digital's VAX, перепроектировали гораздо более дорогие процессоры, которые могли напрямую обрабатывать 32-битную адресацию и данные.. Исходный 8086, на основе простого микропроцессора 8080 и в первую очередь ориентированный на очень маленькие и другие компьютеры и другие устройства специализированные, вместо этого использовали простые сегментные регистры, которые увеличивали ширину адреса всего на 4 бита. Умножив адрес размером 64 КБ на 16, 20-разрядный адрес мог адресовать в общей сложности один мегабайт (1 048 576 байт), что было довольно большим объемом для небольшого компьютера в то время. Концепция сегментных регистров не была для многих мэйнфреймов, использовала сегментные регистры для быстрого переключения новой между задачами. На практике на x86 это была (есть) очень критичная реализация, которая сильно усложняла общие задачи программирования и компиляторы. Однако архитектура вскоре позволила линейную 32-битную адресацию (начиная с 80386 в конце 1985 г.), но основными участниками (таким как Microsoft ) потребовалось несколько лет, чтобы преобразовать их 16-битную системы. Таким образом, 80386 (и 80486) в основном использовался как быстрый (но все еще основанный на 16-битном) 8086 в течение многих лет.
Данными и кодом можно было управлять в «близких» 16-битных сегментах в пределах 64 КБ части общего адресного пространства 1 МБ, или компилятор мог работать в «дальнем» режиме, используя 32- битный сегмент : пары смещений
достигают (только) 1 МБ. Хотя к середине 1980-х это также оказалось весьма ограничивающим, он работал на развивающемся рынке ПК и упростил перевод программного обеспечения со старых 8008, 8080, 8085 и Z80 на более новый процессор. В 1985 году модель адресации 16-битных сегментов была фактически исключена за счет введения 32-битных регистров смещения в конструкции 386.
В реальном режиме сегментация достигается путем сдвига адреса сегмента влево на 4 бита и добавления смещения для получения окончательного 20-битного адреса. Например, если DS - A000h, а SI - 5677h, DS: SI будет указывать на абсолютный адрес DS × 10h + SI = A5677h. Таким образом, общее адресное пространство в реальном режиме составляет 2 байта, или 1 МБ, довольно впечатляющая цифра для 1978 года. Все адреса памяти состоят из сегмента и смещения; каждый тип доступа (код, данные или стек) имеет связанный с ним регистр сегмента по умолчанию (для данных это обычно DS, для кода - CS, а для стека - SS). Для доступа к данным сегментный регистр может быть явно указан (с использованием префикса переопределения сегмента) для использования любого из четырех сегментных регистров.
В этой схеме две разные пары сегмент / смещение могут указывать на одно абсолютное местоположение. Таким образом, если DS - A111h, а SI - 4567h, DS: SI будет указывать на тот же A5677h, что и выше. Такая схема делает невозможным одновременное использование более четырех сегментов. CS и SS жизненно важны для правильного функционирования программы, так что только DS и ES могут использоваться для указания на сегменты данных вне программы (или, точнее, вне текущего выполняемого сегмента программы) или стека.
В защищенном режиме, представленном в 80286, регистр сегмента больше не содержит физический адрес начала сегмента, но содержит «селектор», который указывает на системный уровень структура, называемая дескриптором сегмента. Дескриптор сегмента содержит физический адрес начала сегмента, длину сегмента и права доступа к этому сегменту. Смещение сравнивается с длиной сегмента, причем смещения относятся к местоположениям за пределами сегмента, вызывая исключение. Смещения, относящиеся к местоположениям внутри сегмента, объединяются с физическим адресом начала сегмента, чтобы получить физический адрес, соответствующий этому смещению.
Сегментированный характер может затруднить программирование и проектирование компилятора, поскольку использование ближних и дальних указателей влияет на производительность.
Режимы адресации для 16-битных процессоров x86 можно резюмировать формулой:
Режимы адресации для 32-битных x86 процессоров, а также для 32-разрядного кода на 64-разрядных процессорах x86 можно обобщить формулой:
Можно резюмировать режимы адресации для 64-битного кода на 64-битных процессорах x86. по формуле:
Относительная адресация инст рукций в 64-битном коде (RIP + displacement, где RIP - это регистр указателя инструкций ) упрощает позиционно-независимого кода (используется в разделяемых библиотекх в некоторых операционных системах).
У 8086 было 64 Кбайт восьмибитного (или, альтернативно, 32 Кбайт 16-битного) I / O пространства и 64 Кбайт (один сегмент) стека в памяти, поддерживаемой компьютерным оборудованием. В стек могут быть помещены только слова (два байта). Стек увеличивается в сторону численно меньших адресов, причем SS: указывает на последний отправленный элемент. Имеется 256 прерываний, которые могут быть вызваны как аппаратными, так и программными средствами. Прерывания могут быть каскадными, используя стек для хранения адреса возврата.
Исходные Intel 8086 и 8088 имеет четырнадцать 16- битных регистров. Четыре из них (AX, BX, CX, DX) являются регистрами общего назначения (GPR), хотя каждый может иметь дополнительное назначение; например, только CX может быть как счетчик с инструкцией цикла. К каждому из них можно обращаться как к каждому байтам (таким образом, как к старшему байту BX можно обращаться как к BH, а к младшему - к BL). У двух регистров-указателей есть особые роли: SP (указатель стека) указывает на «верх» стека , а BP (базовый указатель) часто используется для указания на какое-то другое место в стеке, обычно выше локальные переменные (см. указатель кадра ). Регистры SI, DI, BX и BP являются адресными регистрами
Четыре сегментных регистратора (CS, DS, SS и ES) используются для формирования адреса памяти. Регистр FLAGS содержит флаги, такие как флаг переноса, флаг переполнения и нулевой флаг. Наконец, указатель инструкции (IP) указывает на инструкцию, которая будет извлечена из памяти и затем выполнена; к этому регистру нельзя получить прямой доступ (чтение или запись) для программы.
Intel 80186 и 80188 по сути являются модернизированным процессором 8086 или 8088, соответственно, с добавлены встроенные периферийные устройства, и они имеют те же регистры ЦП, что и 8086 и 8088 (в дополнение к регистрам интерфейса для периферийных устройств).
8086, 8088, 80186 и 80188 могут использовать дополнительный сопроцессор с плавающей запятой, 8087. 8087 представляется программисту как часть ЦП и добавляет восемь 80-разрядных регистров, от st (0) до st (7), каждый из которых может содержать числовые данные в одном из семи форматов: 32-, 64- или 80-битное число с плавающей запятой, 16-, 32- или 64-битное (двоичное) целое число и 80-битное упакованное десятичное целое число. Он также имеет свой собственный 16-разрядный регистр состояния, доступный с помощью инструкции fntsw, и нередко просто использовать некоторые из его битов для ветвления, копируя их в обычные ФЛАГИ.
В Intel 80286, для поддержки защищенного режима, три специальных регистра содержат адреса таблицы дескрипторов (GDTR, LDTR, IDTR ) и четвертый регистр задачи (TR) используется для переключения задач. 80287 является сопроцессором с плавающей запятой для 80286 и имеет те же регистры, что и 8087, с теми же форматами данных.
С появлением 32-битных 80386 процессоров 16-битные регистры общего назначения, базовые регистры, индексные регистры, указатель команд и регистр FLAGS, но не сегментные регистры, были расширены до 32 бит. Номенклатура представляет это путем добавления префикса «E » (для «расширенного») к именам регистров на языке ассемблера x86. Таким образом, регистр AX соответствует младшим 16 битам нового 32-битного регистра EAX, SI соответствует младшим 16 битам ESI и так далее. Регистры общего назначения, базовые регистры и индексные регистры могут использоваться в качестве базовых в режимах адресации, и все эти регистры, за исключением указателя стека, могут использоваться в качестве индекса в режимах адресации.
Добавлены два новых сегментных регистра (FS и GS). Благодаря большему количеству регистров, инструкций и операндов формат машинного кода был расширен. Для обеспечения обратной совместимости сегменты с исполняемым кодом могут быть помечены как содержащие 16-битные или 32-битные инструкции. Специальные префиксы позволяют включать 32-битные инструкции в 16-битный сегмент или наоборот.
80386 имел дополнительный сопроцессор с плавающей запятой, 80387 ; у него было восемь 80-битных регистров: от st (0) до st (7), как у 8087 и 80287. 80386 также мог использовать сопроцессор 80287. В 80486 и всех последующих моделях x86 блок обработки с плавающей запятой (FPU) интегрирован в кристалл.
Pentium MMX добавил восемь 64-битных целочисленных регистров MMX (от MMX0 до MMX7, которые совместно используют младшие биты с 80-битным стеком FPU). В Pentium III Intel добавила 32-битный Streaming SIMD Extensions (SSE) регистр управления / состояния (MXCSR) и восемь 128-битных регистров SSE с плавающей запятой (от XMM0 до XMM7).
Начиная с процессора AMD Opteron, архитектура x86 расширила 32-битные регистры до 64-битных регистров аналогично тому, как Произошло расширение с 16 до 32 бит. Префикс R (для «регистр») определяет 64-битные регистры (RAX, RBX, RCX, RDX, RSI, RDI, RBP, RSP, RFLAGS, RIP) и восемь дополнительных 64-битных общие регистры (R8-R15) также были введены при создании x86-64. Однако эти расширения можно использовать только в 64-битном режиме, который является одним из двух режимов, доступных только в длинном режиме. Режимы адресации не претерпели значительных изменений по сравнению с 32-битным режимом, за исключением того, что адресация была расширена до 64 бит, виртуальные адреса теперь имеют знак, расширенный до 64 бит (чтобы запретить биты режима в виртуальных адресах), а другие детали селектора были значительно сокращены.. Кроме того, был добавлен режим адресации, позволяющий обращаться к памяти относительно RIP (указатель инструкций ), чтобы упростить реализацию позиционно-независимого кода, используемого в разделяемых библиотеках в некоторых операционных системах. системы.
регистры SIMD XMM0 – XMM15.
регистры SIMD YMM0 – YMM15.
регистры SIMD ZMM0 – ZMM31.
процессоры x86, которые имеют защищенный режим, т. Е. Процессоры 80286 и более поздних версий, также имеют три дескрипторных регистра (GDTR, LDTR, IDTR ) и регистр задач (TR).
32-битные процессоры x86 (начиная с 80386) также включают различные специальные / разные регистры, такие как управляющие регистры (CR0–4, CR8 только для 64-битных), регистры отладки (DR0–3, плюс 6 и 7), тестовые регистры (TR3–7; только 80486) и регистры для конкретной модели (MSR, появляющиеся с Pentium).
AVX-512 имеет восемь дополнительных 64-битных регистров маски для выбора элементов в ZMM.
Хотя основные регистры (за исключением указателя инструкции) являются «универсальными» в 32-битной и 64-битной версиях набора команд и могут использоваться для чего угодно, изначально предполагалось, что они будут использоваться для следующих целей:
Регистры сегментов:
Для остальных 8 регистров, доступных только в 64-битном формате, не предусматривалось никаких конкретных целей. Режим.
Некоторые инструкции компилируются и выполняются более эффективно при использовании этих регистров по назначению. Например, использование AL в качестве аккумулятора и добавление к нему непосредственного байтового значения дает эффективное добавление к AL opcode из 04h, в то время как использование регистра BL дает общее и более длинное добавление к регистрировать код операции 80C3h. Другой пример - деление и умножение двойной точности, которое работает специально с регистрами AX и DX.
Современные компиляторы выиграли от введения sib-байта (базовый байт индекса-шкалы), который позволяет обрабатывать регистры единообразно (миникомпьютер -подобный). Однако универсальное использование младшего байта неоптимально, так как оно дает более длинные кодировки, чем его выборочное использование только при необходимости. (Основным преимуществом sib-байта является ортогональность и более мощные режимы адресации, которые он обеспечивает, что позволяет сохранять инструкции и использовать регистры для вычислений адреса, таких как масштабирование индекса.) Некоторые специальные инструкции потеряли приоритет в конструкции оборудования. и стал медленнее, чем эквивалентные небольшие кодовые последовательности. Ярким примером является инструкция LODSW.
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
R? X | |||||||
E? X | |||||||
? X | |||||||
? H | ? L |
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
? | |||||||
? D | |||||||
? W | |||||||
? B |
16 | 8 |
---|---|
? S |
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
R? P | |||||||
E? P | |||||||
? P | |||||||
? PL |
Примечание. Знак? Регистры PL доступны только в 64-битном режиме.
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
R? I | |||||||
E? I | |||||||
? I | |||||||
? IL |
Примечание. Регистры? IL доступны только в 64-битном режиме.
64 | 56 | 48 | 40 | 32 | 24 | 16 | 8 |
---|---|---|---|---|---|---|---|
RIP | |||||||
EIP | |||||||
IP |
Режим реального адреса, обычно называемый реальным режимом, представляет собой рабочий режим 8086 и более поздние x86-совместимые процессоры. Реальный режим характеризуется 20-битным сегментированным адресным пространством памяти (это означает, что можно адресовать только 1 MiB памяти - фактически, немного больше), прямым программным доступом к периферийному оборудованию и отсутствием концепции защита памяти или многозадачность на аппаратном уровне. Все процессоры x86 серии 80286 и более поздние запускаются в реальном режиме при включении питания; 80186 ЦП и ранее имели только один рабочий режим, который эквивалентен реальному режиму в более поздних микросхемах. (На платформе IBM PC прямой программный доступ к подпрограммам IBM BIOS доступен только в реальном режиме, поскольку BIOS написан для реального режима. Однако это характерно не для ЦП x86, а для Дизайн IBM BIOS.)
Чтобы использовать более 64 КБ памяти, необходимо использовать сегментные регистры. Это создало большие сложности для разработчиков компиляторов, которые ввели режимы нечетных указателей, такие как «ближний», «дальний» и «огромный», чтобы в разной степени использовать неявный характер сегментированной архитектуры, при этом некоторые указатели содержат 16-битные смещения в подразумеваемых сегментах, а другие указатели, содержащие адреса сегментов и смещения внутри сегментов. Технически возможно использовать до 256 КБ памяти для кода и данных и до 64 КБ для кода, установив все четыре сегментных регистра один раз, а затем только с использованием 16-битных смещений (необязательно с префиксами переопределения сегментов по умолчанию) на адресной памяти, но это накладывает существенные ограничения на способ адресации данных и объединения операндов памяти, а также нарушает архитектурное намерение разработчиков Intel, которое состоит в том, чтобы отдельные элементы данных (например, массивы, структуры, единицы кода) были содержатся в отдельных сегментах и адресуются их собственными адресами сегментов в новых программах, которые не перенесены из более ранних 8-битных процессоров с 16-битными адресными пространствами.
В дополнение к реальному режиму Intel 80286 поддерживает защищенный режим, расширяя адресную физическую память до 16 МБ и адресуемую виртуальная память на 1 ГБ и предоставление защищенной памяти, которая предотвращает разрушение программ друг друга. Это делается с помощью сегментных регистров только для хранения индекса в таблице дескрипторов, которая хранится в памяти. Существует две таких таблицы: Глобальная таблица дескрипторов (GDT) и Таблица локальных дескрипторов (LDT), каждая из которых содержит до 8192 дескрипторов сегментов, каждый сегмент предоставляет доступ к 64 КБ объем памяти. В 80286 дескриптор сегмента предоставляет 24-битный базовый адрес, и этот базовый адрес добавляется к 16-битному смещению для создания абсолютного адреса. Базовый адрес из таблицы выполняет ту же роль, что и буквальное значение сегментного регистра в реальном режиме; сегментные регистры были преобразованы из прямых регистров в косвенные регистры. Каждому сегменту может быть назначен один из четырех уровней кольца, используемых для аппаратной компьютерной безопасности. Каждый дескриптор сегмента также содержит поле ограничения сегмента, которое определяет максимальное смещение, которое может использоваться с сегментом. Поскольку смещения составляют 16 бит, сегменты по-прежнему ограничены 64 КБ каждый в защищенном режиме 80286.
Каждый раз, когда регистр сегмента загружается в защищенном режиме, 80286 должен считывать 6-байтовый дескриптор сегмента из памяти в набор скрытых внутренних регистров. Следовательно, загрузка сегментных регистров в защищенном режиме происходит намного медленнее, чем в реальном, и следует избегать частой смены сегментов. Фактические операции с памятью с использованием сегментов защищенного режима не сильно замедляются, потому что 80286 и более поздние версии имеют оборудование для проверки смещения относительно ограничения сегмента параллельно с выполнением инструкции.
Intel 80386 расширенные смещения, а также поле ограничения сегмента в каждом дескрипторе сегмента до 32 бит, что позволяет сегменту охватить все пространство памяти. Он также представил поддержку в защищенном режиме для подкачки, механизма, позволяющего использовать выгружаемую виртуальную память (с размером страницы 4 КБ). Пейджинг позволяет процессору отображать любую страницу пространства виртуальной памяти на любую страницу пространства физической памяти. Для этого он использует дополнительные таблицы сопоставления в памяти, называемые таблицами страниц. Защищенный режим на 80386 может работать с включенной или отключенной подкачкой; механизм сегментации всегда активен и генерирует виртуальные адреса, которые затем отображаются механизмом подкачки, если он включен. Механизм сегментации также можно эффективно отключить, задав для всех сегментов базовый адрес 0 и ограничение по размеру, равное всему адресному пространству; для этого также требуется таблица дескрипторов сегмента минимального размера, состоящая всего из четырех дескрипторов (поскольку сегменты FS и GS не используются).
Пейджинг широко используется современными многозадачными операционными системами. Linux, 386BSD и Windows NT были разработаны для 386, потому что это был первый процессор на архитектуре Intel, поддерживающий пейджинг и смещение 32-битных сегментов. Архитектура 386 стала основой всех дальнейших разработок в серии x86.
процессоры x86, которые поддерживают загрузку в защищенном режиме в реальный режим для обратной совместимости со старым классом процессоров 8086. После включения (также известного как загрузка ) процессор инициализируется в реальном режиме, а затем начинает выполнять инструкции. Загрузочный код операционной системы, который может храниться в ПЗУ, может переводить процессор в защищенный режим для включения подкачки и других функций. Набор команд в защищенном режиме аналогичен тому, что используется в реальном режиме. Однако определенные ограничения, которые применяются в реальном режиме (например, невозможность использовать ax, cx, dx при адресации), не применяются в защищенном режиме. И наоборот, сегментная арифметика, обычная практика в коде реального режима, не допускается в защищенном режиме.
Существует также подрежим работы в 32-битном защищенном режиме (он же защищенный режим 80386), называемый виртуальный режим 8086, также известный как Режим V86. По сути, это особый гибридный режим работы, который позволяет программам и операционным системам реального режима работать под управлением операционной системы супервизора защищенного режима. Это обеспечивает большую гибкость при одновременном запуске программ в защищенном и реальном режиме. Этот режим доступен исключительно для 32-битной версии защищенного режима; его нет в 16-битной версии защищенного режима или в длинном режиме.
В середине 1990-х было очевидно, что 32-битное адресное пространство архитектуры x86 ограничивает ее производительность в приложениях, требующих больших наборов данных. 32-битное адресное пространство позволит процессору напрямую адресовать только 4 ГБ данных, что превышает размер таких приложений, как и ядра баз данных. Используя 64-битные адреса, можно напрямую адресовать 16 EiB данных, хотя большинство 64-битных архитектур не поддерживают доступ к полному 64-битному адресному пространству; например, AMD64 поддерживает только 48 бит из 64-битного адреса, разделенного на четыре уровня подкачки.
В 1999 г. AMD опубликовала (почти) полную спецификацию для 64-битного расширения архитектуры x86, которое они назвали x86-64 с заявленным намерением производить. Эта конструкция в настоящее время используется почти во всех процессорах x86, за некоторыми исключениями, предназначенными для встроенных систем.
Серийные чипы x86-64 для общего рынка были доступны четыре года спустя, в 2003 году, после того, как время было потрачено на рабочие прототипы для тестирования и доработки; примерно в то же время первоначальное название x86-64 было изменено на AMD64. Успех линейки процессоров AMD64 в сочетании с вялым восприятием архитектуры IA-64 вынудил Intel выпустить собственную реализацию набора команд AMD64. Intel ранее реализовывала поддержку AMD64, но решила не включать ее в надежде, что AMD не выведет AMD64 на рынок до того, как новый набор инструкций IA-64 Itanium не будет широко принят. Она назвала свою реализацию AMD64 EM64T, а позже переименовала ее в Intel 64.
В своей литературе и названиях версий продуктов Microsoft и Sun совместно именуют AMD64 / Intel 64 как x64 в Windows и Операционные системы Solaris. В дистрибутивах Linux он обозначается как «x86-64», его вариант «x86_64» или «amd64». Системы BSD используют «amd64», а macOS используют «x86_64».
Длинный режим в основном является расширением 32-битного набора инструкций, но в отличие от перехода с 16 на 32 бит, многие инструкции были отброшены в 64-битном режиме. Это не влияет на реальную двоичную обратную совместимость (которая будет выполнять устаревший код в других режимах, сохраняющих поддержку этих инструкций), но это меняет способ работы ассемблера и компиляторов для нового кода.
Это был первый случай, когда серьезное расширение архитектуры x86 было инициировано и разработано производителем, не являющимся Intel. Кроме того, это был первый случай, когда Intel приняла технологию подобного рода из внешнего источника.
Ранние процессоры x86 можно было расширить с помощью оборудования с плавающей запятой в виде серии с плавающей запятой числовые сопроцессоры с такими именами, как 8087, 80287 и 80387, сокращенно x87. Это также было известно как NPX (Numeric Processor eXtension), подходящее название, поскольку сопроцессоры, хотя и использовались в основном для вычислений с плавающей запятой, также выполняли целочисленные операции как с двоичными, так и с десятичными форматами. Затем, за очень немногими исключениями, 80486 и последующие процессоры x86 интегрировали эту функциональность x87 в чип, что сделало инструкции x87 де-факто неотъемлемой частью набора инструкций x86.
Каждый регистр x87, известный как от ST (0) до ST (7), имеетширину 80 бит и хранит числа в формате стандарта с плавающей запятой IEEE с двойной расширенной точностью. Эти регистры организованы в виде стека с ST (0) наверху. Это было сделано для того, чтобы сохранить пространство кода операции, и поэтому регистры случайным образом доступны только для любого из операндов в инструкции «регистр-регистр»; ST0 всегда должен быть одним из двух операндов, устройством или получателем независимо от того, является ли другой операнд ST (x) или операндом памятью. Однако произвольный доступ к регистрам стека может быть получен с помощью инструкции, которая заменяет любой свой ST (x) на ST (0).
Операции включают арифметические и трансцендентные функции, включая тригонометрические и экспоненциальные функции, а также инструкции, загружающие общие константы (например, 0; 1; e, основание натурального логарифма; log2 (10); и log10 (2)) в один из регистров стека. X87 может работать с помощью целых чисел с одной инструкции, чем 8086, 80286, 80386 или любой процессор x86 без 64-битных расширений, и повторять целочисленные вычисления даже для других значений (например, 16-bit) можно ускорить, выполнив целочисленные инструкции на ЦП x86 и x87 параллельно. (ЦП x86 продолжает работать, пока процессроцессор x87 вычисляет, а x87 устанавливает сигнал на x86, когда он завершает свою работу, или прерывает x86, если нужно внимание из-за ошибки.)
MMX - это набор команд SIMD, например Intel и представленный в 1997 году для микропроцессора Pentium MMX. Набор команд MMX разработан на основе методов, впервые использованной в Intel i860. Он поддерживается на большинстве процессоров IA-32 Intel и других поставщиков. MMX обычно используется для обработки видео (например, в мультимедийных приложениях).
MMX добавил в энергиюуру 8 новых «регистров», известных как MM0 - MM7 (далее именованные MMn). На самом деле эти новые «регистры» просто псевдонимами для настоящего случая регистров стека x87 FPU. Следовательно, все, что было сделано со стеком с плавающей запятой, также повлияло бы на регистры MMX. В отличие от стека FP, эти регистры MMn были фиксированными, не относительными, и поэтому они были доступны случайным образом. Набор команд не принимал семантику, такие операционные системы могли правильно и восстанавливать регистров при многозадачности без изменений.
Каждый из регистров MMn представляет собой 64-битное целое число. Одной из основных концепций набора команд MMX является концепция использования всего регистра для одного 64-битного целого числа (четырехслово ). двойное слово ), четыре 16-битных целых числа (слово ) или восемь 8-битных целых чисел (байт ). Учитывая, что 64-битные регистры MMX MMX имеют псевдонимы для стека FPU и каждый из регистров с плавающей запятой имеет ширину 80 бит, верхние 16 битов с плавающей запятой не используются в MMX. Эти биты устанавливаются в единицу любой инструкцией MMX, которая соответствует представлению с плавающей запятой NaN или бесконечностей.
В 1997 году AMD представила 3DNow!. Внед этой технологии совпало создание развлекательных приложений 3D и было разработано для повышения производительности векторной обработки центральным процессором приложений с интенсивной графикой. Разработчики 3D-видеоигр и поставщики оборудования для 3D-графики используют 3DNow! для повышения их производительности на процессорах AMD серий K6 и Athlon.
3DNow! был разработан как естественная эволюция MMX от целых чисел к числу с плавающей запятой. Таким образом, он использует точно такое же соглашение об именахров, что и MMX, то есть регистр от MM0 до MM7. Единственное отличие состоит в том, что вместо упаковки целых чисел в эти регистры в каждый томр упаковываются два числа с плавающей запятой одинарной точности. Самое большое значение псевдонима регистров FPU заключается в том, самые те же самые инструкции и структуры данных, которые используются для сохранения состояния регистров FPU. регистр состояний. Таким образом, не требуется никаких специальных модификаций операционных систем, которые иначе не знали бы о них.
В 1999 г. Intel представила набор инструкций Streaming SIMD Extensions (SSE) , вслед за SSE2 в 2000 г. Первое добавление выгрузить базовые операции с плавающей запятой из стека x87, второе сделало MMX почти устаревшим и сделало инструкции реалистичными для обычных компиляторов. Представленный в 2004 году вместе с версией Prescott процессор Pentium 4, SSE3 добавил особую память и инструкции по обработке потоков для повышения производительности Intel Технология HyperThreading. AMD лицензировала набор инструкций SSE3 и реализовала большинство инструкций SSE3 для своей версии E и более поздних процессоров Athlon 64. Athlon 64 не поддерживает HyperThreading и не имеет тех инструкций SSE3, которые используются только для HyperThreading.
SSE отклонил все устаревшие подключения к стеку FPU. Это также означало, что этот набор команд отбросил все унаследованные соединения с предыдущими поколениями наборов инструкций SIMD, таких как MMX. Но это освободило разработчиков, позволяя использовать регистры большего размера, не ограничивая размер регистров FPU. Разработчики создали восемь 128-битных регистров с именами от XMM0 до XMM7. (Примечание: в AMD64 регистров SSE XMM было увеличено с 8 до 16.) Однако обратная сторона заключалась в том, что операционные системы должны быть указаны в этом новом наборе инструкций, чтобы они могли включить свои состояния в регистр. Поэтому Intel создала слегка измененную версию защищенного режима, названную расширенным режимом, который позволяет использовать инструкции SSE, тогда как они остаются отключенными в обычном защищенном режиме. ОС, которая знает о SSE, активирует расширенный режим, тогда как ОС, которая знает о SSE, активирует расширенный режим.
SSE - это набор инструкций SIMD, который работает только со значениями с плавающей запятой, например 3DNow!. Однако в отличие от 3DNow! он отключает все устаревшие подключения к стеку FPU. SSE может упаковать в свои регистры вдвое большее количество одинарной точности с плавающей запятой. Исходный SSE ограничивался числами одинарной точности, например 3DNow!. SSE2 также представил возможность упаковки чисел двойной точности, что 3DNow! не было возможности это, поскольку число с двойной точностью имеет размер 64 бита, что было бы полным размером одного 3DNow! Регистр ММн. При 128 битах регистры SSE XMn могут упаковывать два числа с плавающей запятой двойной точности в один регистр. Таким образом, SSE2 намного больше подходит для научных расчетов, чем SSE1 или 3DNow!, Которые были ограничены только одинарной точностью. SSE3 не вводит никаких дополнительных регистров.
Расширенные расширенные расширения (AVX) удвоили размер регистров SSE до 256-битных регистров YMM. Он также представил схему кодирования VEX для размещения регистров большего размера, а также несколько инструкций для перестановки элементов. AVX2 не вводил дополнительных регистров, но отличался добавлением для маскирования, сбора, и инструкций перемешивания.
AVX-512 имеет еще одно расширение до 32 512-битных регистров ZMM и новую схему EVEX. В отличие от своих предшественников с монолитным расширением, он разделен на множество подмножеств, которые могут быть реализованы конкретными моделями ЦП.
Расширение физического адреса или PAE было сначала добавлено в Intel Pentium Pro, а было добавлено AMD в Процессоры Athlon, позволяющие адресовать до 64 ГБ ОЗУ. Без PAE объемного ОЗУ в 32-битном защищенном режиме обычно ограничен 4 ГБ. PAE позволяет использовать дополнительные биты физического адреса страниц. Хотя первоначальные реализации на 32-разрядных процессорах теоретически поддерживаютли до 64 ГБ ОЗУ, ограничения набора микросхем и других платформ часто ограничивают, что фактически можно было использовать. x86-64 процессоры определяют структуры таблиц страниц, которые теоретически допускают до 52 бит физического адреса, хотя, опять же, это связано с набором микросхем и других платформ (такими как количество доступных слотов DIMM и максимально возможный объем ОЗУ для каждого модуля DIMM) предотвратить использование такого большого физического адресного пространства. На процессоре x86-64 режим PAE должен быть активен до перехода в длинный режим и должен оставаться активным, пока активен длинный режим, поэтому в длинном режиме нет «не- PAE» режим. Режим PAE не влияет на ширину линейных или виртуальных адресов.
К 2000-м годам ограничения 32-разрядных процессоров x86 в протоколах памяти стали препятствия для использования в высокопроизводительных кластерах и мощных настольных рабочих станциях. Устаревшая 32-разрядная архитектура x86 конкурировала с гораздо более продвинутыми 64-разрядными архитектурами RISC, которые могли адресовать больше памяти. Intel и всей экосистеме x86 требовалась 64-битная адресация памяти, если x86 должна была выжить в эпоху 64-битных вычислений, поскольку программные приложения для рабочих станций и настольных компьютеров вскоре начали сталкиваться с ограничениями, присущими 32-битной адресной памяти. Однако Intel сочла, что настало подходящее время для смелого шага и использования перехода на 64-битные настольные компьютеры для перехода от архитектуры x86 в целом, эксперимент, который в конечном итоге провалился.
В 2001 году Intel попыталась внедрить не-x86 64-битную архитектуру под названием IA-64 в свой процессор Itanium, изначально стремясь к высокой производительности. рынок высокопроизводительных вычислений в надежде, что в конечном итоге он заменит 32-разрядную архитектуру x86. Хотя IA-64 был несовместим с x86, процессор Itanium действительно предоставлял возможности эмуляции для перевода инструкций x86 в IA-64, но это так сильно повлияло на производительность программ x86, что это было редко, если вообще когда-либо. полезно для пользователей: программисты должны переписывать программы x86 для архитектуры IA-64, иначе их производительность на Itanium будет на порядки хуже, чем на настоящем процессоре x86. Рынок отказался от процессора Itanium, поскольку он нарушил обратную совместимость, и предпочел продолжить использование чипов x86, а для IA-64 было переписано очень мало программ.
AMD решила пойти другим путем в сторону 64-битной адресации памяти, убедившись, что обратная совместимость не пострадает. В апреле 2003 года AMD выпустила первый процессор x86 с 64-разрядными регистрами общего назначения, Opteron, способный адресовать гораздо больше, чем 4 ГБ виртуальной памяти с использованием нового x86-64 расширение (также известное как AMD64 или x64). 64-разрядные расширения архитектуры x86 были включены только в недавно представленном длинном режиме, поэтому 32-разрядные и 16-разрядные приложения и операционные системы могли просто продолжать использовать процессор AMD64 в защищенном или других режимах, без малейшего ущерба производительности и с полной совместимостью с исходными инструкциями 16-разрядного Intel 8086. Рынок отреагировал положительно, приняв 64-разрядные процессоры AMD как для высокопроизводительных приложений, так и для домашних и деловых компьютеров.
Увидев, что рынок отвергает несовместимый процессор Itanium и Microsoft, поддерживающий AMD64, Intel пришлось отреагировать и в июле 2004 года представила свой собственный процессор x86-64, Pentium 4 «Prescott ». В результате процессор Itanium с его набором инструкций IA-64 используется редко, и x86, в его воплощении x86-64, по-прежнему является доминирующей архитектурой ЦП в невстроенных компьютерах.
x86-64 также представил бит NX, который предлагает некоторую защиту от ошибок безопасности, вызванных переполнением буфера.
в результате вклада AMD 64-разрядных систем в x86 Благодаря тому, что 64-разрядные RISC-архитектуры перестали быть угрозой для экосистемы x86 и почти исчезли с рынка рабочих станций, после их принятия Intel. x86-64 начали использоваться в мощных суперкомпьютерах (в его воплощениях AMD Opteron и Intel Xeon ), рынке, который ранее был естественной средой обитания для 64- битовые RISC-конструкции (например, микропроцессоры IBM POWER или процессоры SPARC ). Большой скачок к 64-битным вычислениям и поддержание обратной совместимости с 32-битным и 16-битным программным обеспечением позволили архитектуре x86 стать сегодня чрезвычайно гибкой платформой, при этом чипы x86 используются в небольших маломощных системах (например, Intel Quark и Intel Atom ) на быстрые игровые настольные компьютеры (например, Intel Core i7 и AMD FX / Ryzen ), и даже доминируют над большими суперкомпьютерными кластерами, эффективно оставляя только 32-битную и 64-битную RISC архитектуру ARM в качестве конкурента в смартфоне и планшет маркет.
До 2005 года процессоры архитектуры x86 не могли соответствовать требованиям Попека и Голдберга - спецификации для виртуализации, созданной в 1974 году Джеральдом Дж. Попеком и Роберт П. Голдберг. Однако продукты гипервизора виртуализации x86 как проприетарные, так и с открытым исходным кодом были разработаны с использованием программной виртуализации. Проприетарные системы включают Hyper-V, Parallels Workstation, VMware ESX, VMware Workstation, VMware Workstation Player и Windows Virtual PC, в то время как бесплатные системы с открытым исходным кодом, включая QEMU, KQEMU, VirtualBox и Xen.
Введение наборов инструкций AMD-V и Intel VT-x в 2005 году согласно процессорам x86 соответствовали требованиям к виртуализации Попека и Голдберга.
На Викискладе есть материалы, связанные с архитектурой X86. |
В Викиучебнике есть книга по темам: Сборка X86 / Архитектура X86 |