Общая информация | |
---|---|
Запущен | Конец 2011 г. |
Снято с производства | Присутствует |
Стандартный производитель (-ы) | |
Архитектура и классификация | |
Мин. размер функции | 32 нм |
Набор команд | x86-64 |
Физические характеристики | |
Разъем (ы) | |
Продукты, модели, варианты | |
Название ядра (я)) | |
История | |
Предшественник | Семейство 10h (K10) |
Преемник | Piledriver - Семейство 15h (2-го поколения) |
AMD Семейство Bulldozer 15h - это микропроцессор микроархитектура для линейки процессоров FX и Opteron, разработанный AMD для настольных компьютеров и серверов. Bulldozer - это кодовое имя для этого семейства микроархитектур. Он был выпущен 12 октября 2011 года как преемник микроархитектуры K10.
Bulldozer разработан с нуля, а не является развитием более ранних процессоров. Ядро специально предназначено для вычислительных устройств с TDP от 10 до 125 Вт. AMD заявляет о значительном повышении эффективности производительности на ватт в приложениях высокопроизводительных вычислений (HPC) с ядрами Bulldozer.
Ядра Bulldozer поддерживают большинство наборов инструкций, реализованных процессорами Intel (Sandy Bridge ), доступными на момент их появления (включая SSE4.1, SSE4.2, AES, CLMUL и AVX ), а также новые наборы инструкций, предложенные AMD; ABM, XOP, FMA4 и F16C. Только Bulldozer GEN4 (Экскаватор ) поддерживает наборы команд AVX2.
Согласно AMD, на основе Bulldozer Процессоры основаны на техпроцессе GlobalFoundries '32 нм Кремний на изоляторе (SOI) и повторно используют подход DEC для производительности многозадачного компьютера с аргументами, что он, согласно примечаниям для прессы, «уравновешивает выделенные и общие компьютерные ресурсы, чтобы обеспечить очень компактную конструкцию с большим количеством единиц, которую легко воспроизвести на кристалле для увеличения производительности». Другими словами, устраняя некоторые «избыточные» элементы, которые естественным образом проникают в многоядерные конструкции, AMD надеялась лучше использовать возможности своего оборудования при меньшем потреблении энергии.
Реализации на основе Bulldozer, построенные на 32 нм SOI с HKMG, появились в октябре 2011 года как для серверов, так и для настольных компьютеров. Сегмент серверов включал двухчиповый (16-ядерный) процессор Opteron под кодовым названием Interlagos (для Socket G34 ) и однокристальный (4, 6 или 8 ядер) Valencia (для Socket C32 ), в то время как Zambezi (4, 6 и 8 ядер) нацелены на настольные компьютеры на Socket AM3 +.
Bulldozer - это первая крупная модернизация архитектуры процессоров AMD с 2003 года, когда компания выпустила свои процессоры K8, а также имеет два 128-битных FMA -capable FPU, которые можно объединить в один 256-битный FPU. Этот дизайн сопровождается двумя целочисленными кластерами, каждый с 4 конвейерами (этап выборки / декодирования является общим). Bulldozer также представил в новой архитектуре общий кэш L2. AMD называет эту конструкцию «Модулем». В 16-ядерном процессоре будет восемь таких «модулей», но операционная система распознает каждый «модуль» как два логических ядра.
Модульная архитектура состоит из многопоточного общего кэша L2 и FlexFPU, который использует одновременную многопоточность. Каждое физическое целочисленное ядро, по два на модуль, является однопоточным, в отличие от Intel Hyperthreading, где два виртуальных одновременных потока совместно используют ресурсы одного физического ядра.
Bulldozer использовал "Clustered Multithreading" (CMT), метод, при котором некоторые части процессора разделяются между двумя потоками, а некоторые части уникальны для каждого потока. Предыдущие примеры такого подхода к нетрадиционной многопоточности можно проследить еще до ЦП UltraSPARC T1 Sun Microsystems 2005 года. С точки зрения аппаратной сложности и функциональности модуль Bulldozer CMT приравнивается к двухъядерному процессору по своим целочисленным вычислительным возможностям, а также к одноядерному процессору или двухъядерному процессору с ограниченными возможностями с точки зрения вычислительной мощности с плавающей запятой, в зависимости от от того, насыщен ли код инструкциями с плавающей запятой в обоих потоках, выполняемых в одном модуле CMT, и выполняет ли FPU 128-битные или 256-битные операции с плавающей запятой. Причина этого в том, что для каждых двух целочисленных ядер, то есть в пределах одного модуля, есть один блок с плавающей запятой, состоящий из пары 128-битных блоков исполнения FMAC .
CMT - это в некотором роде более простая, но схожая философия дизайна с SMT ; обе конструкции пытаются эффективно использовать исполнительные блоки; в любом методе, когда два потока конкурируют за некоторые конвейеры выполнения, происходит потеря производительности в одном или нескольких потоках. Благодаря выделенным целочисленным ядрам модули семейства Bulldozer работали примерно как двухъядерный двухпоточный процессор во время фрагментов кода, которые были либо полностью целочисленными, либо сочетанием целочисленных вычислений и вычислений с плавающей запятой; тем не менее, из-за использования SMT общих конвейеров с плавающей запятой модуль будет работать аналогично одноядерному двухпоточному процессору SMT (SMT2) для пары потоков, насыщенных командами с плавающей запятой. (Оба последних двух сравнения предполагают, что процессор обладает одинаково широким и мощным исполнительным ядром, соответственно с целочисленным и с плавающей запятой.)
И CMT, и SMT имеют максимальную эффективность, в то время как выполнение целочисленного кода и кода с плавающей запятой в паре потоков. CMT сохраняет максимальную эффективность при работе с парой потоков, состоящих из целочисленного кода, в то время как при SMT один или оба потока будут работать хуже из-за конкуренции за целочисленные исполнительные блоки. Недостатком CMT является большее количество неиспользуемых целочисленных исполнительных блоков в однопоточном случае. В однопоточном случае CMT ограничивается использованием не более половины целочисленных исполнительных единиц в своем модуле, тогда как SMT не налагает такого ограничения. Большое ядро SMT с целочисленной схемой такой же ширины и скорости, как два ядра CMT, теоретически может на мгновение иметь вдвое большую производительность в случае одного потока. (Более реалистично для общего кода в целом, Правило Поллака оценивает коэффициент ускорения в , или примерно на 40% больше по производительности.)
Процессоры CMT и типичный процессор SMT похожи в их эффективном совместном использовании кэша L2 парой потоков.
Более длинный конвейер позволил процессорам семейства Bulldozer достичь гораздо более высокой тактовой частоты по сравнению с его предшественниками K10. Хотя это увеличило частоту и пропускную способность, более длинный конвейер также увеличил задержки и увеличил штрафы за неправильное предсказание переходов.
Ширина проблемы (и пиковое выполнение инструкций за цикл) Jaguar, K10 и Bulldozer core - 2, 3 и 4 соответственно. Это сделало Bulldozer более суперскалярным по сравнению с Jaguar / Bobcat. Однако из-за несколько более широкого ядра K10 (помимо отсутствия доработок и оптимизаций в конструкции первого поколения) архитектура Bulldozer обычно выполнялась с несколько более низким IPC по сравнению с ее предшественниками K10. И только после улучшений, внесенных в Piledriver и Steamroller, IPC семейства Bulldozer заметно превзошли таковые процессоров K10, таких как Phenom II.
Таблица характеристик ЦП
7 сентября 2011 года было объявлено о первых прибыльных поставках процессоров Opteron на базе Bulldozer. FX-4100, FX-6100, FX-8120 и FX-8150 были выпущены в октябре 2011 года; с оставшимися процессорами AMD серии FX, выпущенными в конце первого квартала 2012 года.
Модель | Ядра / модули | Частота | Максимум. turbo | Кэш L2 | Кэш L3 | TDP | Память | Turbo Core | Socket | |
---|---|---|---|---|---|---|---|---|---|---|
Full нагрузка | Половинная нагрузка | |||||||||
FX-8100 | 8/4 | 2,8 ГГц | 3,1 ГГц | 3,7 ГГц | 4 × 2 МБ | 8 МБ | 95 Вт | DDR3. 1866 МГц | Да (2,0) | AM3 + |
FX-8120 | 3,1 ГГц | 3,4 ГГц | 4,0 ГГц | 125 Вт | ||||||
FX-8140 | 3,2 ГГц | 3,6 ГГц | 4,1 ГГц | 95 Вт | ||||||
FX-8150 | 3,6 ГГц | 3,9 ГГц | 4,2 ГГц | 125 Вт | ||||||
FX-8170 | 3,9 ГГц | 4,2 ГГц | 4,5 ГГц | |||||||
FX-6100 | 6/3 | 3,3 ГГц | 3,6 ГГц | 3,9 ГГц | 3 × 2 МБ | 95 W | ||||
FX-6120 | 3,6 ГГц | 3,9 ГГц | 4,2 ГГц | |||||||
FX-6130 | 3,6 ГГц | 3,8 ГГц | 3,9 ГГц | |||||||
FX-6200 | 3,8 ГГц | 4,0 ГГц | 4,1 ГГц | 125 Вт | ||||||
FX-4100 | 4/2 | 3,6 ГГц | 3,7 ГГц | 3,8 ГГц | 2 x 2 МБ | 95 Вт | ||||
FX-4120 | 3,9 ГГц | 4,0 ГГц | 4,1 ГГц | |||||||
FX-4130 | 3,8 ГГц | 3,9 ГГц | 4,0 ГГц | 4 МБ | 125 Вт | |||||
FX-4150 | 3,8 ГГц | 3,9 ГГц | 4,0 ГГц | 8 МБ | 95/125 Вт | |||||
FX-4170 | 4,2 ГГц | 4,3 ГГц | 4,3 ГГц | 125 Вт |
Основные источники: CPU-World и Xbit-Labs
Есть две серии Процессоры на базе Bulldozer для серверов : Opteron серии 4200 (Socket C32, кодовое название Valencia, до четырех модулей) и Opteron 6200 series (Socket G34, кодовое название Interlagos, до 8 модулей).
В ноябре 2015 года против AMD был предъявлен иск в соответствии с Законом о правовой защите потребителей Калифорнии и Закон о недобросовестной конкуренции за якобы искажение технических характеристик микросхем Bulldozer. В коллективном иске, поданном 26 октября в Окружной суд США Северного округа Калифорнии, утверждается, что каждый модуль Bulldozer на самом деле представляет собой одно ядро ЦП с несколькими характеристиками двухъядерности, а не настоящую двухъядерную конструкцию.. В августе 2019 года AMD согласилась урегулировать иск на сумму 12,1 миллиона долларов.
24 октября 2011 года тесты первого поколения, проведенные Phoronix подтвердил, что производительность процессора Bulldozer была несколько ниже ожидаемой. Во многих тестах процессор показал себя на том же уровне, что и Phenom 1060T более старого поколения.
Производительность позже существенно увеличилась, поскольку были выпущены различные оптимизации компилятора и исправления драйверов ЦП.
Первые процессоры Bulldozer были встречены неоднозначно. Было обнаружено, что FX-8150 плохо показал себя в тестах, которые не были многопоточными, отставая от процессоров серии Intel Core i * второго поколения и уступая или даже превосходя собственный процессор AMD Phenom II X6 на более низких тактовых частотах. В многопоточных тестах FX-8150 показал себя наравне с Phenom II X6 и Intel Core i7 2600K, в зависимости от теста. Учитывая в целом более стабильную производительность Intel Core i5 2500K при более низкой цене, эти результаты не впечатлили многих обозревателей. Процессор оказался чрезвычайно энергоемким под нагрузкой, особенно при разгоне, по сравнению с Intel Sandy Bridge.
13 октября 2011 года AMD заявила в своем блоге, что «есть некоторые наше сообщество, которое считает, что производительность продукта не соответствует их ожиданиям ", но продемонстрировало тесты для реальных приложений, в которых он превзошел Sandy Bridge i7 2600k и AMD X6 1100T.
В январе 2012 года Microsoft выпустила два исправления для Windows 7 и Server 2008 R2, которые незначительно улучшают производительность процессоров Bulldozer, решая проблемы планирования потоков, возникшие после выпуска Bulldozer.
6 марта 2012 года AMD опубликовала статью в базе знаний, в которой говорилось, что существует проблема совместимости с FX процессоры и некоторые игры на широко используемой платформе распространения цифровых игр Steam. AMD заявила, что предоставила обновление BIOS нескольким производителям материнских плат (а именно: Asus, Gigabyte Technology, MSI и ASRock ), что решит проблему.
В сентябре 2014 года генеральный директор AMD Рори Рид признал, что дизайн Bulldozer не был «деталью, меняющей правила игры», и что AMD пришлось жить с этим дизайном. на четыре года.
31 августа 2011 года AMD и группе известных оверклокеров, включая Брайана МакЛахлана, Сами Мякинена, Аарона Шрадина и Саймона Солотко, удалось открыть новый мир рекорд по частоте процессора с использованием неизданного и разогнанного процессора FX-8150 Bulldozer. До этого дня рекорд был равен 8,309 ГГц, но Bulldozer в сочетании с жидким гелием охлаждением достиг нового максимума в 8,429 ГГц. Рекорд с тех пор был побит Андре Янгом на частоте 8,58 ГГц с использованием жидкого азота. 22 августа 2014 года при использовании FX-8370 (Piledriver), The Stilt из Team Finland достиг максимальной частоты процессора 8,722 ГГц.
Piledriver - кодовое название AMD для своего улучшенного Микроархитектура второго поколения на базе Bulldozer. Ядра AMD Piledriver находятся в сериях APU и CPU на базе Socket FM2 Trinity и Richland, а также в процессорах серии FX на базе Socket AM3 + Vishera. Piledriver был последним поколением в семействе Bulldozer, которое было доступно для сокета AM3 + и было доступно с кешем L3. Процессоры Piledriver, доступные для сокетов FM2 (и его мобильного варианта), не поставлялись с кешем L3, поскольку кеш L2 является кешем последнего уровня для всех процессоров FM2 / FM2 +.
Steamroller - это кодовое название AMD для микроархитектуры третьего поколения, основанной на улучшенной версии Piledriver. Ядра Steamroller входят в серию APU и CPU на базе Socket FM2 + Kaveri.
Экскаватор - это кодовое название ядра Bulldozer четвертого поколения. Экскаватор был реализован в виде APU Carrizo серии A, APU Bristol Ridge серии A и процессоров Athlon x4.