Авто Автоматизация Архитектура Астрономия Аудит Биология Бухгалтерия Военное дело Генетика География Геология Государство Дом Другое Журналистика и СМИ Изобретательство Иностранные языки Информатика Искусство История Компьютеры Кулинария Культура Лексикология Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлы и Сварка Механика Музыка Население Образование Охрана безопасности жизни Охрана Труда Педагогика Политика Право Приборостроение Программирование Производство Промышленность Психология Радио Регилия Связь Социология Спорт Стандартизация Строительство Технологии Торговля Туризм Физика Физиология Философия Финансы Химия Хозяйство Ценнообразование Черчение Экология Эконометрика Экономика Электроника Юриспунденкция

Декодирование команд

Читайте также:

В микроархитектуре Intel Atom для декодирования x86-инструкций применяется двухканальный декодер, состоящий из двух простых декодеров, каждый из которых может декодировать в каждом такте по одной простой инструкции x86 в одну микрооперацию. В микроархитектуре Intel Atom сложный декодер не используется, а для декодирования всех сложных инструкций, которые распадаются на более чем одну микрооперацию, применяется блок uCode Sequenser (микросеквенсор). В микроархитектуре Intel Atom микросеквенсор выдает по две микрооперации за такт.

Отметим, что в микроархитектуре Intel Atom используется технология Micro-Fusion, то есть слияние двух микроопераций в одну, содержащую два элементарных действия. В дальнейшем две такие слитые микрооперации обрабатываются как одна, что в результате позволяет снизить количество обрабатываемых микроопераций и тем самым увеличить общее количество исполняемых процессором инструкций за один такт. Слияние двух микроопераций возможно далеко не для всех пар микроопераций.

В микроархитектуре Intel Atom все декодированные микрооперации сначала поступают в буфер очереди микроопераций (Instruction Queues), рассчитанный на 32 микрооперации, после чего передаются на два исполнительных кластера: скалярный целочисленный (общего назначения) для и векторно-вещественный для работы с данными FP/SIMD. Ситуация здесь подобна той, что имела место с u- и v-конвейерами в процессорах Intel Pentium III, один из которых был основным (для работы с целочисленными данными), а второй — вспомогательным.

Исполнительный кластер общего назначения, который вполне можно назвать главным кластером, соединен к кэшем данных L1D. А вот векторно-вещественный кластер не может напрямую общаться с кэшем L1D.

Каждый исполнительный кластер может выполнять две команды за такт процессора, но не более двух в сумме.

Стоит обратить внимание на тот факт, что в каждом кластере используется физический регистровый файл, в котором хранятся операнды микроопераций. Это позволяет микрооперациям сохранять лишь указатели на операнды, но не сами операнды. С одной стороны, такой подход дает возможность уменьшить энергопотребление процессора, поскольку перемещение по конвейеру микроопераций вместе с их операндами требует существенных затрат энергии, а с другой — использование физического регистрового файла позволяет сэкономить на размере кристалла.

Блок-схема ядра процессора на базе микроархитектуры Intel Atom

Кэш

Параметры кэшей Intel Atom таковы:

· L1I — 32 КБ, 8-канальный, задержка 3 такта;

· L1D — 24 КБ, 6-канальный, задержка 3 такта;

· L2 — 512 КБ – 1 МБ (+ ECC), 8-канальный, задержка 19 тактов.

· шина «L2–ядро» — 256-битная, полноскоростная.

У всех кэшей — 64-байтовые строки.

В ранних моделях Intel Atom не имел интегрированного контроллера памяти. Типы памяти и максимальный размер определяются контроллером памяти, расположенном на чипсете. Intel это сделала лишь почти через два года после выпуска первых Атомов, когда вышли модели Atom N450, N470, D410 и D510.

SSE3

Набор SSE3 содержит 13 новых инструкций: FISTTP (x87), MOVSLDUP (SSE), MOVSHDUP (SSE), MOVDDUP (SSE2), LDDQU (SSE/SSE2), ADDSUBPD (SSE), ADDSUBPD (SSE2), HADDPS (SSE), HSUBPS (SSE), HADDPD (SSE2), HSUBPD (SSE2), MONITOR (нет аналога в SSE3 для AMD), MWAIT (нет аналога в SSE3 для AMD).

Наиболее заметное изменение - возможность горизонтальной работы с регистрами. Если говорить более конкретно, добавлены команды сложения и вычитания нескольких значений, хранящихся в одном регистре. Эти команды упростили ряд DSP (цифровая обработка сигналов) и 3D-операций. Существует также новая команда для преобразования значений с плавающей точкой в целые без необходимости вносить изменения в глобальном режиме округления.

SSSE3

Предыдущее имело обозначение SSE3 и Intel добавил ещё один символ 'S' вместо того, чтобы увеличить номер расширения.

Новыми в SSSE3, по сравнению с SSE3, являются 16 уникальных команд, работающих с упакованными целыми. Каждая из них может работать как с 64-х битными (MMX), так и с 128-ми битными (XMM) регистрами, поэтому Intel в своих материалах ссылается на 32 новые команды.

1 | 2 | 3 | 4 | 5 | 6 |

Поиск по сайту:

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (3.644 сек.)

Главная | О проекте | Полезные cсылки | Контакты | Случайная страница