Показать сообщение отдельно
Старый 27.05.2012, 19:12   #3 (permalink)
Phrancisco
Системника - строитель!
 
Аватар для Phrancisco
 
Регистрация: 04.10.2009
Сообщений: 2,542
Записей в дневнике: 8
Сказал(а) спасибо: 7
Поблагодарили 2 раз(а) в 2 сообщениях
Репутация: 5008
По умолчанию

Инструкции SSE, SSE2, SSE3, SSE4, SSE5

Инструкции SSE
В начале 1999 года Intel представила процессор Pentium III, содержащий обновление ММХ, получивший название SSE (Streaming SIMD Extensions - поточные расширения SIMD). Так же SSE имел название KNI и MMX2.
Инструкции SSE содержат 70 новых команд для работы с графикой и звуком в дополнение к существующим ММХ. Инструкции SSE позволяют выполнять операции с плавающей запятой, реализуемые в отдельном модуле процессора. В технологиях MMX для этого использовалось стандартное устройство с плавающей запятой.

Инструкции SSE2 содержащие 144 дополнительные SIMD команды, были представлены в 2000 году. В SSE2 были включены все инструкции предыдущих наборов MMX и SSE.
SSE2 использует восемь 128-битных регистров (xmm0 до xmm7), включенных в архитектуру x86 с вводом расширения SSE, каждый из которых трактуется как 2 последовательных значения с плавающей точкой двойной точности.
SSE2 включает в себя набор инструкций, который производит операции со скалярными и упакованными типами данных.
Содержит инструкции для потоковой обработки целочисленных данных в тех же 128-битных xmm регистрах, что делает это расширение более предпочтительным для целочисленных вычислений, нежели использование набора инструкций MMX.

Инструкции SSE3 были представлены в 2004 году в месте с процессором Pentium4 Prescott. В обновление вошли 13 новых команд SIMD.
Набор содержит инструкции: FISTTP (x87), MOVSLDUP (SSE), MOVSHDUP (SSE), MOVDDUP (SSE2), LDDQU (SSE/SSE2), ADDSUBPD (SSE), ADDSUBPD (SSE2), HADDPS (SSE), HSUBPS (SSE), HADDPD (SSE2), HSUBPD (SSE2), MONITOR (нет аналога в SSE3 для AMD), MWAIT (нет аналога в SSE3 для AMD).
Наиболее заметное изменение - возможность горизонтальной работы с регистрами. Если говорить более конкретно, то добавлены команды сложения и вычитания нескольких значений, хранящихся в одном регистре. Эти команды упростили ряд DSP и 3D-операций.
Существует также новая команда для преобразования значений с плавающей точкой в целые значения, без необходимости
вносить изменения в глобальном режиме округления, предназначенных для ускорения выполнения сложных математических операций, обработки графики, кодирования видео и синхронизации потоков данных.
Инструкции SSE3 так - же содержали все предыдущие инструкции.

Дополнительные инструкции SSSE3 (Suplemental SSE) были представлены в 2006 году в процессорах Xeon 5100 и Core 2 Duo. В это набор были включены еще 32 дополнительные команды.
В целом SSE обеспечивал следующие преимущества:
  1. Более высокое разрешение при просмотре и обработки графических изображений
  2. Улучшенное качество воспроизведения звуковых файлов формата MPEG2, а также одновременное кодирование и декодирование этого формата в мультимедийных приложениях.
  3. Уменьшение загрузки процессора и выполнения точности\скорости реагирования при выполнения программного обеспечения для распознавания речи.

Инструкции SSEx были особенно эффективны при декодирования файла в формат MPEG2, который являлся стандартом сжатия звуковых и видео данных, используемых в DVD.

Инструкции SSE4
SSE4 - технология представляющая собой набор из 54 новых команд. Они были призваны увеличить производительность
процессора в работе с медиа - контентом, в игровых приложениях, задачах трехмерного моделирования.
Набор SSE4 включает в себя множество новых, инновационных инструкций, которые можно разделить
на две основные категории:

1) Векторизирующий компилятор и мультимедиа ускорители.
Включают в себя целочисленные операции и операции с плавающей точкой, поддержку упакованных операций DWORD и QDWORD, новые операции с плавающей точкой одинарной точности, быстрые регистровые операции, оптимизированные операции с памятью и т.д.
Компиляторы использующие эти элементы, реализовывали их преимущества в широком диапазоне приложений, включая мультимедиа приложения, например: скорость кодирования видео можно было увеличить в полтора раза.
А так - же серверные приложения для высокопроизводительных вычислений.

2) Ускорители обработки строк и текстовой информации.
Команды обработки строк и текста позволяют увеличить производительность приложений для обработки данных, поиска и других текстовых приложений. Они включают в себя набор команд сравнения упакованных строк, который позволяет производить несколько операций сравнения и поиска за одну инструкцию.
Phrancisco вне форума  
Ads

Яндекс

Member
 
Регистрация: 31.10.2006
Сообщений: 40200
Записей в дневнике: 0
Сказал(а) спасибо: 0
Поблагодарили 0 раз(а) в 0 сообщениях
Репутация: 55070