XOP

XOP (від англ. eXtended Operations – розширені операції ^[1]) – розширення набору інструкцій x86/AMD64, анонсоване корпорацією AMD 1 травня 2009 року.

Є розширенням та розвитком ідей, реалізованих у 128-бітих інструкціях SSE в архітектурах x86/x86-64. Реалізовано з мікроархітектури мікропроцесорів AMD Bulldozer(інші мови) (12 жовтня 2011).^[2] Не підтримується процесорами AMD, починаючи з мікроархітектури Zen (Ryzen, EPIC; 2017 рік)^[3].

У набір інструкцій XOP входить кілька різних типів векторних інструкцій, оскільки він був спочатку задуманий як велике оновлення SSE. Більшість інструкцій є цілими, але в набір також входять інструкції для перестановки чисел з рухомої комою та інструкції екстракції дробової частини.

[1]

[2]

[3]

Інструкція	Опис^[9]	Операція
`VPMACSWW` `VPMACSSWW`	Multiply Accumulate (with Saturation) Word to Word	2x8 words (a0-a7, b0-b7) + 8 words (c0-c7) → 4 words (r0-r7) r0 = a0 * b0 + c0, r1 = a1 * b1 + c1, ..
`VPMACSWD` `VPMACSSWD`	Multiply Accumulate (with Saturation) Low Word to Doubleword	2x8 words (a0-a7, b0-b7) + 4 doublewords (c0-c3) → 4 doublewords (r0-r3) r0 = a0 * b0 + c0, r1 = a2 * b2 + c1, .^[2]
`VPMACSDD` `VPMACSSDD`	Multiply Accumulate (with Saturation) Doubleword to Doubleword	2x4 doublewords (a0-a3, b0-b3) + 4 doublewords (c0-c3) → 4 doublewords (r0-r3) r0 = a0 * b0 + c0, r1 = a1 * b1 + c1, ..
`VPMACSDQL` `VPMACSSDQL`	Multiply Accumulate (with Saturation) Low Doubleword to Quadword	2x4 doublewords (a0-a3, b0-b3) + 2 quadwords (c0-c1) → 2 quadwords (r0-r3) r0 = a0 * b0 + c0, r1 = a2 * b2 + c1
`VPMACSDQH` `VPMACSSDQH`	Multiply Accumulate (with Saturation) High Doubleword to Quadword	2x4 doublewords (a0-a3, b0-b3) + 2 quadwords (c0-c1) → 2 quadwords (r0-r3) r0 = a1 * b1 + c0, r1 = a3 * b3 + c1
`VPMADCSWD` `VPMADCSSWD`	Multiply Add Accumulate (with Saturation) Word to Doubleword	2x8 words (a0-a7, b0-b7) + 4 doublewords (c0-c3) → 4 doublewords (r0-r3) r0 = a0 * b0 + a1 * b1 + c0, r1 = a2 * b2 + a3 * b3 + c1, ..

Інструкція	Опис^[9]	Операція
`VPHADDBW` `VPHADDUBW`	Horizontal add two signed/unsigned bytes to word	16 bytes (a0-a15) → 8 words (r0-r7) r0 = a0+a1, r1 = a2+a3, r2 = a4+a5, …
`VPHADDBD` `VPHADDUBD`	Horizontal add four signed/unsigned bytes to doubleword	16 bytes (a0-a15) → 4 doublewords (r0-r3) r0 = a0+a1+a2+a3, r1 = a4+a5+a6+a7, …
`VPHADDBQ` `VPHADDUBQ`	Horizontal add eight signed/unsigned bytes to quadword	16 bytes (a0-a15) → 2 quadwords (r0-r1) r0 = a0+a1+a2+a3+a4+a5+a6+a7, …
`VPHADDWD` `VPHADDUWD`	Horizontal add two signed/unsigned words to doubleword	8 words (a0-a7) → 4 doublewords (r0-r3) r0 = a0+a1, r1 = a2+a3, r2 = a4+a5, …
`VPHADDWQ` `VPHADDUWQ`	Horizontal add four signed/unsigned words to quadword	8 words (a0-a7) → 2 quadwords (r0-r1) r0 = a0+a1+a2+a3, r1 = a4+a5+a6+a7
`VPHADDDQ` `VPHADDUDQ`	Horizontal add two signed/unsigned doublewords to quadword	4 doublewords (a0-a3) → 2 quadwords (r0-r1) r0 = a0+a1, r1 = a2+a3
`VPHSUBBW`	Horizontal subtract two signed bytes to word	16 bytes (a0-a15) → 8 words (r0-r7) r0 = a0-a1, r1 = a2-a3, r2 = a4-a5, …
`VPHSUBWD`	Horizontal subtract two signed words to doubleword	8 words (a0-a7) → 4 doublewords (r0-r3) r0 = a0-a1, r1 = a2-a3, r2 = a4-a5, …
`VPHSUBDQ`	Horizontal subtract two signed doublewords to quadword	4 doublewords (a0-a3) → 2 quadwords (r0-r1) r0 = a0-a1, r1 = a2-a3

Інструкція	Опис^[9]	immediate	Порівняння
`VPCOMB`	Compare Vector Signed Bytes	000	Менше
`VPCOMW`	Compare Vector Signed Words	001	Менше або дорівнює
`VPCOMD`	Compare Vector Signed Doublewords	010	Більше
`VPCOMQ`	Compare Vector Signed Quadwords	011	Більше ніж або дорівнює
`VPCOMUB`	Compare Vector Unsigned Bytes	100	Дорівнює
`VPCOMUW`	Compare Vector Unsigned Words	101	Не дорівнює
`VPCOMUD`	Compare Vector Unsigned Doublewords	110	Завжди брехливе
`VPCOMUQ`	Compare Vector Unsigned Quadwords	111	Завжди істинне

Інструкція	Опис^[9]
`VPROTB`	Packed Rotate Bytes
`VPROTW`	Packed Rotate Words
`VPROTD`	Packed Rotate Doublewords
`VPROTQ`	Packed Rotate Quadwords
`VPSHAB`	Packed Shift Arithmetic Bytes
`VPSHAW`	Packed Shift Arithmetic Words
`VPSHAD`	Packed Shift Arithmetic Doublewords
`VPSHAQ`	Packed Shift Arithmetic Quadwords
`VPSHLB`	Packed Shift Logical Bytes
`VPSHLW`	Packed Shift Logical Words
`VPSHLD`	Packed Shift Logical Doublewords
`VPSHLQ`	Packed Shift Logical Quadwords

Інструкція	Опис^[9]
`VPPERM`	Packed Permute Byte
`VPPERMIL2PD`	Permute Two-Source Double-Precision Floating-Point
`VPPERMIL2PS`	Permute Two-Source Single-Precision Floating-Point

XOP

Історія

Цілочисленне векторне множення-додавання

Цілочисленне векторне горизонтальне додавання

Цілочисленне векторне порівняння

Векторне умовне пересилання

Цілочисленний векторний зсув та поворот

Векторна перестановка

Виділення дробової частини чисел із рухомою комою

Див. також

Джерела

Wikiwand - on