热门问题
时间线
聊天
视角

SSE4

来自维基百科,自由的百科全书

Remove ads

SSE4 (Streaming SIMD Extensions 4)是Intel Core微架構AMD K10中所使用的SIMD CPU指令集。它在2006年9月27日在英特爾開發者論壇上被宣佈,白皮書上的細節還較為模糊。[1]隨後在北京的2007年春季英特爾開發者論壇上的演示文稿中提供了47個指令的更精確細節。[2]SSE4與為前代英特爾64和IA-32架構微處理器編寫的軟體完全相容。所有現有軟體均可正確運行,無需修改包含SSE4的微處理器,以及現有和新應用程式(包含SSE4)。[3]

SSE4子集

英特爾SSE4包含54條指令。由Penryn提供的包含47條指令的子集,在英特爾文件中稱為SSE4.1。此外,SSE4.2是由剩餘7條指令組成的第二個子集,首次在基於NehalemCore i7中提供。英特爾將開發人員的回饋資訊稱為指令集開發中的重要角色。

從基於Barcelona的處理器開始,AMD推出了SSE4a指令集,其中有原有的4條SSE4指令和4條新的SSE指令。在支援SSE4.1的英特爾處理器中沒有發現這些指令並且AMD處理器僅在基於Bulldozer的 FX 處理器上開始支援英特爾的 SSE4.1和SSE4.2 (完整的 SSE4 指令集)。在使用SSE4a時,AMD還引入了未對齊的SSE特性,這意味著未對齊的載入指令在對齊的位址上與對齊版本一樣快。它還允許禁止訪問主記憶體的非載入SSE操作的對齊檢查。[4]英特爾後來在他們的Nehalem處理器中對未對齊的SSE進行了類似的速度改進,但是沒有在AVX之前引入非負載SSE指令的未對齊訪問。[5]

Remove ads

名稱混淆

Intel Core 2系列中引入的現在稱為SSSE3(補充串流SIMD擴展3)的部分在英特爾提出SSSE3名稱之前被媒體稱為SSE4。而在內部則把新的指令稱為Merom。 一些記者批評英特爾最初並沒有計畫給它們指定一個獨有的名稱。[6]英特爾最終清除了混淆,並保留了SSE4名稱以用於下一個指令集擴展。[7]

英特爾正在使用營銷術語HD Boost來指代SSE4。[8]

新的說明

與之前SSE的所有迭代不同,SSE4包含執行不特定於多媒體應用的操作的指令。它具有許多指令,其操作由一個常數欄位和一組將XMM0作為隱式第三操作數的指令決定。

enryn公司的單週期shuffle引擎啟用了其中的幾條指令。(隨機操作重新排序暫存器中的位元組被稱爲shuffle。)

更多資訊 指令, 描述 ...

SSE4.2

SSE4.2添加了STTNI(字串和文字新指令)[10],和每次對16個位元組的兩個操作數執行字元搜尋和比較的幾個新指令。這些設計(除其他外)旨在加快解析XML文件。[11]這也增加了一個CRC32指令來計算迴圈冗餘校驗,比如可以在某些數據傳輸協定使用。這些指令首先在基於Nehalem的Intel Core i7產品系列中實現,並完成SSE4指令集。支援通過CPUID.01H:ECX.SSE42 [bit20]標誌指示。

更多資訊 指令, 描述 ...
Remove ads

POPCNT和LZCNT

這些指令在整數而不是SSE暫存器上運行,因為它們不是SIMD指令,而是同時出現的指令。雖然它們是由AMD通過SSE4a指令集引入的,但卻往往被視為單獨的擴展,並且帶有自己的專用CPUID位以指示對其的支援。Intel以Nehalem微體系架構和LZCNT開始,實現了從Haswell微架構開始的POPCNT 。AMD從Barcelona微體系架構開始實施。

AMD稱這一對高級位元運算Advanced Bit Manipulation (ABM)指令。

更多資訊 指令, 描述 ...

除非輸入為0,否則lzcnt的結果等於bsr(位掃描反轉)。lzcnt產生32的結果,而bsr產生未定義的結果(並設定零標誌)。lzcnt的編碼與bsr的編碼相似,如果lzcnt在不支援它的CPU上執行,比如Haswell之前的Intel CPU,它將執行bsr操作,而不是產生無效的指令錯誤。

Trailing zeros可以使用現有的bsf指令進行計數。

Remove ads

SSE4a

AMD公司的Barcelona微體系架構中引入了SSE4a指令組。這些說明在英特爾處理器中不可用。支援通過CPUID.80000001H:ECX.SSE4A [Bit 6]標誌指示。

更多資訊 指令, 描述 ...

支援的CPU

Remove ads

參照

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads