热门问题
时间线
聊天
视角
Radeon HD 7000系列
AMD圖形處理器系列產品 来自维基百科,自由的百科全书
Remove ads
AMD Radeon HD 7000系列,是AMD的图形处理器系列产品,研发代号为Southern Islands(翻译为南方群岛),采用28奈米制程,由台积电代工。本系列第一款产品为Radeon HD 7970,于2012年1月16日发布。全系列显示核心采用“次世代图形核心”(Graphics Core Next)架构,针对通用计算而优化。流处理器由4-Ways VLIW SIMD架构(俗称4D架构)改良,亦提升了曲面细分性能。透过ZeroCore Power技术,显示核心待机的时候,功耗小于3W。另外,Radeon HD 7000支援PCI-Express 3.0汇流排和Direct X 11.1。[2]
Remove ads
Radeon HD 7000系列的主要竞争对手为NVIDIA的GeForce 600系列,两者同样使用台积电的28nm制程制造。[3]HD 8000只是HD 7000的更名版本,仅供OEM。HD 7000的真正后继者是代号Volcanic Islands(火山岛)的Radeon Rx 200系列。
Remove ads
新标志
2013年,AMD时更换了全线产品的标志,包括中央处理器和图像处理器,力图更新Radeon及其他产品的品牌形象。官方网站的产品介绍都改用了新标志,但零售产品依然是印着旧的Radeon标志。[4][5][6]
架构
从“Southern Islands”南方群岛系列开始,超微开始使用新一代名为“Graphics Core Next”(次世代显示核心,GCN)的显示核心架构,主要为加强图形核心的通用计算能力而特别设计。这种设计概念类似于英特尔已经取消的Larrabee专案,但不同的是AMD的专案仍然会重视传统的图形处理能力。[7]
对比图形引擎,流处理器的改动相对比较大。
以往的5-Ways VLIW SIMD或4-Ways VLIW SIMD(俗称5D/4D架构)架构流处理器是针对指令而优化的:自R600显示核心以来,AMD/ATI显示核心的流处理单元上是由一个指令发射端+五个“流处理器”(四个矢量运算单元+一个超标量运算单元,后期变更为仅有四个矢量单元),理论上,透过将几个短指令组合为一个长的指令,使每个流处理单元可同一时间处理一个5D/4D指令,达到大资料吞吐量的目的。但这样做的缺点也很明显:需要依赖指令的恰当组合,而且在指令组合时会出现延时。实际上执行时指令组合往往并非最佳组合,造成有部分流处理器处于闲置状态,致使执行效率不高,而造成超微显示核心一直以来给人“理论参数高,实际效能低”的印象。[8]。所以AMD放弃以往的VLIW架构,改用称为GCN的新架构。
而新的GCN架构是针对线程而优化,尽管仍然保留SIMD的设计。GCN架构中,为强化通用处理能力,超微开始引入类似于对手辉达的“串流多处理器”、“GPC”等概念。在GCN架构的显示核心上,划分为多个计算单元(Compute Unit,CU,前称“GCN阵列”),每个CU单元里包含指令获取/仲裁单元(Instruction Fetch Arbitration)、控制/解码单元(Control and Decode)、独享的一级指令/资料快取记忆体、65个ALU:一个纯量运算单元(Scalar Unit)以及64个向量运算单元(Vector Unit,即流处理器),这64个矢量运算单元中,每16个矢量运算单元组成一个16位元的SIMD阵列并独享64KB的暂存器,这样一来,一个CU单元就拥有4组SIMD矢量阵列。在执行运算任务时,所有资料都会被拆散为1D资料,每个SIMD矢量阵列运行一条线程,由此一组CU单元可运行四条硬体执行绪,一个GCN架构的显示核心中包含多个CU单元,因此整个GCN显示核心可以同时运行多个任务/进程,以一组SIMD阵列为一个运算单元的角度看,一个CU单元具备MIMD的特性。超微官方的资料指出,这是一种“基于SIMD阵列的MIMD架构”(“Southern Islands is a MIMD architecture with a SIMD array”)。[9]
这样做的话,只要一直有数据输入显示核心,就不会有流处理器闲置。这与NVIDIA的处理方式相似,将所有数据都分解为1D数据。效率的提升,可以弥补额外配套而增加的线路。在某些特定情况,线程可以乱序执行,减少线程之间互相影响。[10][11]
核心配备两个几何引擎。每一个几何引擎包含曲面细分单元、几何装配器、顶点装配器各一个,还有可用于卷积运算、傅里叶变换等特殊运算任务以及材质贴图处理的材质阵列。单从数量而言,光栅器和曲面细分单元依然比不上对手NVIDIA。AMD特别针对相关单元的执行效率,声称Radeon HD 7970的曲面细分效能最高是上一代Radeon HD 6970的4倍,即使平均下来也有两倍的效能提升水准。[7]
新增一级和二级执行绪排程机制。为此,核心额外新增了一到两个Asynchronous Compute Engine(非同步运算引擎,ACE),用作CU单元(包括其内部)/流处理器的任务分配和仲裁,增强显示核心的乱序执行能力(显示核心本质上依然是顺序执行),提高几何和通用计算的性能[12]。
GCN架构中,为保证资料快速存取,暂存器数量惊人。在一个CU单元中,每一组SIMD矢量阵列拥有各自的暂存器,容量为每组64KB,一个纯量单元独占4KB的暂存器,这样一来一个CU单元里共有5个独立的暂存器。而对手NVIDIA的Kepler架构的GeForce 600中,每个SMX单元(相当于一个CU单元)仅有1个全域暂存器,即使是早期Fermi架构的GeForce 400上,每组SM单元也是仅有一个全局暂存器。[13][7]但是,过多的暂存器会使得显示核心过于庞大,在出于成本考量时还会挤压运算单元的电晶体使用量,而且还不利于功耗发热控制以及时脉的提升,Tahiti XT顶级显示核心就拥有约43.13亿个电晶体。有评论指出如此庞大的暂存器数量,显示出Radeon HD显示核心暂存器的使用算法不佳。[14]
以往的缓冲记忆体只支援读取模式。新的缓冲记忆体,可支援读写模式,方便交换数据。每一个CU单元拥有64KB的一级快取[15],被划分为一个32KB的一级唯读指令快取、一个16KB的一级唯读资料快取和一个16KB一级可读写资料快取,全部是连通的,而且可供其它CU单元存取,以保证资料同步和共享。而且,这种设计更多的似乎是为了日后CPU+GPU协同运算著想。[7][11][16]
显示核心配备每通道容量为64KB到128KB的可读写二级快取,与各CU的一级快取之间以及与图形引擎之间以64位元通道连接,以支援它们之间的资料传送以及同步。二级快取的通道数还与显示记忆体控制器数量相对应,比如,Radeon HD 7970拥有6个64位元的GDDR5记忆体控制器,每个控制器拥有一个通道的二级快取对应,即7970的二级快取容量为386KB~758KB。支援X86虚拟记忆体技术,可将显示记忆体中的一部分容量映射到系统记忆体上,供中央处理器存取,以解决纹理生成速率樽颈。[7]
顶级型号Radeon HD 7970拥有6个64位元的GDDR5记忆体控制器,合组384位元,拥有3GB的显示记忆体容量。系统介面支援PCI-E 3.0汇流排。
Remove ads
硬体支援Direct X 11.1所有特性,支援OpenGL 4.3。增加Partially Resident Textures(局部储存纹理)特性。支援光栅作业与Z缓冲单元继续独立运作、所有纹理作业支援快取读写作业等。[7]
新增Discrete Digital Multi-Point Audio(DDM Audio)。以往的显示核心只支援一个音频数据流输出。Radeon HD 7000则支援多个。如果显示卡接驳三个集成扬声器的显示器,以往只可以一个发声,现在则是三个皆可有声效输出。另外,每个显示器的音效,都是基于该显示器显示中的影像。[7]
Eyefinity 2.0(宽域技术):
需要一个支援120Hz刷新率的显示装置,配合DisplayPort或者HDMI 1.4a输出。
新增ZeroCore技术,可使显示核心闲置时进入深度休眠状态,将功耗降至小于3瓦。[7]在Radeon HD 7970 GHz Edition(使用Tahiti XT2核心)上还新增Boost特性,使显示核心能自动超频或在拷机测试时使核心频率和电压降至安全值,最大值为1125MHz,Radeon HD 7990推出以后,最低值更低至500MHz。Radeon HD 7790推出时还对电源级别进行了改进,在显示核心使用中可根据负载需要进行更细腻的电源和时脉调整。[17]但与对手NVIDIA的GPU Boost相比,此技术仍略显粗糙。
产品
28奈米新架构的AMD Radeon HD 7000系列被划分为三个级别:用于Radeon HD 7900系列的“Tahiti”顶级显示核心、Radeon HD 7800系列效能级的“Pitcairn”以及Radeon HD 7700系列主流级的“Cape Verde”。以完整的晶片来看,效能级的显示核心(拥有20组CU)大约拥有旗舰级(拥有32组CU)的一半,或两倍于主流级(拥有10组CU)的流处理器数量,相对应的是单精度浮点运算和双精度浮点运算的效能也是如此。消费级产品的旗舰型号Radeon HD 7900系列的双精度浮点运算的速率大约为单精度浮点运算的四分之一,而效能级的Radeon HD 7800系列和主流级的Radeon HD 7700系列则是十六分之一。[18]每个更大的晶片上有两个额外的记忆体控制器可扩充128位元的汇流排频宽,实际效能测试中,“Pitcairn”核心拥有和“Tahiti”核心一样的一对前端曲面细分单元,使得两者的重度DirectX 11曲面细分效能得分相近。[18]

首款使用GCN核心,开发代号为“Tahiti”的Radeon HD 7900系列,于2011年12月22日发布。产品系列包括:Radeon HD 7970 GHz Edition、Radeon HD 7970以及Radeon HD 7950。首发显示卡Radeon HD 7970(核心代号“Tahiti XT”)拥有32组CU共2048个流处理器,核心时脉925MHz;接著的Radeon HD 7950在7970的基础上削减有瑕疵的4组CU共256个流处理器,拥有28组CU共1792个流处理器,核心代号“Tahiti Pro”,核心时脉800MHz。
后来2012年5月发布的Radeon HD 7970 GHz Edition是采用基于小幅改良过的“Tahiti XT2”,新增Boost动态时脉调节,核心时脉最高可达1050MHz。这三者的公版显示卡均配备3GB的GDDR5显示记忆体,核心使用台积电的28奈米 HKMG制程来制造。
发烧级的Radeon HD 7990,最初的核心代号是“New Zealand”,采用两颗“Tahiti XT”核心。[19]后来因功耗限制,先是改由合作厂商利用“Tahiti XT2”显示核心组成“7970 ×2”形式并冠名“7990”的名义推出非公版的“Radeon HD 7990”[20][21]。实际上超微已经于2012年第四季度推出过采用两颗削减过硬体规格“Tahiti”核心的FirePro S10000专业绘图卡,但直到2013年4月,超微才发布消费级领域的Radeon HD 7990,开发代号“Malta”,采用两颗“Tahiti XT2”显示核心,核心最高时脉1GHz,采用6GB的GDDR5显示记忆体,最大热设计功耗控制在375瓦。
开发代号为“Pitcairn”的Radeon HD 7800系列于2012年3月5日正式发布,2012年3月29日正式进入零售市场。这一系列包括Radeon HD 7870 GHz Edition以及Radeon HD 7850。Radeon HD 7870采用“Pitcairn XT”显示核心,拥有20组CU共1280个流处理器,核心时脉1000MHz;Radeon HD 7850则使用“Pitcairn Pro”显示核心,拥有16组CU共1024个流处理器,核心时脉860MHz。这两款公版显示卡使用2GB的GDDR5显示记忆体,晶片也是由台积电的28奈米制程生产。[22]
2013年,新增Radeon HD 7870 XT(原来是Radeon HD 7890)一员,使用的是“Tahiti”最低阶的“Tahiti LE”显示核心,拥有24组CU共1536个流处理器,但和“Tahiti XT2”一样拥有动态调频,最高时脉为970MHz,但仍然是使用2GB的GDDR5显示记忆体,而且是以非公版型号推出市场。
开发代号为“Cape Verde”的Radeon HD 7700系列于2012年2月15日发布。产品系列有Radeon HD 7770 GHz Edition和Radeon HD 7750。Radeon HD 7770 GHz Edition采用“Cape Verde XT”显示核心拥有10组CU共640个流处理器,核心时脉1000MHz;Radeon HD 7750采用规格削减的“Cape Verde Pro”拥有8组CU共512个流处理器,核心时脉800MHz。同样两款公版显示卡配备1GB的GDDR5显示记忆体,晶片也是由台积电的28奈米制程制造。
2013年3月22日,新增Radeon HD 7790,采用基于GCN小幅改良版本GCN 1.1的“Bonaire XT”显示核心,效能高于Radeon HD 7770而弱于Radeon HD 7850。超微也准备推出基于GCN架构的新入门级产品Radeon HD 7730,尽管是入门级产品,但根据工程样品的效能测试表明其仍然拥有两倍于Radeon HD 6670的效能表现。[23]
均为上一代产品的更名版本。
显示核心列表
- HD 77xx-79xx则采用新的GCN(Graphics Core Next)架构。
- HD 77xx-79xx 支援 DirectX 11.1,OpenGL 4.2 和 OpenCL 1.2
- HD 7790支援DirectX 11.1,OpenGL 4.3和OpenCL 1.2
- HD 7790的核心设计上,包含两个异步运算引擎(ACE),和7800/7900系列一样,而不是7700系列的一个[29]
- “Bonaire”核心,和未来即将发布的“Caribbean Sea”、“Malta”地中海海岛(Mediterranean Sea)系列一样,是GCN架构的小幅度改良版本之一
- HD 7990官方版本直到2013年4月方有发布,最早由诸如Powercolor、华硕以及HIS等超微官方合作伙伴推出的带有“HD 7990”的HD7970 X2的显示卡均为非官方/非公版设定。
- 双精度浮点效能实际基于贩售市场的不同会有所改变,这里列出的是超微官方公布的最高效能数据
- 1 (计算单元,Compute Units):统一渲染器(顶点渲染器/几何渲染器/像素渲染器) : 纹理镜射单元(Texture mapping unit) : 渲染输出单元(Render Output unit)
- 2 GDDR5显示记忆体的资料存取时脉是显示记忆体时脉的四倍,而不是GDDR3/DDR3的两倍
- 3 热设计功耗(TDP)是超微官方数据,实际由于不同厂商有不同的显卡线路板设计以及不同的核心时脉参数设定,会影响实际的TDP数值
- 4 Radeon HD 7990的资料是基于超微官方于2013年4月发布时的正式资料,而非此前PowerColor、华硕以及HIS推出的“HD 7990”的参数
- 5 采用Tahiti的绘图卡都有两个BIOS,第二个BIOS贮存了较高的核心频率,称为“BOOST”,但初版的HD7970没有此功能
- 全部型号均支援DirectX 11.1、OpenGL 4.2和OpenCL 1.2
- 全部型号内建“统一北桥”(UNB/MC)汇流排输出输入界面
- 全部型号均由驱动程式设定强制停用双精度浮点运算特性
- 全部型号支援角度无关各向异性过滤、UVD3.2以及最高支援四屏输出的Eyefinity宽域显示技术
- 全部型号均基于Radeon HD 6900系列“Cayman”核心采用的4Ways-VLIW SIMD架构
- 全部型号是内建于AMD APU的部分型号中,并由格罗方德采用和CPU核心一致的32奈米 HKMG制程制造
- 1:热设计功耗(TDP)的数据中是包含CPU核心的热功率,根据超微的官方资料。显示核心的实际TDP取决于AMD APU的核心负载
- 内部系列型号“London”
- 部分型号仍使用旧有显示核心,40奈米制程;其馀的为新的GCN架构显示核心,28奈米制程
- 全部型号支援OpenCL 1.2
以下是使用新架构的显示核心
- 全部型号支援DirectX 11.1, OpenGL 4.2 以及OpenCL 1.2
- 全部型号内建“统一北桥”(包括记忆体控制器和PCI-E控制器),UMI(United Media Interface)汇流排
- 由于驱动程式的设定,全部型号暂不支援双精度浮点运算
- 全部型号支援角度无关各向异性过滤、UVD3.2和Eyefinity多屏显示技术(最高支援四屏输出)
- 除Radeon HD 7420G是基于GCN架构以外,全部型号的显示核心是基于AMD Radeon HD 6900的4VLIW SIMD架构设计
- System:由系统决定
- TDP数值是基于整块APU晶片的,而不单是图形处理部分
注释及参考资料
参见
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads