热门问题
时间线
聊天
视角
Radeon HD 4000系列
来自维基百科,自由的百科全书
Remove ads
ATI Radeon HD 4000系列,其显示核心代号Radeon R700,由AMD(ATI)研发并推出。Radeon HD 4000系列的第一款产品是RV770显示核心,采用此芯片的显卡名为Radeon HD 4850,有800个流处理器。而核心频率更高的HD 4870及HD 4890紧随其后,更率先采用GDDR5作为顯存。最高端显卡采用R700核心,是一款双芯片显卡产品,名为HD 4870 X2。
Remove ads
背景
与之前的系列不同,首发的Radeon R700显卡只是中端产品。这与AMD调整策略有关。过往,AMD往往在高端市场落后于NVIDIA。此次,AMD在中端市场主动出击,原因是该市场占用家群一个较大的比例,利润亦会较高。而对手NVIDIA方面,虽然推出了性能比较强的GTX 200系列显卡,但性价比明显比R700不足。以往的显卡开发,是先研制旗舰级产品,再将此功能削减,成为中端和低端显卡。面对着显示核心的架构愈来愈复杂,研发的成本和时间亦愈来愈高。另外,高端产品的市场比较细,产品往往只是技术的演示。而ATI在过往与NVIDIA竞争的过程中,经常错过适当的发布时间,不只输掉高端市场,亦减慢了中低端显卡的发布。
在AMD收购ATI后,市场策略亦开始调整。今次,公司只会研发针对主流市场的显卡,高端显卡则由双核心显卡补上,例如Radeon HD 4870 X2。
架构
整体的架构与上一代相约,但作出了多方面的微调。与上一代显卡系列一样,支持DirectX 10.1及Shader Model 4.1。RV770核心有9.56亿个晶体管,采用55 nm制程制造。
同样是SIMD架构,核心拥有多个SIMD核心。每一个SIMD核心有16个流处理器、独立的纹理单元和L1缓存。 由于取消了共享缓存,各核心可以透过Global DataShare Unit互相沟通。而每个流处理器有5个ALU,换言之一个SIMD核心有80个ALU。与上一代不同,本次所有的ALU单元都可以作整数字元运算,可大大提升GPGPU应用的性能。RV770显示核心有10个SIMD核心,合共拥有800个流处理器。
RV770显示核心拥有800个流处理器,是上一代RV670的2.5倍。流处理器的结构并没有任何改变,只是数量上有所上升。每个流处理器有5个ALU,所有的ALU单元都可以作整数字元运算。流处理器的架构依然是4D+1D的结构,相对NVIDIA的全1D结构,虽然效率没有那么高,但架构简单,可以轻易提升流处理器的数量。AMD方面,每一个流处理器内的5个ALU会共享一个指令发射端口;NVIDIA方面,一个ALU需要独立的端口,难以有效提升流处理器的数量。
每一个SIMD核心都拥有1组纹理单元,换言之RV770拥有10组纹理单元。每组纹理单元内有4个纹理寻址单元,16个32位浮点纹理采样单元和4个纹理过滤单元。
上一代的显示核心,缓存(Cache)是被所有的SIMD核心共享的。在R700显示核心中,每一个SIMD核心都拥有独立的Cache。这样做可以降低延迟,提高效率。上一代SIMD可透过共享缓存互相沟通,由于采用了独立缓存,所以AMD为每一个核心加装了Global DataShare Unit,作SIMD互相沟通之用。
AMD放弃了Ring Bus架构链接顯存,改用回传统的Crossbar架构。因为纵使Ring Bus架构的结构简单且可以优化,但延迟率高,亦要用更多的晶体管。最重要的是R600显示Ring Bus架构对性能的帮助不明显,
AMD重新设计了光栅单元,用来改善AA性能。亦取消了针对透明及雾化效果的运算单元。而AA算法仍然会交由Shader处理,凭着流处理器的数量是上一代的2.5倍,AA的性能亦有所提升。

这一代的双显示核心设计仍使用PCI Express桥接芯片。此次使用的是PLX出品,功耗为3.8瓦的PEX 8647芯片,这块芯片支持PCIe 2.0,允许两颗GPU运作在相同的PCIe插槽但拥有两倍于前代产品(Radeon HD 3870 X2)的带宽。但AMD在此代显示核心上还内置了一个新的“CrossFire X Sideport”,用来协调多个显示核心之间的通信[1],提供额外5GB/s且全双工的GPU间资料发送带宽,增进图形性能。如此一来两个GPU间的总带宽达到了21.8GB/s。籍此AMD利用两颗显示核心,组成一张显卡,用作对抗NVIDIA的高端产品。所以增加CrossFire的性能和效率就变得重要。在这一点上,CrossFire X Sideport内联器从未被激活,在任何支持CrossFire的驱动程序上。
相对第一代的UVD,UVD2可以解码更高码率和分辨率的影片。另外,与NVIDIA的新PureVideo一样,可以支持两段影片同时解码,方便提供画中画功能。新增Dynamic Contrast技术,用来提升影片的光暗对比。另外,显示核心依然集成了声卡,支持声道由5.1升级到7.1,支持AC3和DTS,亦追加对LPCM的支持。
Radeon HD 4550/4350会支持UVD 2.2。[2] 提高对高清影帧式的兼容性,支持新一代的视频输出。
利用AVT技术,用户可以利用R700显示核心,编码1080p的高清影片,这相当于GPGPU的一种应用。
其他技术
AMD选择了开放标准,例如苹果电脑推广的OpenCL,以至DirectX,或者AMD自家的Brook +。AMD认为NVIDIA的CUDA是闭源标准,最终都会失败。
AMD宣布与Havok合作共同优化在AMD四核心处理器下的游戏物理运算的表现,并表示会共同研究将来让显卡支持Havok物理引擎。有第三开发者声称,PhysX物理引擎可以在R700核心上实现。而NVIDIA就尽全力帮助那一位程序员,让R700核心支持CUDA技术,借此让核心支持PhysX物理引擎。[3]
Radeon HD 4870将会利用GDDR5作为顯存,是业界首次采用GDDR5装备显卡。相对而言,NVIDIA就显得比较保守,只采用GDDR3存储器,但可以保证产品发布顺利,亦提供足够的带宽。对上一次,ATI亦率先采用GDDR4作为X1950 XTX显卡的存储器,但由于频率提升有限,并未能为新产品提供更大的带宽。而GDDR5的带宽更大,功耗更低,亦符合AMD对节能的要求。
但由于GDDR5始终是新技术,所以开始的时候不能大量上市,亦耽误了HD 4870显卡的发布。而AMD放弃了Ring Bus存储器架构,采用GDDR5存储器是迫不得已的做法。
这是一个电源管理技术,RV670将它首次引入到桌面市场中。而在R700显示核心中,有关的技术亦得到升级。例如,显示核心可以自行关闭不在工作中的处理单元,亦可以调整核心的电压和频率。顯存方面,就只有频率可以调整。
产品
最先推出的是Radeon HD 4850显卡,于2008年6月25日推出,目标是中端市场,拥有800个流处理器,采用GDDR3顯存。比较高端的Radeon HD 4870 亦在其后推出,除核心频率有所提升,更采用GDDR5显示存储器。另外,由于RV770的核心频率还有提升的空间,预计有厂商会推出超频版本的RV770显卡,用来与GTX 280显卡竞争。
旗舰型号Radeon HD 4870 X2已于2008年8月12日推出,采用双显示核心设计,对手是NVIDIA的GeForce GTX 280,而实际性能比NVIDIA Geforce GTX 280显卡更强,后来NVIDIA推出GeForce GTX 295方能战胜之。显示核心亦集成了CrossFire Sideport组件,两个显示核心可以双向5GB/s的带宽互相链接。[4] 桥接芯片方面,采用了PEX8647,支持PCI-E 2.0。[5]
这个系列最低端的是Radeon HD 4830,它有640个流处理器,对手是GeForce 9800 GT。[6]
AMD于2009年4月2日(原为4月6日,之后推迟到9日,最后由于产品提早在3月底发售,所以正式的官方发布时间定为4月2日)[7] 推出使用RV790核心的Radeon HD 4890,规格与Radeon HD 4870相似,但运作频率更高。对手是NVIDIA的GeForce GTX 275。RV790核心并不是单纯的RV770核心超频版本,还额外增加了300万个晶体管[8]。
AMD于中国内地市场推出Radeon HD 4860,使用RV790核心,只拥有640个流处理器,采用512MB GDDR5顯存,由于以高主频运作,所以性能与Radeon HD 4870接近。

Radeon HD 4770于2009年4月推出,使用AMD首款40nm绘图核心RV740,拥有640个流处理器,128bit顯存接口,但采用GDDR5顯存,以免存储器频宽不足。核心主频750MHz,存储器主频3200MHz。性能较Radeon HD 4830优胜,部分测试成绩甚至与Radeon HD 4850相近。由于需求高加上台积电的40nm芯片前期生产良率欠佳,造成市面上长期缺货,相同级别需要由Radeon HD 4850降价接替。本产品可视为半年后推出的Radeon HD 5000系列的实验品。
- Radeon HD 4670 - 核心频率为750MHZ,采用GDDR3顯存,频率为1800MHz(容量是512/1024 MB)。核心拥有320个流处理器,但顯存频宽仅有128bit,规格参数与HD3850 128-bit(HD3690)相似[9]。
- Radeon HD 4650 - 核心频率比4670慢,采用GDDR2顯存。

- Radeon HD 4550 - 有80个流处理器,采用GDDR3顯存,带宽只有64-bit。
- Radeon HD 4350 - 与HD 4550同样有80个流处理器,但只采用GDDR2顯存。对手是GeForce 9400 GT。
GPGPU产品方面,AMD会推出基于RV770核心的FireStream 9250。它支持双精度和64位浮点运算。
显示核心规格列表
1 统一渲染单元数量 : 纹理映射单元数量 : 渲染输出单元数量
2GDDR5顯存的资料发送速率是其时钟频率的4倍,而非其它DDR存储器的两倍
3热设计功耗(TDP)数值来源于超微官方资料。不同厂商的非公版显卡电路板设计会使得实际TDP数值和官方资料的有所不同。
4全部型号带有UVD2、ATI PowerPlay功能
这一列表是Radeon HD 4000中内置于AMD芯片组系列的型号,集成这些型号的芯片组有700系列、800系列以及900系列(980G,实际是880G的更名版本)。这些型号全部支持DirectX 10.1以及OpenGL 3.3。
1 统一渲染单元数量 : 纹理映射单元数量 : 渲染输出单元数量
2在ATI PowerPlay节电技术生效时,核心主频在不同的使用场合时会有所不同。这个列表列出的主频数值是官方默认的主频值参数
3集成显示核心的专用存储器采用特别的sideport总线,用作顯存
这个列表除了独立显示核心以外,还包括集成于北桥芯片内的集成式显示核心。
1 统一渲染单元数量 : 纹理映射单元数量 : 渲染输出单元数量
2GDDR5顯存的资料发送速率是其时钟频率的4倍,而非其它DDR存储器的两倍
参考文献
参见
外部链接
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads