|
似乎一切都显得那么低调,在经过了漫长的等待后,AMD原生四核,基于K10架构的Phenom 9500终于在中关村卖场抢滩登陆。2007年,对AMD而言是非常艰难的一年,在收购了ATI后,AMD不得不同时面对来自Intel、NVIDIA的双重压力。在2007年,Intel彻底完成了从NetBurst到Core的架构转换,将Core架构彻底普及,并于年底领先业界过渡到45nm制程;NVIDIA方面,“GPU性能半年翻一番”的“黄氏定律”尽管没有完全延续,但GeForce 8800GT、G92新版GeForce 8800GTS在游戏性能上的优势已经越来越大,NVIDIA在主板芯片上的开发也是一帆风顺。
 AMD首款桌面级四核处理器亮相中关村——Phenom 9500
不过原生四核还是在2007年结束之前来到了中关村市场。这款处理器的价格与之前所想象的相比显得那么温和:1960元!这个价格让所有人都吃惊,因为它与被竞争对手Intel列入停产计划中的最低端四核处理器——Core 2 Quad Q6600相比也有近100元的价格优势。
 Phenom 9500——来自AMD的圣诞礼物
正值圣诞前夕,中国虽然不是一个西方国家,但各大城市却已经开始洋溢着浓浓的节日气氛。1960元原生四核Phenom 9500,似乎正是AMD送给中国玩家的节日礼物。作为追求时尚的国内玩家,我们应该感谢AMD的这份礼物,不过,性价比才是主宰用户购买的饿决定性因素,K10处理器的到底能否带来强大的性能体验,它相对于同频率的K8处理器到底有多大的性能提升,相信国内不少玩家正在为这些问题而困扰,而我们今天的文章,就将为大家揭开这个谜底。 根据AMD的说法,采用K10架构的Phenom是对Athlon 64核心的完全修改,K10处理器每时钟周期的指令数(IPC)较之K8大大提高,在相同频率下,预计最高可以达到25%的性能提升。K10的代号为Stars(星辰),Stars与2003年成功开发出Athlon 64的时间相隔了三年,在这段漫长的时间里,Stars的核心设计曾经历过多次改变,最终的成品为Phenom带来了比较令人满意的性能提升。
 AMD Stars核心架构示意图(图为四核中的一颗核心架构)
 AMD K10处理器核心图
和Intel结合两颗双核心于一颗CPU进行封装所不同的是,AMD Phenom是用单一的一颗物理核心实现四核,最终,这个拥有四颗核心的物理核心面积为285mm²,并拥有6亿晶体管,相对于Athlon 64 X2那227万的数目,Phenom的提升幅度超过两倍。
原生四核的设计难度给产品的良品率造成了极大的影响,因为及时有一个核心出现瑕疵,整个四核芯片无疑将报废,为此,AMD找到了一个很好的解决方法,那就是明年第一季度将和我们见面的三核处理器。AMD表示,三核处理器实际上为关闭一颗核心的四核产品,其性能介于双核与四核之间,对购买不起四核处理器的消费者是一个折中的解决方案。不过在产品真正上市之前,这种解决方案是否真的可行并不令人信服。技术细节:SSE4A指令集 内存预读取技术
似乎竞争总会导致技术走向的分道扬镳,在Phenom处理器中,AMD加入了全新的指令集——SSE4A,这对消费者来说并不能算是好消息。也许资深的DIY玩家还记得Intel最早的MMX指令集,它为X86 ISA导入了第一批SIMD延生指令集,AMD为了和Intel竞争,在处理器中增加了3DNOW!指令集,结果导致软件开发师在设计软件时无法同时兼顾双方。而后这种不利于行业发展的竞争终于停止,SSE、SSE2、SSE3成为了双方处理器接下来的共有元素。但是到了四核产品先的竞争上,Intel在对45nm Penryn的设计中加入了SSE4.1指令集,AMD也在Stars架构中加入了SSE4A(之前为SSE128),也许SSE4A能够给我们带来某些应用上的提升,但鉴于Intel的强大号召力,SSE4A的前途并不明朗。
 Stars架构中的新元素——SSE4A指令集
不过后期的说法是SSE4A指令集是针对2007年同期Intel 45nm新处理器推出的SSE4指令集而修改而来,Intel的SSE4会增加48条指令,SSE4A则去除其中对I64优化的指令,也就是说两者基本保持兼容。显然这种情况才是软件设计师更喜欢看到的。当然,AMD计划在K10下一代的处理器中加入SSE5指令集,而SSE、SSE2、SSE3、SSE4都是由Intel所倡导而开发,AMD的SSE5是否能够得到认可暂时还是未知数。
SSE4指令集提供完整128位宽的SSE执行单元,一个时钟周期内可执行一个128位SSE指令,它将为我们带来非常可观的多媒体应用性能提升。
 Phenom 处理器具备内存预读取技术
内存预读取技术(advanced memory prefetcher):相对于Athlon 64,Phenom的拾取指令集的数据缓冲增加为32字节,处理器核心可以同时处理更多指令。内存预读取处理技术可以从内存直接加载数据到核心而不通过北桥,因此可以降低更多的延迟,对二级缓存的负载减轻,更有效地利用了缓冲数据,提升整体性能,这也是AMD在Athlon 64上就开始采用的,Phenom将其继承并进一步发扬。同Phenom 9500同时发布的还有AMD的Spider平台,这是AMD面向桌面用户所推广的一个平台化概念。K10处理器、AMD 7系列主板芯片组、AMD Radeon HD 3000系列显卡,3条A组成了所向披靡的Spider平台。在这套强大的平台中,CrossFireX无疑是最令人兴奋的元素,四卡交火将为骨灰级游戏玩家带来极致的游戏快感。如果一切顺利,Spider将和Intel的迅驰一样,在消费者心中形成根深蒂固的消费概念。本次测试,我们将采用AMD 790FX芯片组与Radeon HD 3870显卡组成完整的Spider平台,以此考察Phenom 9500的性能。
| 系 统 硬 件 环 境 |
| 中央处理器 |
AMD Phenom 9500(盒装正式零售版) (四核/200MHz*11 /512KB*4 L2缓存/2MB共享L3缓存) AMD Athlon 64 X2 4200+(65nm盒装正式零售版) ( 双核 /200MHz*11 / 1MB共享L2缓存 ) |
| 内存模组 |
2*1GB A-DATA Extreme Edition DDR2 1066+ ( 运行在双通道 DDR2-800_4-4-4-12-24-2T ) |
| 主板 |
华硕M3A32-MVP Deluxe/WiFi-AP ( AMD 790FX + SB600 ) |
| 显示卡 |
AMD Radeon HD 3870 (RV670XT @ 512MB @ 256bit @ 777MHz/2252MHz) |
| 硬盘 |
Seagate Barracuda 7200.10 320GB SATA ( 320GB / 7200RPM / 16M缓存 / 50GB NTFS系统分区 ) |
| 声卡控制单元 |
AD 1988 8-chanel High Definition Audio CODEC |
| 网络控制单元 |
Marvel PCIe Gigabit LAN controller |
| 电源供应器 |
Thermaltake Toughpower 1200W ( ATX12V 2.0 / 900W ) |
| 显示环境 |
1920*1600 @ 60MHz |
我们选择了同频率的K8处理器Athlon 64 X2 4200+与Phenom 9500进行对比测试,借此考察在频率相同的情况下K10相对于K8的性能提升幅度。所有的测试将在Windows Vista下进行,详细系统环境及驱动版本见下表:
| 操 作 系 统 及 驱 动 |
| 操作系统 |
Microsoft Windows vista Enterprise 32bit |
| 主板芯片组驱动 |
AMD 7-Series Chipset Driver for Vista x86 |
| 显卡驱动 |
AMD Display Driver 8.43.1 for Vista x86 |
| 声效控制单元驱动 |
SoundMAX AD 1988B Audio Driver 6.10.01.6260 |
| 网络控制单元驱动 |
Marvell Yukon Gigabit Ethernet Driver 10.15.4.3 |
| DirectX Version |
DirectX 10.0 |
| 性 能 测 试 软 件 |
| 综合性能测试 |
PCMark Vantage PCMark 05 |
| CPU性能测试 |
CPUmark 99 3DMark 06-CPU |
| 渲染测试 |
Maxon CineBench Release10 |
| 科学性能测试 |
Super π mod 1.5XS |
| DirectX10 3D游戏 |
Call of Juarez DirectX 10 Benchmark Company of Heroes 1.71 DirectX 10 Benchmark |
至于测试项目方面,我们选择了PCMark Vantage、PCMark05来考察平台的综合性能,CPUmark 99和3DMark 06则主要用于考察CPU的性能,DirectX 10游戏方面我们选择了Call of Juarez和Company of Heroes,最后加入CineBench R10和Super π1.5考察渲染能力和科学计算能力。
|