伺服器软、硬体优化及评测 (三)

作者:www.linkwan.com 林和安 林育宗

发表于《中无通讯》2005年第32期

上期笔者主要介绍一些CPU技术的最新发展和选用伺服器CPU的经验,如主频、散热、双核心、外频、功耗等等。作为伺服器DIY一族,我们不仅要增进相关技术的了解,还要关注各主流CPU厂商的最新发展,在合适的时机选购性价比高的产品。

一、伺服器进入DIY时代

随着互联网IT业的飞速发展,越来越多的中小企业甚至是个人用户都涉足到伺服器这个熟悉而又新鲜的产品。一直以来,伺服器在人们的心目中都觉得是属于专业应用的产品,是高深莫测和高端的,事实上是不是这样的呢?DO IT YOURSELF 做了就知道!

其实在外国,DIY伺服器已经是司空见惯的事情了。在美国DIY伺服器占市场总出货量40%。品牌伺服器的高成本和缺乏灵活性的配置让大家望而却步,随着伺服器技术走向普及,DIY伺服器凭借可灵活采用最高性价比配
件且稳定性好,己为大众接受。

如果你所需的是一台入门级伺服器,用来架设办公室局域网,做文件存储、电子邮件,或者作为一般网站、简单数字库等用途,选择单颗P4或者P4E(Prescott)CPU就足够了,搭配865/875/E7525的芯片组,挑一块能集成显卡和网卡的主板,这类配置主要考虑的尽量追求高性价比和配件能安装在1U 机架式机箱内及良好散热就行。
对于工作站的伺服器,需要比较高的性能和稳定性,可考虑采用双路Nocona / Irwindale Xeon(新/最新至强)CPU,主板可选用Intel、Tyan、华硕、超微(主板芯片组决定品质) ,内存选用Corsair、Kingston、三星(分普通/ECC/RECC DDR内存) ,SATA/SCSI硬盘采用 WD、Maxtor、Seagate,电源采用Sirtec、台达等配件组装起来的,在硬件上丝毫不逊于品牌机,却在性价比方面占据绝对优势。

二、PC伺服器CPU受青睐

大家都知道如IBM、HP、SUN等巨头以前对于PC伺服器的表现是不屑一顾的,认为采用Intel和AMD处理器的PC伺服器是低档廉价产品。自Intel成功推出性能极高的P4、Xeon和64位Itanium处理器,AMD也成功推出令业界震惊的64位Opteron处理器后,得到了广大中小企业用户的认可。最近IBM和HP争相锁定还未正式发布的AMD双核心Opteron处理器。

其实Intel Nocona Xeon和AMD Opteron处理器都是64位处理器,IBM、HP等巨头为何看好双核Opteron而不选用Intel Xeon呢?

作为全球第一款兼容x86架构的32位和64位处理器,AMD Opteron处理器建立在采用直连架构的AMD64技术的基础之上。直连架构通过将处理器、内存控制器和I/O直接连接到中央处理器,消除前端总线固有的瓶颈,从而提高系统的总体性能和效率。

随后Intel宣布了Nocona处理器(带有EM64T的新至强),其外频(FSB ×倍频系数)提升到800MHz,支持32和64位应用的EM64T内存扩展技术。同时发布的芯片组E7520/7320,定位于伺服器市场。 Nocona新至强具有更大的二级缓存,更高的主频,更重要的是具有了64位处理能力,通过搭配支持流行的PCI Express和DDR2内存技术的E7525芯片组,新“Nocona”Xeon确实有了很大的进步。

在许多基于Nocona和Opteron处理器的比拼测试中,AMD的Opteron处理器在不少项目均能挫败Nocona Xeon,但在某些经过对超线程技术做了特殊优化的程序中,Nocona的表现超过Opteron。因为Nocona处理器推出时间远晚于Opteron处理器,现有主流64位操作系统并没有对Nocona处理器进行优化,而Opteron处理器己进行了优化,所以目前的64位操作系统中,Nocona处理器并未真正发挥其优越性。Nocona处理器发热量太高可能也是IBM、HP等巨头暂时看好双核Opteron的原因吧。

AMD也发布型号为152、252、852低耗电的Opteron处理器,支持1GHz hypertransport,90纳米制程及Power Now! 降低功耗技术。在手提电脑处理器市场也推出了对抗Turion技术,使Intel霸主地位也遭遇到威胁。

Intel公司最近公布了其代码为Intel Xeon MP的Potomac CPU,而且拥有8MB L3 高速缓存和1MB L2 高速缓存,主打4P与8P等级企业用伺服器高阶市场。

HT(上)与Dual Core比较,可见Dual Core更有效率

三、双核心时代来临

双核心取自双自强CPU系统的概念,其实是双CPU技术的缩影。因双核心芯片技术甚至多核心芯片技术可以大大提高处理器性能,目前处理器的厂商Intel和AMD都在调整自己的双核心处理器的市场战略,会在2005年中推出各自的双核心、多核心处理器。

Intel 第二季度会提供双核心64位Smithfield的处理器,主要面向桌面电脑市场,Smithfiel主频率3.660GHz起,可惜这些产品的功耗大约为130瓦,所以要支持新CPU除了芯片组要支持以外,还需要主板的电源供应设计能够与处理器搭配。

Smithfield双核心处理器将会采用90纳米的设计工艺,L2 2M,800MHz外频兼容现有915晶片组。其每一个处理单元会采用目前的P4 “Prescott”芯片一样架构,不过这新的中央处理单元将具备仲裁逻辑功能,该功能会让两个处理器核心的总线传输得到平衡。Smithfield将支持EM64T、Virtualization、XD和加强的Intel SpeedStep技术,性能得到较大提升,但仍然是过渡期产品,等待Intel 65纳米制程的手提电脑双核心Pentium M(Yonah)、P4的双核心Presler、双核心Xeon和XeonMP推出。这些双核心处理器才会是未来主流。

AMD双核心Opteron主频1.6/1.8/2.0GHz起,90纳米制程,2M L2 高速缓存,1GHz HT,估计也会在第二季度推出。

对于双核心CPU,Intel认为AMD的设计采用单核芯片上集成内存控制器的方式,并且使用混合传输方式,这将产生问题。因为AMD使用的不是共享式缓存而是单独的内存缓存。 而Intel将开发出提供更高性能并且不会局限于某一代内存的共享式缓存架构,如内存架构改变时,无需更改 CPU。Intel在其产品规划中早已经包括多核心及双核心产品了。

2005年是双核心的开始,Intel激进地将2006年双核心处理器的市场份额计划都提高到70%以上。双核心的出现虽然是处理器市场的一次突破,但是软件编写者还需要时间掌握这类功能强大的处理器。在现有的单线程软件下测试双核心处理器,它的优势尚未发挥。

2005年将是双/多核心处理器架构发展史重要里程碑。

四、缓存决定一切

上期笔者提到Intel的“频率就是性能”的市场战术遇到前所未有的困难,取消了4GHz P4的发布计划。但显然Intel不会因开发不出更高主频的CPU而放弃市场的,他们又开始实行 “Cache is king(缓存决定一切)”的战略,其新曝光的处理器缓存越来越大。

在伺服器的环境中,CPU主频不一定决定伺服器主要的性能,例如由于伺服器某些软件对高速缓存严重依赖,Intel公司的Xeon MP的 3.0GHz主频,采用4MB L3高速缓存能够带来更好的性能。
但是根据Intel的公开资料,Potomac处理器的Cache比目前还要大!达到了8M!其性能快约16.7%。增加缓存的代价是巨大的,不但增加了成本,降低了良品率、成品发热量都是问题,目前Intel的CPU发热量确比AMD 大。

五、伺服器需要协调发展

伺服器作为网络环境中的一台电脑,它需要侦听网络上其他电脑(客户机)提交的服务请求,并以此为依据提供相应的服务;伺服器必须具有承担服务并保障服务质量的能力。因此DIY伺服器的原则将围绕这个应用核心进行。

在DIY伺服器架设过程中,不要过分注重某些部件的性能,否则容易忽视系统整体性能各方面的平衡。例如:只追求处理器频率的提升,往往忽视与之相对应的前端总线(外频)的速率以及内存的频率的提升。这样会导致系统瓶颈的产生:处理器的计算能力虽然非常出色,但是由于它与内存之间的通信渠道受前端总线频率的限制,使得伺服器系统的性能无法发挥到最大。

如何平衡并提升系统各部件的性能,消除系统瓶颈,将系统的整体性能发挥到最大?提升性能有几种方式:提升处理器的主频、修改处理器架构以扩展内存寻址能力(EM64T技术)、在处理器内部集成更大的高速缓存等。此外,利用Nocona处理器所具备的DBS(按需切换技术),可以根据系统使用率的变化动态调整处理器主频和电压,以达到降低处理器平均功耗的目的。由于主频的提升、缓存的增大、前端总线频率的提高,新一代Nocona处理器的性能比前一代提高了30%。Intel最新发布了升级版64位至强Irwindale处理器。其带有增强的2M二级高速缓存,与上代Nocona版本相比,可实现18%的性能提升。

六、DIY伺服器CPU的选择

DIY一台伺服器,选择一颗满意的“芯”尤其重要。Intel的伺服器CPU占伺服器处理器市场主流,产品线非常长从Itanium(安腾)系列、Xeon(至强)系列到P4,涵盖了高中低档应用需求。尽管AMD最近推出的CPU得到HP、IBM等伺服器巨头的青睐,但考虑到其他配件的搭配和技术的成熟度,Intel系列的CPU仍是DIY伺服器的较佳选择。目前的主流应用是32位,从性价比来说,笔者认为目前Intel的Prescott/Northwoo处理器都是DIY伺服器的首选CPU(但旧型130纳米P 4 3.2GC Northwoo快停产)。Prescott使用90纳米制造工艺,拥有1MB L2缓存和SSE3指令,目前的高端875主板支持单路CPU,它拥有高速的系统总线(外频 800MHz),基于增强型NetBurst架构Enhanced Architecture,采用了甚长管道技术,这样做可以使得频率提升更加容易。Prescott 90纳米的制造工艺能减少核心尺寸,容纳更大的缓存。L1 数据缓存的容量由8KB提升到了16KB, L2缓存的容量提升到了1MB,与CPU核心连接的总线宽度为256bit。3.4GHz Prescott的缓存带宽达到了108GB/S。最新推出的Prescott核心 P4 XE 3.73Ghz,L2更增大到2MB。与AMD提升缓存不同,Prescott的缓存容量提升与其频率的增长同步。Prescott的另外一个亮点是改进的Hyper-threading技术,有效地提升多线程的实际执行效率。

对于DIY伺服器来说,Intel将推出的支持64位和超线程(HT)技术的 6xx系列P4新产品也是不错的选择,L2缓存加大到2MB,采用EM64T技术,发热量也因EIST、C1E与TM2省电技术大为降低。

第一季内推出P4 660(3.8GHz)供应市场,Intel也推出600系列的低频版本,如600,620和640供应零售市场。

EIST 运作

TM2 操作实例

七、P4和单双至强之争

伺服器采用单P4 CPU作数字库时,如CPU经常出现占用率90%以上时就要考虑转用至强CPU了。

近一年多来旧至强处理器几乎没有变化,外频停留在400、533MHz、其性能差过P4,只在缓存上有一定优势而己。最近采用90纳米工艺的新至强 Nocona外频上升到800MHz、 L2缓存 1M,比旧至强性能高达35%,但是, 90纳米的工艺并没有给新至强带来凉爽,反到因为频率的提升(由2.8至3.6GHz),功耗首次冲破100W,散热也成为新至强处理器特别迫切的问题,在1U狭小的空间中解决这一难题困难重重。由于新至强处理器功耗比前代产品上升了45%,虽然引入了在手提电脑处理器上广泛使用的SpeedStep技术来调整功耗,但伺服器是持续运行,要如何彻底解决新至强新一代伺服器的散热 ,确是需要费一翻工夫的。

采用90纳米工艺的新至强 Nocona外频上升到800MHz、支持64位扩展计算,是其PC伺服器产品线历史上最大的动作。外频的提升让新至强的总线带宽提升了一大截,而且还将32位总线扩展到64位,通过与即将发布的Windows* x64版相配合,实际的性能提升恐怕不能用一个数量级来形容了。

兼容前代至强处理器,继续通过DBS提供节能特性,并通过支持DDR2-400内存和PCI Express来提供增强的性能和灵活性。正如前面提到的,伺服器整体性能的提升需要均衡发展。尽管新至强带来一些提升,但单路至强与新的P4相比,性能没提高多少。因此专业伺服器厂家一直比较注重2、4、8路伺服器的发展。双新至强与单个不支持HT的P4的对比起来差异就很大了。如在P4伺服器上运行一个中型的商务信息网站,CPU经常都是使用率50%以上的,改为双新至强伺服器,CPU使用率就降至10%以下。一般数字库程序应用在双新自强CPU平台环境会运行更快,加上双新自强CPU能比单P4 CPU整体性能有30-35%提升,由于双CPU支持“ 多线程” 能大大提 高CPU 的使用率。单CPU一次只能执行一个线程,双CPU在执行多线程数字库程序运行的速度要比单CPU的系统快上50-70% 。

对于访问量大的网站伺服器,CPU性能对IIS 服务同时在线访问人数限制也至关重要。以P4 2.8G CPU 做的Web伺服器可支持2000人以上同时在线,其内存最好在512M以上,1G更佳。采用双新至强2.8G CPU的Web伺服器,则可支持高达3000~4000人同时在线。

综上所述,如果目前要由P4升级笔者建议应选最新双至强。