搜索
论坛
用户:
密码:

游戏频道 - 网游 单机 电视 掌娱
您当前位置:首页 >> 服务器频道 >> 评测 >> 正文                           
成就非凡:谈IBM UNIX服务器的技术
振华网 2007年05月06日 作者:阿亮 编辑:阿亮


  1. 什么是mbb结构

  mbb的全称是modular building block,每个bb(building block)可包含4路cpu,若干内存和i/o卡。在sun服务器上称bb为board;在hp服务器上称bb为cell;在原先的compaq服务器上称bb为quad。不同bb内的cpu可以有不同的时钟频率。所有的bb通过一种称为crossbar switch的交换机制连接在一起。crossbar switch可以提供bb之间的点对点的高速连接。

  采用mbb技术可以比较容易的设计出拥有更多数量cpu的服务器。在这种服务器上既可以运行一个操作系统,也可以在一个或多个bb上运行多个操作系统。这就是所谓的服务器(基于物理分区)的逻辑分区。

  mbb 技术从出现到现在已经超过十年了,最早是由sequent (numaq)公司在八十年代末到九十年代初时发明并采用的。cray公司在九十年代初时在它的cray 6400上采用了mbb技术,该机型是sun e10000的前身;compaq公司在2000年一季度发布了它的基于mbb技术的机型wildfire (gs320);hp公司发布了业界最后一款基于mbb技术的机型superdome,那是在2000年三季度。sun公司在2001年三季度发布的 starfire (f15k)在体系结构上并无变化,只是将原来e10000上的cpu换成了sparc3而已。

  2. mbb结构的优点

  基于mbb技术的服务器是由多个bb构成的,所以它天生具有物理分区(physical partition)的特性。前面提到在mbb服务器上存在一个连接bb的互连机制(crossbar switch),它工作在一个固定的时钟频率上。

  例如,在sunfire服务器上的uniboard机制就是完成这种互连功能的。其总线时钟是150mhz,不管cpu的主频是多少(600,750, 900,1050mhz),它是固定不变的。所带来的问题是数据/指令被传送出去的等待时间过长。这是典型的高cpu时钟频率和低总线速度的矛盾。

  所有的mbb结构的服务器都具有一个"显著"的优势:可以热插拔cpu板和内存板。这是因为每一个bb是物理分开的,每个4路cpu板可以单独从系统中隔离出来并将其下电。但有一点需要注意:在一个运行的系统中,从一个bb中拔出cpu、内存或i/o板是有限制的,这基于每个机型的设计不同而不同。例如,sun 6800服务器就有一个警告标签,其注明每个uniboard槽在系统运行时空槽位的时间不能超过60秒(而且电源、温度等环境因素必须控制在一定的范围内)。由此推断,f12k/f15k可能时间会更短。

  3. mbb结构的缺陷

  hp公司当初发布superdome 服务器时,曾公布了它与hp其它unix服务器的相对性能值。64路cpu的superdome(mbb结构)的相对性能值是20,8路n4000(共享结构)的相对性能值是6.3。我们可以看到,8倍数量的cpu换来的只是3倍性能的提升。

  造成这种现象的根本原因就在mbb结构上。 superdome上的每个cell(bb)里的cpu、内存或i/o卡可能需要访问其它cell里的数据。crossbar switch在cell之间建立点对点的连接,但同时带来延迟(latency)。即如果一个连接请求建立不成功时,则会再试一次直到建立连接成功,而此时其它的连接请求将会等待。在实际环境中,很多客户通过建立物理分区(每个分区中最多12到16个cpu)的方法来尽量减少这种延迟的影响。这种做法将原来cpu个数较多的机器分成了若干个有较少cpu个数的机器,当然也就不是原来宣称的服务器的扩展性了(例如具有64路cpu的服务器)。

  sun和compaq公司的具有mbb结构的服务器里都有类似的crossbar switch结构,当然都存在相同的数据访问延迟的缺陷:点对点的连接必须建立,同时这种连接的建立是竞争的。

  sun 公司宣称其服务器的扩展性是线性的,即服务器的性能随着cpu个数的增加呈线性增长。它是用specintrate和specjbb2000这两个基准测试值来证明的。我们需要指出的是:这两种测试方法只是基于cpu本身,并没有共享数据的访问和网络及硬盘i/o的发生。很显然,这与实际情况是不相符的。

  我们谈服务器的性能是整体的去看。有很多可以整体评价服务器性能的基准测试,例如:tpc/c、oracle asb11i、peoplesoft、sap、baan、jdedwards等。这些测试方法都具有数据库访问、模拟客户的实际应用和很大的i/o访问量等特点。

  4. 以power4为芯片的ibm unix服务器的设计

  ibm unix(p系列)服务器的设计思想是共享式的,即所有cpu可以同等的看到所有的内存和i/o的连接方式:一种全新的为数据/指令流提供足够的高速通路的体系结构。

  p 系列服务器cpu数量的增加是一个成比例渐进的过程。目前p690上的最大cpu个数是32路。从p690"以少胜多"的实例来看,服务器cpu数量的多少并不真正代表其处理能力的高低。p690(32路cpu)胜过superdome(64路cpu)就是一个有力的证明。

  power4和以power4为芯片的服务器在设计上有两个重要点:

  · 消除对数据传送的约束

  · 数据传送能力是随着cpu性能的增长而增长

  下面将比较详细的做一介绍:

  (1) 在power4芯片上设计了较大的缓冲区。一个power4芯片(chip)上有两个核心处理器,每个核心处理器有一个l1缓冲器(32kb数据和 64kb指令),并且每个芯片上有一个共享的l2缓冲器(1.5mb)。这个l2缓冲器的时钟频率是核心处理器的一半。每个 l2缓冲器有三个32字节宽的总线与两个核心处理器相连,用于向两个核心处理器传送指令和数据。另外还有三条8字节宽的总线用于从两个核心处理器回传数据给l2缓冲器。power4创造了第一个消除了控制信号和数据传送冲突的cpu结构。

  power4处理器有一个l3缓冲器控制器,它是与32mb大小的l3缓冲器的接口。在业界有一种说法:任何i/o都是不好的,即cpu运行时所需的数据不在内存里,需要从外设中读入。最理想的状态是处理器运行时所需要的指令/数据全都满足,其次是指令/数据在l1缓冲器中,再其次是在l2缓冲器中,再其次是在l3缓冲器中,最差的情况是在内存里。p 系列服务器上的缓冲区总数量是sun服务器的四倍,是hp服务器的十五倍。 (2) 在power4的设计中存在一个称作分布式交换器(distributed switch)的连接机制。它提供在一个mcm(multi-chip module)上的处理器之间的点对点的连接,也用于在不同的mcm上的处理器之间的点对点的连接。这个分布式交换器的时钟频率是cpu的时钟频率的一半。例如,如果是1.3ghz power4的处理器,则分布式交换器提供16字节宽、时钟是650mhz的点对点总线连接。

  ibm目前提供给unix市场的服务器,真正实现了cpu处理能力和服务器处理能力的线性增长。

  5. 关于ibm unix服务器上的一些"限制"

  ibm 在其unix服务器(p系列)的设计上没有采用mbb的设计结构,所以在p系列机器上不支持物理分区。ibm沿用了大主机s390上的逻辑分区(lpar)设计思想,即设计一个hypervisor(系统管理程序),它能看到所有的真实资源(cpu、内存和i/o卡),并且通过一个控制台(hmc)来管理逻辑分区。通过hmc将上述提到的资源定义到不同的逻辑分区中去,每个逻辑分区所需的最小资源是一个cpu、1gb内存和一个pci插槽。

  ibm没用象其它厂商那样采用crossbar switch技术做cpu之间的连接。在p系列服务器上所有的cpu能够看到所有的内存和i/o资源,它不允许不同主频的cpu共存在同一台机器内。而 mbb结构的服务器则允许这样做,其代价就是crossbar switch工作在相同的带宽上(mbb之间的连接带宽恒定),所以高主频cpu带来的服务器整体性能提升是有限的。

  在p系列服务器上,如果升级cpu则必须更换整个cpu板,其优点是cpu主频和系统总线带宽同时得到提升,保证更高主频的cpu带来更高的服务器性能。

  由于没有采用mbb的设计结构,所以在p系列服务器上不支持热插拔cpu板和内存板。"热插拔"这个设计思想的目的是为了方便系统维护,即更换服务器失效部件时不需停机,以减少计划内停机时间、提高系统的可用性(availability)。

  关于系统可用性方面,ibm的设计思想是:在关键性部件(如cpu,内存等)出现硬件故障时,系统能自动隔离失效部件并且继续运行。主要包括如下三个方面的内容:

  ·选用高质量的材料,制造高质量的部件,提供更高的可靠性。

  ·ibm 发明的自诊断技术ffdc(first failure data capture)能够做到早发现故障(例如在p690上就设计有5600多个观察点),并能自动隔离失效部件。目前在p系列服务器上能做到自动隔离失效的 cpu、l2/l3缓冲器、pci总线、pci卡和lpar(逻辑分区)等,使系统能够继续运行。

  ·客户在计划内的停机维护时间里,可以很快的修复失效部件。据研究表明计划内的停机是有代价的(对客户来讲有些损失),但非计划内停机所带来的损失则是几何级数量的。采用mbb结构服务器的厂商声称热插拔cpu/内存的功能可减少计划内的停机时间,但其服务器有限的自诊断和自隔离功能将增加非计划内的停机时间。

  6. 结束语

  ibm是唯一一家在高端服务器行业有能力自己设计、研发和制造的厂家。ibm设计和制造cpu的成就是非凡的。从我们目前所熟知的铜芯片、绝缘硅技术,到后继的low-k dielectric和silicon strainin等新技术已一一被发明出来。 ibm在服务器的设计、软件的设计和存储器方面的成就也是令人瞩目的。从大型主机上继承下来的丰富的多机系统设计、中央数据处理、高可靠(ras)设计等经验已经迁移到unix服务器的设计和实践中。

上一条新闻:
下一条新闻:

[收藏文章] [发表评论] [打印文章] [关闭窗口]

更多相关:UNIX  

 

相关文章
最新文章
·中高UNIX服务器 RISC处理器芯片
·2007年 中高端市场主流UNIX服务器
·惠普推两款UNIX服务器 最低售价4万以内
·增强Linux/Unix服务器系统安全性介绍
·惠普成为2006年用户最满意Unix服务器
·Windows服务器市场份额逼近Unix
·微软:增强Server R2对Unix的支持
·操作系统安全测试——Mac OS X & BSD Unix是世上最安全系统


      
热门文章
频道最新


      
文章评论(网友评论条)
 
姓名:
最新热图
 

热门图片行情

热门图片新闻

Copyright @ 2001-2006 Zenha.net, All Rights Reserved
版权所有 振华网 苏ICP备05084422号