虚拟化技术的应用可以帮助用户通过服务器整合,实现在同一台物理服务器上运行多个软件应用,甚至可以运行在不同的操作系统上,用更少的服务器获得更高的整体性能,提高计算机性能的利用率。伴随着用户对于服务器的整合需求的不断增多和处理器性能的不断提升,特别是多核时代到来后,虚拟化应用也逐渐从原有的大型机移植到了x86架构的服务器上。由于虚拟化技术拥有高效、节能、节省空间、省电等多种优势,无论是大型企业数据中心整合还是中小型企业的经济型服务器选型,虚拟化都在其中扮演着重要的角色。事实上,实施服务器虚拟化可以让客户获得更大的收益。虚拟化技术能够为公司节约大量的成本、降低系统管理成本、节约人力、提高老业务系统的性能,还降低新系统的开发部署成本。

  可见,在商用环境中,已经有越来越多的客户选择了英特尔多核技术的服务器,并且已经开始广泛采用虚拟化技术来降低数据中心整合的成本。然而,在选择实现佳运作的服务器平台的时候,特别是虚拟化的应用层面比较上,至今没有统一的计算标准来衡量和反映虚拟化所带来的性能提升和IT基础建设整体拥有成本(TCO)的改善。

  然而,虚拟化的发展离不开虚拟化性能基准测试的完善。因为,目前许多企业的IT管理人员还只是停留在学习阶段,有些人对虚拟化一无所知,因此,基准评测的建立可以帮助用户更好地了解虚拟化。“通过基准评测,用户在采购过程中可以更好地进行比较,从而降低采购风险,这实际上也会促进虚拟化市场的发展。”

  目前,IBM、Intel、VMware等相关厂商都对虚拟化性能测试基准的发展表示非常关注,并且都采取了相应的措施。Intel在2006年年底与IBM合作,共同推出了vConsolidate,VMware也在近退出了VMmark。我们认为两者在大的目标和设计理念方面是非常相似的。细节方面,两个测试在各个虚拟机的负载选择方面有所不同。由于虚拟化是一个非常新的领域,在测试基准方面以前一直是一个空白。

  vConsolidate评测工具通过真实地模拟典型虚拟化部署环境中的负载来达到测试服务器虚拟化性能的目的。vConsolidate是一项整合性能指标评测,包括四个同时运行的不同性能指标评测。其中包含面向数据库、Web、Java和邮件的性能指标评测组件。

  vConsolidate是一项整合性能指标评测,包括四个同时运行的不同性能指标评测。其中包含面向数据库、Web、Java和邮件的性能指标评测组件。由于该评测面向虚拟环境,因而每个组件均在其自己单独的虚拟机和操作系统中运行。除了上述四个性能指标评测组件之外,还有第五台虚拟机未运行性能指标评测,由此来模拟闲置的VM。这五台虚拟机构成了一个整合堆栈单元(CSU)。

  vConsolidate堆栈的构建模块包括五台不同的虚拟机(数据库、Web、邮件、Java和闲置)。为了运行单个的整合堆栈单元,需要将三台客户机与被测服务器(SUT)相连接。其中两台客户机生成负载(一个用于Web,另一个用于邮件),第三台客户机来控制运行环境。Java和数据库组件具有低消耗的独立驱动程序,不需要运行外部客户机。注意,随着更多CSU的增加,所需的客户机将以“三个”为单位递增。

  vConsolidate所用的四个组件工作负载分别为:Sysbench(数据库)、WebBench*(Web)、LoadSim(邮件)和Specjbb2005*(Java)。工作负载的存储跨整个测试配置进行分布。Web客户机包含WebBench客户机程序。邮件客户机包含:Microsoft Outlook、LoadSim和WebBench控制器程序。服务器包含虚拟化软件,在此为VMware ESX Server。单个VM包含各自的工作负载。这些VM文件可以本地存储到服务器上,或者如同我们的配置一样存储到外部存储域网络上。

  作为虚拟化技术的测试基准系统,VMmark的诞生也是为了帮助用户在解决:“当前的服务器硬件上,可以划分几个虚拟机?”等问题。通过VMmark,服务器供应商可以公布出每台服务器的得分,进而得出每台服务器所能支持的大工作负载数,也是这台服务器上的虚拟机的总体性能,这可以帮助用户决定他们需要多大的服务器硬件来运行他们当前的企业级工作负载。

  作为虚拟化技术的测试基准系统,VMmark目前包括六种主要的工作负载:文件服务器、邮件服务器、Web服务器、备用服务器、OLTP数据库和Java顺序登录系统。这些应用当中,一半运行在Windows上,另一半运行在Linux上。这六个工作负载的表现被VMware称为“砖瓦(tile)”。终的得分取决于机器终能够运行多少块砖瓦。“不幸的是,尽管我们能够非常简单地在VMmark系统当中加入例如Exchange电子邮件服务器以及其他Windows上的工作负载,但因为微软公司的许可限制,VMmark当中并没有包括这些非常常见的应用。”戴尔公司和Sun公司的公布了基于beta版VMmark的基准测试值,但VMware公司是与IBM、惠普、富士通-西门子以及其他硬件供应商在VMmark上合作。

  而SPEC(Standard Performance Evaluation Corp.标准性能评估机构)也在去年成立了一个工作组,讨论是否需要针对虚拟化应用建立基准评测。如果需要,预计三个月后能提供全新的评测方法和指标体系。

  SPEC是一个全球性的、权威的第三方非赢利性组织,旨在联合许多高科技领域的级企业共同建立公平的标准,以评测各种技术的性能。目前,SPEC已经推出一系列针对服务器、软件应用、高性能计算系统的基准评测。

  目前,WEB服务器、EMAIL服务器或数据库应用都有着各自不同的基准评测。但是,如果这些应用同时在一台虚拟服务器上跑,基准评测的程序和方法要重新考虑和设计。而SPEC所要做的事情是集合英特尔、AMD、富士通西门子、Vmware和其他主要厂商的代表和一些终用户来共同建立一套简单、高效的度量标准,来量化评价虚拟服务器系统,以便作为用户做虚拟化解决方案选型的依据。

  那么,基准是如何测量虚拟化的,它看起来什么样子?SPEC主席Walter Bays给出了如下答案。

  基准如何测量一个服务器在虚拟化上表现得有多好?

  Walter Bays:有一些东西是我们努力要找出来的。在这个基准中,每个人关心的内容都不一样,不论是终端用户还是会员,因为你可以从硬件为中心的视角出发,了解你感兴趣的那些地方,例如当有人在虚拟化环境中进行操作的时候,什么是好的处理方法。然后你看到软件公司力图从这个出发点开始竞争。你有一个独特的服务器;那么对于它来说什么是好的虚拟化软件?

  那是否意味着会有多个虚拟化基准呢?

  Bays:我想很可能是同一个基准,但是正如看到的结果,你可以辨别它们是针对软件或者是硬件的性能。我期望它的工作方式像SPECjAppServer基准。你可以看到硬件公司有他们自己的软件进行测试,但是他们也有第三方的测试软件。然后你还会看到软件公司也会基于某个范围的硬件产品进行测试。

  希望是,如果你同时有硬件供应商和软件供应商都想展示一下他们在一定范围的配置下能够做什么,那么终端用户会得到他们真正需要的底线信息。