Microsoft 群集服务
在 Windows 2000 Advanced Server 中使用 Microsoft Cluster Service (MSCS) 您可以将两台服务器组合到一起作为一个服务器群集工作,确保客户端始终可以使用到任务关键性应用和资源。 服务器群集使得用户和管理员可以把它们作为一个单一的系统而不是独立的计算机,对服务器的某些资源或节点进行访问。
在 MSIB 2.0 的企业部署中,MSIB 项目组使用了可感知群集的 Commerce Server 2002 和 SQL Server 2000 的组件。
Content Management Server 2002
Microsoft Content Management Server (MCMS)2002 不支持群集和故障切换。 特别需要指出的是,MCMS 2002 的组件在故障切换时数据库连接断开的时候不会自动重试操作。 这样一来,在被动节点变为活动节点的过程中,指向启用了 MCMS 的页面的页面请求将会产生 ODBC 错误。 当系统处于 DEBUG 模式时,或者当浏览器会话是发起自正在与数据库断开连接的 Web 服务器时,这些错误只会返回到客户端的浏览器上。
注: 这些错误只是在 MCMS 站点的页面请求失败的时候发生。
Commerce Server 2002
关于如何群集每个 Microsoft Commerce Server 2002 组件的详细介绍可以在 Planning for Reliability and High Availability 中找到,地址在 http://go.microsoft.com/fwlink/?LinkId=15044。
SQL Server
SQL Server 为 MSIB 解决方案主管运行数据库、管理数据库和数据仓库。 另外,SQL Server 2000 还为报告和分析solution 提供了联机分析处理(OLAP)引擎。
MSIB 2.0 解决方案中所有的服务器产品都要与一台群集 SQL 服务器一起工作,因此在 MSIB 2.0 的企业部署中, MSIB 项目组实施了一个两节点的群集。
如需了解群集选项和故障切换群集方面的详细信息,参见 SQL Server 2000 Resource Kit 中的第 12 章。 MSIB 项目组为本文实施的群集选项在 MSIB 2.0 随带的 MSIB Deployment Guide 中有详细介绍。
组件负载均衡
Microsoft Application Center 可以提供组件负载均衡(CLB)技术,供管理员创建一个服务器群集,对组件请求做出响应。
为了实现高可用性,MSIB 项目组未配置的组件
出于编写本文的考虑, MSIB 项目组决定以单点故障(SPOF)配置实施本部分前面所述的几个软件组件。 这只不过是一个设计决策,并不能反映出使用 CLB 部署的组件能力。
在 MSIB 2.0 解决方案中,有多个 Microsoft Operations Manager Consolidator /Agent Manager 未被 MSIB 实施。 关于如何添加这项功能的详细介绍可以在 Configuring Microsoft Operations Manager 2000 to Manage Complex Distributed Environments 一文中找到,地址在 http://go.microsoft.com/fwlink/?LinkId=15101.
此外,MSIB 项目组还没有在一个高度可用的环境中实施 Commerce Server 2002 Direct Mailer 。 关于如何安装这项功能的详细介绍可以在 Planning for Reliability and High Availability 一文中找到,地址在 http://go.microsoft.com/fwlink/?LinkId=15102.
OLAP 解决方案同样未被 MSIB 项目组以一种高度可用的方式加以安装。 如需了解关于如何实现 OLAP 解决方案高可用性的方面的信息,参见 Creating Large-Scale , Highly Available OLAP Sites 一文, http://go.microsoft.com/fwlink/?LinkId=15103.
旨在获得高可用性的软件建议
建议您在运行 IIS 5.0 的 Web 服务器上使用以下软件将资源消耗问题降到低程度,以免这些问题影响到您的 MSIB 2.0 部署的性能和可用性。
IIS5Recycle
IIS 5.0 Process Recycling Tool,IIS5Recycle 是作为一项服务运行在运行着 Windows 2000 和 Internet Information Services (IIS) 5.0 的计算机上的。 IIS5Recycle 的目的是要重复利用过程,在资源消耗问题影响到性能和可靠性之前将其影响降到小程度。 这一工具可以根据存储在 Windows 注册表中的配置对 IIS 过程进行重复利用。 管理员还可以利用 IIS5Recycle 收集信息以便在排除故障过程和应用中使用。
在重复利用 IIS 过程之前, IIS5Recycle 会在启用了 Windows Network Load Balancing (NLB)的系统中从群集(Web 群)中将 Web 服务器删除掉。 每次把某一服务器从群集中删除的时候,到这个 Web 服务器的连接也将会断掉。 一旦连接号降至配置的阈值之下或已经达到了给定的时间, IIS 服务得到了循环利用。
如需下载该工具及其随带的文档,可参见 http://go.microsoft.com/fwlink/?LinkId=15077。
旨在获得高可用性的硬件建议
MSIB 项目组为本文所用的 MSIB 2.0 企业部署方案中包括了以下旨在实现高可用性的硬件建议。
存储系统
部署中所用的每台服务器都有其相应的存储需求。 为了消除单点故障,MSIB 项目组部署了一个存储区域网(SAN)。 该 SAN 单元本身带有冗余的驱动器、控制器和电源。 SAN 甚至还可以通过与另一个数据中心之间的远程光纤连接将自身复制一份。 可以通过冗余的主机总线适配卡实现 SAN 的连接,这样适配卡本身不会成为一种单点故障了。
网络系统
网络可以具备几个层次的冗余。 对非冗余服务器中的每块网络接口卡(NIC)都进行 分组目的是为了防止 NIC 本身成为一种单点故障(SPOF)。 在本文后面的部分中对单点故障以及如何避免的问题进行了讨论。
为了避免因单个路由器故障造成的网络停用,您可以部署冗余的路由器。 还可以在设计上使路由器少有两个到外部网络,即 Internet 的连接。 这种层次上的设置不在 MSIB 2.0 版本介绍范围之内。
服务器系统
如本文前面部分所述,为了实现高可用性,MSIB 项目组使用 NLB 和 Microsoft Cluster Service (MSCS)以群集的方式部署了物理服务器。
避免单点故障
这一部分中列出了 MSIB 2.0 部署中典型的单点故障并提供了用于解决每种 SPOF 的高可用性技术。
以下这些方面是 MSIB 2.0 部署中常见的故障点:
网络
服务器硬件
磁盘子系统
应用程序
数据库和数据库连接
下表所列的技术可以用来在您的 MSIB 2.0 部署中提供高可用性,并且介绍了它们能够解决哪些故障点。 这些高可用性技术可以解决本文前面介绍的问题。 建议您在部署 MSIB 2.0 site 站点的时候在较宽基础结构的层次上(如附录A“Hardware and Network Topology Details”给出的企业部署)采用这些技术。 在您的部署中遇到的单点故障越少,这种部署更加具有高可用性。