如果你正面临Web服务器宕机的问题,下面几招可以帮你解决燃眉之急并避免再次出现此类事故。

  过去20年里,网络已成为文明的重要部分。从社会需求层次看,网络需求排名仅低于饮用水与可靠电力供应,网络为人类社会提供了更多的生产力,个人娱乐以及整体生活质量改善在过去半个世纪的发展,是以往任何时期都无法比拟的。

  网站

  通过访问网站满足需求已经被许多现代用户接受:可以通过Web进行学术研究、个人致富和订披萨,用户可以在舒适的家里完成这一切操作。为了竞争,有信誉的企业也投身到网站建设中,一般说来,是深入Web服务器的开发,配置和维护。随着企业越来越依赖他们的Web服务,这些服务器配置也变得越来越复杂,需要更加注重应急预案,应对服务器或集群宕机。

  冗余与Web服务器

  在进行下一步之前,让我们先强调冗余的重要性。过去,冗余解决方案不尽相同,但都涉及到物理硬件的采购和部署实施。如今,虚拟化的广泛应用已造了雪球效应,影响了冗余平台的设计与实施。企业级环境依旧需要多台服务器,只是没有想象的那么多。无论哪款虚拟化平台,只是简单选择一款而不进行详细规划设计的话,距离减少web服务器宕机和失效时间目标,还有很长的路要走。

  步骤 1:发生什么事了?

  系统管理员必须肩负起分析和判断Web服务器宕机原因的责任。需要解决如下的问题:

  ● 是否是断电,发电机测试以及其他类似问题影响了整体物理环境?

  ● 和Web服务器的通信是否已经完全被阻断,还是某些IP段依旧可以使用?

  ● 是否还可以管理服务器?

  ● 日志中是否有异常记录?

  这些只是少部分管理员们需要立即回答的问题,在深入诊断问题之前,先解决上述问题。

  步骤 2:简单的解决方案往往是好的

  有很多时候会陷入诊断高级问题的误区,分析各种可能的技术问题和疑难杂症。而实际上,退一步想,从宏观角度思考问题,可能解决已花费无数工时和成本却还未攻克的技术难题。例如,主机通电了吗,或者是否有人无意间碰掉了电源线?如果机器确实已经通电,但没有任何网络连接,需要检查网线或者光纤是否没有接上或者松动。是的,这些看似明显低级错误的解决方法,你认为都不可能发生,但任何有经验的系统管理员会告诉你,这些状况的发生频率远比你想的要多的多。

  经过上页的两个步骤,如果你的Web服务器还是宕机状态,别着急,还有下面三个步骤。

  步骤3:如果基本故障处理方法没有效果,怎么办

  现在你已经检查了所有电缆和其他外围设备,可以试着使用ping命令探测设备状况。幸运的是,ping命令是所有平台通用的,也是简单的。如果可以在局域网内ping通服务器,接着可以试试从局域网外ping服务器进行检测。这样做可以迅速判断问题是否产生在交换和路由层面,而不是服务器级别。此外,如果Web服务器已经虚拟化,试着ping物理服务器自己的真实IP。这样可以帮助你进一步隔离问题。如果完全无法ping同服务器,而且也已经确定完全检查了网络连接,那么需要进行更深入的分析了。

  步骤 4:使尽浑身解数,服务器依然宕机

  已经检查过网线。也试过了ping服务器,依旧无法访问服务器。好消息是,已经可以将问题定位到物理服务器或操作系统本身了。换句话说,已经可以开始集中经理对现存的问题进行排查。

  接下来,我们才去从底层到高层的方式来逐层检查问题,首先检查网络接口和本地网络配置是否正常。DHCP是否启动?Web服务器是否指向正确的DNS服务器?如果是这样,可以根据使用的操作系统平台,检查Web服务是否正常开启。在Windows环境,需要检查服务器是否具有Web服务的角色。在Linux环境下,检查会更复杂,可以试试查找http相关的文件或服务来确保服务器是否正在运行。

  步骤 5:绝境下需要动用绝招

  如果以上方法都不奏效,检查日志并尝试查明在Web服务器宕机时日志中记录的那些信息。将这些信息发给在故障处理和解决领域更有经验的专业人士,可能会获得更多的帮助。同样的,如果已经确认网络连接不是问题,可以使用Wireshark抓包工具对网络中传输的数据进行抓取分析,以此协助处理问题。

  总而言之,服务器宕机的原因多种多样。断电、配置错误、防火墙设置错误、甚至是来自互联网的恶意流量,都可能引发源站宕机并让系统管理员们抓狂。所有这些问题都足以让企业决策者对冗余解决方案的设计和实施加以重视,同样的针对故障处理流程的设计和制定,还需要根据企业自身网络的实际情况为依据。