2、性能瓶颈定位及实例分析

  2.1 性能瓶颈定义

  根据业界的惯例和测试经验,将AIX服务器性能瓶颈定义如下(相关指标项主要参考命令行获取):

  2.2 瓶颈分析经验举例

  经验一:

  当增大系统压力时,吞吐率和TPS的变化曲线呈大体一致,则系统基本稳定;若压力增大时,吞吐率(或点击率)的曲线增加到一定程度后出现变化缓慢,甚至平坦,很可能是网络带宽出现瓶颈。进行服务器资源瓶颈分析前要先排除网络因素。

  经验二:

  资源监控中指标中的内存页交换速率(Paging rate)如果偶尔走高,表明当时有线程竞争内存。如果该项持续在高位,则内存可能是瓶颈。当然此时也可能是内存访问命中率低造成的,要结合“Swap in rate”和“Swap out rate”等指标项进行分析。

  经验三:

  指标CPU占用率(CPU utilization)如果持续超过95%,表明瓶颈是CPU。可以考虑增加一个处理器或换一个更快的处理器。服务器CPU合理使用的范围在60%至70%。

  经验四:

  指标磁盘交换率(Disk rate)如果一直很高,表明I/O有问题。可考虑更换更快的硬盘系统、重新部署业务逻辑等,另外设置Tempdb in RAM,减低“max async IO”,“max lazy writer IO”等措施都会降低该值。

  经验五:

  Tuxedo资源监控中指标队列中的字节数(Bytes on queue),队列长度应不超过磁盘数的1.5~2倍。要提高性能,可增加磁盘。

  经验六:

  SQLServer资源监控中指标缓存点击率(Cache Hit Ratio),该值越高越好。如果持续低于80%,应考虑增加内存。注意该参数值是从SQL Server启动后,一直累加记数,所以运行经过一段时间后,该值将不能反映系统当前值。