本文将介绍用shell脚本来分析Nginx负载均衡器的日志,这样可以快速得出排名靠前的网站和IP等,推荐大家使用线上环境下的shell脚本。本文中的shell脚本又分为两种情况,第一种情况是Nginx作为前端的负载均衡器,其集群架构为Nginx+Keepalived时,脚本内容如下所示:

 

  1. vim log-nginx.sh  
  2. #!/bin/bash  
  3.  
  4. if [$# -eq 0 ]; then  
  5.   echo "Error: please specify logfile."  
  6.   exit 0  
  7. else  
  8.   LOG=$1  
  9. fi  
  10.  
  11. if [ ! -f$1 ]; then  
  12.   echo "Sorry, sir, I can't find this apache log file, pls try again!"  
  13. exit 0  
  14. fi  
  15.  
  16. ####################################################  
  17. echo "Most of the ip:"  
  18. echo "-------------------------------------------"  
  19. awk '{ print$1 }'$LOG| sort| uniq -c| sort -nr| head -10  
  20. echo  
  21. echo  
  22. ####################################################  
  23. echo "Most of the time:"  
  24. echo "--------------------------------------------"  
  25. awk '{ print$4 }'$LOG| cut -c 14-18| sort| uniq -c| sort -nr| head -10  
  26. echo  
  27. echo  
  28. ####################################################  
  29. echo "Most of the page:"  
  30. echo "--------------------------------------------"  
  31. awk '{print$11}'$LOG| sed 's/^.*\(.cn*\)"/\1/g'| sort| uniq -c| sort -rn| head -10  
  32. echo  
  33. echo  
  34. ####################################################  
  35. echo "Most of the time / Most of the ip:"  
  36. echo "--------------------------------------------"  
  37. awk '{ print$4 }'$LOG| cut -c 14-18| sort -n| uniq -c| sort -nr| head -10 > timelog  
  38.  
  39. for i in 'awk '{ print$2 }' timelog'  
  40. do  
  41.   num='grep$i timelog| awk '{ print$1 }''  
  42.   echo "$i$num"  
  43.   ip='grep$i$LOG| awk '{ print$1}'| sort -n| uniq -c| sort -nr| head -10'  
  44.   echo "$ip"  
  45.   echo  
  46. done  
  47. rm -f timelog