好久没上雏鹰部落了,刚一登陆就看到几个垃圾帖,鼠标一挥,消灭掉。刚好看到几条提醒信息,是对之前分享的项目贴的回复,发觉我很久没来分享东西了,找了篇半年前写的排错案例,分享一下。现在看来,庆幸当时有记录下来,不然我早忘记有做个这个项目了,让它发挥下余热,哈哈。
==============================================
这两天排查上海电信XXXX Cisco4506R CPU过高的Case,稍微整理一下排错过程。 客户反映,系统本月12号上线,13号发现4506-A的CPU利用率过高,大概在60%左右,偶尔会飙升到90%以上,对网络负担过重,而4506-B的CPU利用率维持在正常10%左右,需要对现象进行分析与排查。客户提供两条线索: 1. 之前部署了PBR,是否因为PBR导致CPU过高? 2.在4506上开debug发现,内网有一台双网卡的主机发包比较异常,是否可以通过禁用网卡来测试。
由于客户网络比较重要,我并没登入权限,所以整理了排错需要的命令,由网管抓取相应信息: show version show power show module show environment status show Redundancy show vlan show ip ospf nei show ip bgp sum show memory sho process cpu sho process cpu | ex 0.00 sho platform health sho platform cpu packet statistics sho platform cpu packet buffered sh int | i protocol|rate|broadcasts show int count errors show ip int br show int show int trunk show run show logging show spanning show spanning-tree blockedports show spanning-tree root show spanning-tree summary show spanning-tree inconsistentports show errdisable detect show errdisable recovery
排错过程:
|