前一阵一家公司Cisco 的4506突然断电,断电后就无法启动。我立刻从公司出发到了客户现场,客户机房有几个老外在,一个是联系我们的集成商,另外几个是客户的IT人员。 用不是很流利的E文和他们沟通一下,得知这台cisco4506突然断电,重启后就一直无法启动。老外们说是电源烧了,还给我演示了一下,每次打开电源,只听砰的一下,小范围的爆炸声。。。呵呵~很是吓人,我自己亲自操作了下,果然很吓人,启动第一个电源,砰的一声,之后断电;在第一个电源通电状态下启动第二个电源,故障相同。接着分别启动电源,启动PS1,故障相同;关闭PS1,启动PS2,故障相同。每次声音都是砰的一声,只见一旁的老外躲得远远的,好像在等待爆炸一样,俺每次启动电源也是一身冷汗啊,哈哈~ 这时候大家所有的注意力都集中在这两个电源上了,因为没有带备用电源,也无法测试,本以为是IOS丢了之类的问题,重新倒下OK了,直接起不来,这样要折腾了,呵呵~ 一旁的老外倒是还很悠闲,居然有人掏出iphone把cisco4506每次启动砰的一声冒火花的场面拍摄了下来,说要传到网上看看,真是服了他们了。我也凑过去看了下,每次一开电源,先是砰的一声小范围爆炸,然后只见到机箱的个里面冒出火花,的确很神奇,感觉是放烟花。。。 连续看了几遍,突然有一个细节引起了我的注意。发现每次启动后,冒出火花的位置是固定了,每次都是相同部位起火,这一点提醒了我,我让老外在4506旁启动电源,我在机箱旁观察,果然看出些问题了,因为每次启动电源时,都是第四块槽位冒火花,然道是并不是电源烧了,而是第四块线卡烧了吗?一下子仿佛找到了希望。又开始推断,如果电源烧了,为什么每次都是第四块线卡的位置冒火花呢,位置很固定。我又凑近电源,闻了闻没有焦味,倒是第四块线卡位置的焦味很浓。到这里,我敢判断电源没有问题,是第四块线卡烧了。立马将第四块线卡拔出来,重新启动电源PS1,PS2,果然4506转起来了,一切OK。接下来要做的事是把其他线卡接在第四个槽位上,看能否正常启动,如愿以偿也可以正常启动,确认是第四块线卡自己烧了,呵呵!(这个操作是危险的,如果是机箱的第四个槽位接口有问题,可能会导致其他线卡接触后也烧了,呵呵,做这个操作之前犹豫了很久,因为手头没有其他线卡了,呵呵) 找出问题后,大家都开心了,4506终于活了,哈哈!看了下拔出来了线卡,上面有一块芯片已经烧焦了。待4506启动好后,立马带外管理进入command line interface,show environment发现电源和其他线卡一切OK 4506-Shanghai#show environment
no alarm Chassis Temperature
= 39 degrees Celsius Chassis Over Temperature Threshold
= 75 degrees Celsius Chassis Critical Temperature Threshold = 95 degrees Celsius Power
Fan
Inline Supply
Model No
Type
Status
Sensor
Status ------
----------------
---------
-----------
-------
------- PS1
PWR-C45-2800AC
AC 2800W
good
good
good
PS2
PWR-C45-2800AC
AC 2800W
good
good
good
Power supplies needed by system
: 1 Power supplies currently available : 2 Chassis Type : WS-C4506 Power consumed by backplane : 0 Watts Supervisor Led Color : Green Module
1 Status Led Color
: Green
Module
2 Status Led Color
: Green
PoE Led Color : Green
Module
3 Status Led Color
: Green
PoE Led Color : Green
Module
5 Status Led Color
: Green
PoE Led Color : Green
Fantray : Good Power consumed by Fantray : 50 Watts 系统显示电源和其他的线卡都是OK的,show processes cpu history,show processes memory看了下,也没有什么问题。 接下来要做的工作就是把module 4上所有的配置移动到其他模块上,在slot 3上的空闲interface上开启新的trunk,划分好vlan,把slot 4上所有接口配置移动到slot 3上,一切OK,外网,专线和PoE供电的电话等都可以正常使用了。 总结了下,4506无法启动的可能原因是线卡板卡出问题烧了,每次电源启动后为了设备自我保护自动切断电源,所以每次启动后立刻断电,给换块线卡吧,呵呵~ 还是比较佩服老外的工作风格,这断网的关头还能用iphone把4506的冒火情形拍下来,的确悠哉。这冒火的情形倒帮助了判断问题,有意思,哈哈! |