【SPOTO思博网络】华为设备故障分析与排除方法大全【汇总】
【SPOTO思博网络】华为设备故障分析与排除方法大全【汇总】1. 磁盘空间告警告警信息:IGWB介质空间不足。告警分析:主用IGWB在剩余磁盘空间小于15%的时候就会出磁盘空间告警,省公司要求话单保存时间:原始话单15天(D盘),格式转换后的话单15天(E盘),最终话单90天。告警处理:删除部分格式转换后的话单(E:\backsave\Second\X3KM\),剪切部分最终话单到应急工作站(暂时),建议增加IGWB硬盘空间。
2. 备用IGWB磁盘空间不足故障现象:备用IGWB磁盘空间不足故障分析:备用IGWB是实现话单双备份的组成,并且如果备用IGWB磁盘剩余空间过小,主用IBWG异常的时候将无法倒换。故障处理:清理备用IGWB磁盘空间。
3. 单板故障告警信息:例如WSMU 板故障、单板CPU自检故障。告警分析:无告警处理:1.复位 2.拔插 3.更换
4. 电源故障告警信息:-48V 电压过高告警。告警分析:告警产生原因:· 动力进行例行放电测试,致电压临时过高· 电压已恢复正常,但告警未自动消除,出现假告警· 电压过高导致。根据指令DSP PDB可以查询到系统的电压正常范围是-42V~-57V,经常观察如果电压过高后,告警会在电压降到-54V的时候消除。如果告警长时间未自动恢复,可以用万用表测电压,看是否在正常范围内,如果电压已正常,可以手动把电压的门限值进行调高,使告警恢复后再把门限值调到正常范围内。告警处理:1)联系动力专业,确认是否在进行电池放电测试。如是,在测试完成后观察告警是否消除2)根据指令DSP PDB可以查询到系统的电压正常范围是-42V~-57V,经常观察如果电压过高后,告警会在电压降到-54V的时候消除。如果告警长时间未自动恢复,可以用万用表测电压,看是否在正常范围内,如果电压已正常,可以手动把电压的门限值进行调高,使告警恢复后再把门限值调到正常范围内。(现在配电框监控板默认的告警上限目前定义为57V,产品设置时,可在此基础上加3V,设置为60V比较合适。MSOFTX3000可以通过软调修改电压告警上限。软调命令如下:STR SFTD: LT=MN, MN=2, PID="166", CTRL="36", PM0="1", PM1="60", PM2="42";STR SFTD: LT=MN, MN=2, PID="166", CTRL="36", PM0="2", PM1="60", PM2="42";)3)观察一段时间,如告警不会自动恢复就联系动力室处理。
5. IGWB倒换告警信息:iGWB双机倒换告警分析:双机倒换通常是主用IGWB异常引起,可能原因:磁盘空间不足,重要目录被改动,网络故障,进程异常。告警处理:清理磁盘空间,恢复被改动目录,检查处理网络,重启IGWB进程。
6. 传输故障告警信息:E1端口故障或信号丢失。告警分析:无告警处理:自环检测,通过LOP E1对本端端口进行软件环回,如正常则表示单板端口硬件正常,再在各段DDF架端进行环回测试,逐段排除线缆原因,如是本端问题则重做线缆接口、换线或者换板,如是传输问题则转传输室处理。
7. IGWB内存过载告警信息:iGWB 内存过载。告警分析:IGWB上运行的主要进程有om_proc.exe,ap_proc.exe,cfg_proc.exe,cls_proc.exe,knl_proc.exe。主要检查这些进程有没有大量占用内存空间。现在SZS09,SZS12的om_proc.exe进程占用大量内存不释放。告警处理:暂时的处理办法是重启om_proc.exe,最终解决方法等待华为工程师补丁解决。
8. IGWB备份失败告警信息:iGWB备份连接失败。告警分析:IGWB备份有两份,都是从主用IGWB以FTP方式备份到备用IGWB。一份保存在备机的E:\billforbs,保存1000个文件,通过smartback实现;一份保存在E:\ finabill_bak,保存时间为90天,通过igwb.ini文件的配置信息实现。告警处理:检查smartback备份的路径和用户名密码是否正确;重启smartback软件;重启IGWB进程。
9. 网络故障告警信息:BAM到主机连接中断、TCP链路故障。告警分析:故障可能原因lanswitch异常,网口松动,网卡运行异常。告警处理:拔插BAM主机网线,拔插lanswitch端口网线,禁用启用网卡,重启BAM。
10. MTP、SCCP、M3UA故障告警信息:M3UA路由传输禁止 & 路由不可用;MTP链路故障/MTP 链路定位失败;SCCP目的信令点禁止。告警分析:故障可能原因传输故障引起,配置数据变更,链路负荷过高。告警处理:检查传输,检查数据配置信息,检查是否为垃圾数据产生的告警。
11. 话单文件校验错误或话单文件丢失告警信息:无告警分析:可能是话单文件传送到计费中心出错,需要重传计费文件告警处理:重传相应计费文件
12. 更换单板时程序加载不成功告警信息:单板程序加载不成功告警分析:可能原因:1.单板加载软开关未打开.2. 加载文件丢失告警处理:
1)通过MOD LSS修改单板加载软开关,设置为”程序不可用,数据不可用 ,数据可写, 程序可写”,加载完成修改为” 程序可用,数据可用,数据可写,程序不可写”2)主机加载文件都存于BAM的D:/data 目录下,在此目录下查找所要加载的单板的程序文件,如未找到,说明文件因其他原因丢失,通过在其他同类型同版本局上能找到该单板的程序文件,将文件拷贝至该目录下,重新复位加载单板。
13. 硬盘故障故障现象:故障磁盘灯亮红灯。故障分析:华为软交换的硬盘都采用磁盘阵列方式对数据进行保护,硬盘支持热拔插,坏一块磁盘不影响系统运行,但是要尽快安排更换。故障处理:更换硬盘。
14. 主机时间偏差故障现象:检查主机系统时间发现网元的主机时间和北京时间相差较大。故障分析:主机系统时间就是话单产生时间,华为认为偏差在正负5秒是正常的,超过这个范围需要校正。故障处理:主机时间和BAM时间同步,更正其中一个就可以达到校正的目的。可以通过DSP TIME查看系统时间,通过指令SET TIME修改,或者直接改BAM的系统时间。
15. CRC校验错误故障现象:CRC校验错误告警。故障分析:交换机数据与BAM机数据不一致,可能是由于工程引起的故障。故障处理:通过SND SPD指令对校验出错的数据表进行强制发送,再次执行STR CRC进行CRC校验【推荐阅读】网工必看!IP地址、子网掩码和网关的解释「是看了就懂的系列」初级到高级网工学习渠道最全汇总(建议收藏)8年的网工对这个行业的一点见解
页:
[1]