服务器 2024-06-25

R522 服务器异常重启

一、现网描述

1.1 环境描述

设备型号:KunTai R722

硬件配置:CPU:Kunpeng 920 5220

                  硬盘背板:25*2.5 SAS/SATA, Expander;2*2.5 SAS/SATA, Rear   

                  网卡:SP382

软件配置:BMC:3.03.00.31

                  BIOS:1.89

               

二、故障描述

2.1故障现象

客户报障现场有1台服务器异常重启,需要分析重启根因情况,重启记录截图如下:

image.png


三、问题分析

3.1排查思路

1.查看日志logdump目录下fdmlog文件,发现日志中有Hardware Error Log Number记录,同时错误类型为:fatal Error,如下图:

image.png

2. 看server_config配置文件,确认其他部件状态正常

image.png

image.png

3. 进一步查看logdump目录下app_debug_log_all日志文件,发现有FDM触发了OS重启记录信息

image.png

3.2分析结论

根据以上iBMC日志分析,核实到PCIE3-SP382的网卡触发生一个fatal error,导致FDM机制触发了OS重启


四、问题解决

4.1解决办法

更换PCIE3-SP382网卡