服务器 2024-11-15

KunTai R2260服务器宕机问题分析

一、 现网描述

1.1 环境描述

设备型号:KunTai R2260

硬件配置:3508 RAID卡


二、故障描述

2.1 故障现象

客户现场2022-03-24业务运行过程中,一台服务器出现宕机的问题。

 

三、 问题分析

3.1 排查思路

1、 Sel日志中记录2022-3-24显示RAID卡与BMC通信丢失

image.png 

2、 maintenance_log记录 raid卡心跳异常

image.png 

3、 RAID_Controller_Info中查看,RAID卡显示状态异常,且RAID组、硬盘状态异常

image.png 

判断为RAID卡故障,建议更换RAID卡

3.2 原因分析

RAID卡故障


四、问题解决

4.1 解决办法

建议更换RAID卡

4.2 分析总结

raid卡故障,导致raid卡信息、硬盘信息获取不到,raid配置找不到,进不去系统,并产生raid卡与iBMC通信丢失告警。

更换raid卡问题解决,服务器当前运行状态无异常。