服务器 2024-06-25

KunTai R722服务器硬盘只读问题分析

一、现网描述

1.1 环境描述

设备型号:KunTai R722

硬件配置:9460-8i RAID卡、12*3.5前置背板、4*2.5后置背板

前置硬盘背板:disk0三星SAMSUNG MZ7LH480HAHQ-00005 480G固态盘、JBOD模式

disk1~disk10希捷ST12000NM000J 12T机械盘、JBOD模式

后置硬盘背板:disk44~disk45 忆联RP2A36T4RK004VX 6.4TB NVMe 


二、故障描述

2.1故障现象

KunTai  R722服务器在2024.2.26在云平台出现一块硬盘只读告警

image.png


三、问题分析

3.1排查思路

1. 查看sel日志,无告警事件

image.png

2.  查看raid卡状态正常,硬盘状态均正常。image.pngimage.png3. 查看硬盘SMARTAttribute信息,均无错误计数image.png4. 查看phy无近期链路误码image.png


5. OS日志分析

Disk8硬盘状态正常,识别也是正常的,这盘是JBOD盘,当前盘符是sdl,sdi是之前的盘符。

 image.png

image.png

日志内有文件系统的报错,可能是JBOD盘换盘后漂移了,或者上层做了绑定出现报错。目前看IO下发有问题,需要OS侧检查文件系统。

image.png

3.2 原因分析

文件系统错误导致硬盘只读告警


四、问题解决

4.1解决办法

建议系统侧修复文件系统