服务器 2024-06-24

KunTai R2260服务器宕机问题分析

一、现网描述

1.1 环境描述

设备型号:KunTai R2260

硬件配置:机箱 12*3.5英寸硬盘直通


二、 故障描述

2.1 故障现象

客户一台KunTai R2260服务器出现多次重启


三、 问题分析

3.1 排查思路

1. 查看sel日志,无硬件告警

image.png

2. 查看fdm_output无硬件告警

image.png

3. 查看串口打印日志

image.png

image.png

4. 之后多次重启相同报错信息,系统启动过程中伴随fsck分区修复

image.png

image.png

5. Fsck修复完成后系统恢复正常

image.png

3.2  原因分析

操作系统文件系统损坏


四、问题解决

4.1 解决办法

操作系统自动修复文件系统或者手动修复。

4.2 分析总结

操作系统使用过程中文件系统可能会损坏并且它的某些部分可能无法访问,如果文件系统出现系统无法启动,系统上的文件损坏(通常可能会看到输入/输出错误)可参考如下方法修复:

1.修改/etc/fstab,将受损的文件系统先注释掉,如果无法读写该文件则采用mount -o remount rw , / 将文件系统改成读写模式。

2.针对受损的文件系统,执行fsck命令,如:fsck /dev/sda1等。