服务器 2024-06-25

KunTai R2260 服务器光模块告警

一、现网描述

1.1 环境描述

设备型号:8台R2660服务器

硬件配置:每台服务器安装2张SP382网卡


二、故障描述

2.1故障现象

现场一共8台服务器,每台服务器安装两张SP382网卡, 两张网卡分别使用一个光口连接到网络中,此时空闲状下的光模块在iBMC系统显示异常告警

image.png


三、问题分析

3.1 排查思路

1.sel显示光模块Abnormal Rx or Tx powers of optical module were detected告警,告警代码:0x29000017

image.png

2.Ibma服务已开启image.png

3.关键过程

告警信息是iBMA从光模块内部读取的,有光模块但是没有光纤它内部就会有RX功率低的告警; iBMA确实检测到该异常;和接口人对齐客户服务器环境确实是有光模块但是没有插网线;另外iBMC的用户指南对该告警也有说明

image.png

3.2 原因分析

iBMA是从光模块内部读取的,有光模块但是没有光纤它内部就会有RX功率低的告警;iBMA确实检测到该异常。


四、问题解决

4.1 解决办法

硬件层面

拔掉空闲的光模块或者在空闲光模块上插入光纤线

软件层面

Down掉空闲的网口或者关闭iBMA功率信息收集功能(ibmc将无法获取系统层面硬件功率使用信息)

禁用iBMA功率信息收集方法如下:

1)cd /opt/huawei/ibma/config

2)vi Monitor.ini

3)找到NIC下的Sff_Dynamic

4)将disableResource改为true

5)更改后重启iBMA服务: