服务器 2022-04-20

KunTai R522系统内网卡序号混乱问题分析总结

一、 现网描述

1.1 环境描述

设备型号:Kuntai R522   

网卡布局:

image.png 

 

 

 二、故障描述

2.1 故障现象

问题现象:Slot6网卡双网口绑定做bond 1 ,启用后网络不通,检查cat /proc/net/bonding/bond1主备网口均显示down的状态image.png 

 

三、 问题分析

3.1 排查思路

关键过程:

1.检查bond配置信息image.png 

2.Service network restart重启网络服务,检查故障仍在。

3.Ifcofnig –a 检查网口状态, 发现eth4,eth5,eth6,eth7端口未见。

4.检查IBMC管理界面,网卡状态,收集网卡信息。 如下图image.png 

3.2 原因分析

检查硬件报错信息,定位故障为网卡光模块收发功率不正常,光模块需要更换

image.png 

image.png 


四、 问题解决

4.1 解决办法

回到操作系统界面,执行ifconfig –a ,将回显的网卡端口信息与BMC界面记录网卡信息做匹配。

执行ethtool –p ethx ,将网卡端口名与网卡物理位置做定位匹配,并记录好对应信息。

修改/etc/udev/rules.d/50-persistent-net.rules配置文件,更改网卡名称顺序号image.png 

当前系统在部署业务时,无法执行重启使配置文件生效。更改网卡端口配置文件,临时使用现有网卡名称做bond配置。待后续方便重启后再改回网卡配置信息。

Service network restart 重启网络, 检查cat /proc/net/bonding/bond1配置状态,显示主端口为UP状态,问题解决。

4.2 分析总结

网卡光模块功率异常导致网卡运行不稳定,由此导致系统重启过程网卡序号混乱。解决方法是修改网卡系统内序号,并更换网卡光模块。