| {{B}}表1 多个Master故障排查过程{{/B}} | ||
| 排查步骤 | 故障原因定位 | 解决方法 |
| ①检查VRRP 配置是否一致 |
VRRP要求组成备份组的多个路由器必须配置一致, 即要求虚拟IP地址、VRRP报文广播间隔时间、认证 方式和认证字的配置必须相同 |
在核心交换机接口配置模式下,使用有关命令查 看VRRP配置,并确认哪一端的配置是正确的,修 改另一端配置,使VRRP配置一致 |
| ②检查链路是 否互通 |
确认链路两端互连端口是否处于up状态;检查互连 端口的配置情况,如果是trunk或者hybrid端口,要确 定端口PVID是否一致,是否允许VRRP备份组所在 VLAN通过,端口是否配置802.1x等协议;检查端口 是否因STP、RRPP、Smart-link或者LACP等协议而阻 塞;使用相关命令查看端口是否存在大量错误的报文 |
如果是端口不允许VRRP备份组所在、VLAN通 过或者PVID问题,请更改相关配置;如果链路被 STP等协议Discarding,导致VRRP协议报文无法 正常传送,请修改端口STP优先级等配置,以保 证互连端口能够正常进行VRRP协议报文转发; 如果端口存在大量错误的报文,则需要检查链路, 如检查两端的光衰减是否在正常范围。如有故障, 请更换连接所用的光纤 |
| ③检查VRRP 报文收发是否正 常 |
打开VRRP调试开关,确定VRRP报文是否能够正 常收发。如果看不到VRRP报文调试信息,可以打开 IP报文调试信息进行查看 |
如果在确保端口互通性的前提下仍然看不到 VRRP的报文调试信息,很有可能是VRRP报文被 丢弃。如果CPU限速导致报文丢弃,可根据实际 组网需要适当减少配置的VRRP路由器数量或者 调整VRRP报文发送时间间隔 |
| ④检查CPU占 用率是否正常 |
通过相关命令查看VRRP协议报文互通的业务板和 主控板CPU占用率是否过高,以及查看端口流量以确 定网络中是否存在广播风暴。如果存在网络风暴,则 VRRP报文无法正常送给CPU处理,VRRP状态必然 出现异常 |
排除网络风暴问题之后,可以暂时关闭一些不重 要的业务,以降低CPU的利用率,再进一步观察 故障现象是否发生变化 |
| {{B}}表2 典型陷入条件及其说明{{/B}} | |
| 陷入条件 | 说明 |
| ①ColdStan | 发送实体重新初始化,代理的配置已改变,通常是由系统失效引起的 |
| ②WarmStart | 发送实体重新初始化,但代理的配置没有改变,这是正常的重新启动 |
| ③LinkDown | 链路失效通知,变量绑定表的第1项指明对应接口表的索引变量及其值 |
| ④LinkUp | 链路启动通知,变量绑定表的第1项指明对应接口表的索引变量及其值 |
| ⑤AuthenticationFailure | 发送实体收到一个没有通过认证的报文 |
| ⑥EgpNeighborLoss | 相邻的外部路由器失效或关机 |
| ⑦EnterpriseSpecific | 由设备制造商定义的陷入条件,在特殊陷入字段指明具体的陷入类型 |