LVS搭建Windows集群之后出现交换机ARP污染导致Director无法正常工作

简单介绍一下部署情况,一台LVS,应用keepalived,使用DR+RR轮询模式,后端真实机用的是3台windows服务器,全都是物理机,连在一个3层交换机下的同个VLAN。经过细致的排查,出现故障的时候,交换机上的ARP表中的VIP被指向了后端其中一台机器的MAC地址,而不是LVS的Director,导致LVS无法正常工作,流量都导向了其中一台后端机。
在关闭LVS的情况下去ping VIP,均无法让交换机上的ARP表的VIP指向后端机的MAC地址,并且也试图抓包过,均未发现后端机loopback网卡有响应ARP请求的情况出现。
这个问题在干净的测试环境中重现了若干次,但并不能稳定重现,所以现在已经没有思路了。希望大牛们帮忙提供新的思路。

已经参考LVS官方文档对windows网卡做了弱主机什么的配置了,平常都是能够正常工作的。
后端windows服务器做了bonding,网络中会出现同个IP不同MAC的情况,但没有Loopback网卡MAC地址的包。

Forums:

这个问题我也在很多地方找过,还没有人能解决!

randomness