请教章博士,LVS Loadbalance服务器的ksoftirqd/0进程占用100% CPU的问题

kernel版本是2.6.9,DR模式,使用了keepalived,现在偶尔会出现ksoftirqd/0进程占用100% CPU的情况,这时候转发请求变得非常非常慢,基本无法正常工作。reboot之后可以恢复正常。请教一下这个问题是怎么产生的呢?不知道有没有好的解决方法。非常感谢。

Forums:

我们也遇到这个问题,章博士解释一下吧

这个原因不容易分析。我想解决问题的主要方法是:

1. 升级到最新的2.6内核看看,内核编译得越小巧越好,不用的模块不要加载。

2. 看报文的转发速度是否在每秒30万报文左右了。如果是的,再硬件的配置,可以考虑用66MHz、64bit的网卡。

采用64bit系统吧,硬件配置好一点的,分网卡,分CPU,提供服务,内外网提供的数据最好分开。有必要可以采用双主模式。
系统尽量精简安装,内核加载模块尽量少等。防火墙可能影响性能。

QQ 49000448
blog http://blog.etiantian.org
勤勤恳恳做人,踏踏实实做事!

使用关键字“lvs ksoftirqd/0 100% cpu”google了一下,有个文章说网络风暴或包循环转发会造成这种问题,引文受机器cpu和网卡物理速度的限制一个系统的包转发能力是有极限的,而风暴或循环最容易到达这种极限。

http://marc.info/?l=keepalived-devel&m=114040573028656&w=2

This is both street smart and inietltgenl.

Thanky Thanky for all this good inmtrfaoion! http://udteer.com [url=http://kiawpum.com]kiawpum[/url] [link=http://ohzhpjphtzx.com]ohzhpjphtzx[/link]

randomness