Linux的内存管理有一套机制:当系统内存溢出的时候,它会选择一个/几个适当的进程杀掉以维持系统的稳定运行。不过机器毕竟是机器,虽然它竭尽全力去选择那些真正是罪魁祸首的进程,但是难免会出错,或者是不公平,到头来系统还是因为误杀而变得残缺不全,甚至不能这场运行。这个时候可能就需要:人为地干预、引导系统做出正确的选择。
这种行为的控制是通过调整进程相应目录下的/proc/[PID]/oom_adj来实现的,其中oom_adj的取值返回是-17~15,当进程的oom_adj是-17时,系统将不会杀死它,-16到15使得进程的/proc/[PID]/oom_score值呈指数(K * 2 ^ n)形式递增,也就是说他们被杀的可能性呈指数形式递增。另外,开天辟地的第一个进程(进程号为1)init也不在被杀之列,无论它的oom_adj值为多少。原来只有系统资源管理权限(CAP_SYS_RESOURCE)的进程才能做oom_adj值的调整,现在如果是把进程的被杀可能性提高则不需要什么特殊权限,我们也确实不应剥夺它自杀或者是它的拥有者有意把它推上悬崖的权利。
禁止进程被杀的具体操作为:
root@gentux xiaosuo # pgrep dbus-daemon 4595 6664 root@gentux xiaosuo # cat /proc/4595/oom_score 559 root@gentux xiaosuo # echo -17 > /proc/4595/oom_adj root@gentux xiaosuo # cat /proc/4595/oom_score 0 |
注意:这个技巧是比较危险的,除非你能100%肯定你禁止被杀的进程没有问题,不然不要尝试做愚蠢的设定,否则后果自负。