系统管理指南:高级管理

收集疑难解答数据

请回答以下问题,以帮助隔离系统问题。有关收集崩溃的系统的疑难解答数据的信息,请参见系统崩溃疑难解答核对表

表 14–1 确定系统崩溃数据

问题 

说明 

是否可以重现问题?

这一点很重要,因为在调试很难的问题时,可重现的测试案例是必不可少的。通过重现问题,服务提供商可以使用特殊设备构造内核,以触发、诊断和更正错误。 

是否使用了任何第三方驱动程序?

具有相同权限的多个驱动程序在内核所在的同一地址空间中运行,如果这些驱动程序存在错误,则会导致系统崩溃。 

系统在崩溃之前正在执行什么操作?

如果系统在执行异常的操作,例如运行新的负荷测试或遇到特别高的负荷,则可能导致系统崩溃。 

在系统崩溃之前,是否有任何异常的控制台消息?

有时,系统会在实际崩溃前显示故障信号,此信息通常很有用。 

是否向 /etc/system 文件中添加了任何调优参数?

有时,调优参数(如增大共享内存段,以使系统尝试分配比实际拥有内存更多的内存)会导致系统崩溃。 

问题是在最近开始的吗?

如果是这样,问题是否与对系统的更改同时出现?例如新的驱动程序、新软件、不同工作负荷、CPU 升级或内存升级。