此功能是 Solaris Express 6/04 发行版中的新增功能。Solaris Express 10/04 发行版和 Solaris 10 3/05 发行版提供了重要的增强功能。
Sun Microsystems 开发了一种新的体系结构,用于构建和部署具有预测性自我修复能力的系统和服务。通过自我修复技术,Sun 系统和服务可在出现软硬件故障时得到最大限度的利用。此外,自我修复技术还可使系统管理员和服务提供商的端对端体验更加简便快捷,从而降低成本。应用此创新技术的第一组主要的新增功能在 Solaris 10 OS 中提供。Solaris 10 软件包括便于 CPU、内存、I/O bus nexus 组件和系统服务进行自我修复的组件。
有关这一新体系结构的组件的特定信息,请参阅下文对 Solaris Service Manager 和 Solaris Fault Manager 的介绍。
Solaris Service Manager 是在 Solaris Express 10/04 发行版中引入的,并在 Solaris 10 3/05 发行版中得到了增强,它提供了在传统 UNIX 启动脚本、初始运行级别以及配置文件的基础上进行扩充的基础结构。此基础结构提供下列功能:
自动按照相关性顺序重新启动失败的服务(无论服务失败的原因是管理员操作错误、软件错误还是无法纠正的硬件错误)。
可以使用新的 svcs 命令创建可查看的服务对象,用 svcadm 和 svccfg 命令创建可管理的服务对象。对于 SMF 服务和原有的 init.d 脚本,还可使用 svcs -p 来查看服务与进程之间的关系。
通过自动捕获服务配置的快照来简化对服务的备份、恢复及撤消更改操作。
简化调试过程。使用 svcs -x,可以提出与服务有关的问题,然后查看系统返回的说明来了解服务不运行的原因。此外,由于每个服务都有单独的持久性日志文件,因此该过程进一步得到了简化。
管理员能够安全地将任务委托给非超级用户,其中包括在系统中修改属性以及启动、停止或重新启动服务等任务。
依据服务的相关性并行启动服务,从而提高大型系统的引导速度。关机时过程相反。
可以对引导控制台输出进行自定义,尽可能采用静默方式(缺省设置);或使用 boot -m verbose 将其自定义为详细模式。
尽可能兼容现有的管理习惯。例如,多数客户和 ISV(独立软件开发商)提供的 rc 脚本仍可像往常一样工作。
允许您使用两种模式中的一种来配置系统服务,这两种模式都以 smf(5) 配置文件表示。"generic_open.xml" 配置文件启用了所有的传统 Internet 服务,这些服务都是以前在缺省情况下在 Solaris OS 中启用的。"generic_limited_net.xml" 配置文件禁用了大量的服务,这些服务在强化系统期间时常被禁用。但是,此配置文件并不是 Solaris 安全工具包 (JASS) 工具的替代品。有关详细信息,请参见单独的配置文件。
有关此基础结构的更多信息,请参见《系统管理指南:基本管理》中的第 9 章,“管理服务(概述)”。smf(5) 手册页对此基础结构进行了概要介绍。
预测性自我修复系统有一个简化的管理模型。传统的错误消息被软件组件所使用的遥测事件所取代。软件组件会自动诊断导致故障或缺陷的根本原因,并启动自我修复活动。例如,向管理员传递消息,隔离或取消激活故障组件,以及指导管理员执行修复活动。有一个新的软件组件称为 Fault Manager,fmd(1M)。Fault Manager 用于管理遥测事件、日志文件和组件。Solaris 10 OS 还提供了用来与 Fault Manager 及新日志文件进行交互的新工具,其中包括 fmadm(1M)、fmdump(1M) 和 fmstat(1M)。
Fault Manager 会在适当的情况下向 syslogd(1M) 服务发送消息,通知管理员已检测到故障。消息可指示管理员查阅 Sun 的新消息 Web 站点 http://www.sun.com/msg/ 中的知识文章,了解有关故障影响的详细信息以及适当的应对和修复措施。
Solaris Express 6/04 发行版引入了自我修复组件,用于实现 UltraSPARC-III 和 UltraSPARC-IV CPU 以及内存系统的自动诊断和恢复。此发行版还提高了基于 PCI 的 I/O 的灵活性,并提供了针对此类 I/O 的遥测。