JavaScript is required to for searching.
跳过导航链接
退出打印视图
Oracle Solaris Studio 12.3:性能分析器     Oracle Solaris Studio 12.3 Information Library (简体中文)
search filter icon
search icon

文档信息

前言

1.  性能分析器概述

2.  性能数据

3.  收集性能数据

编译和链接程序

源代码信息

静态链接

共享对象处理

编译时优化

编译 Java 程序

为数据收集和分析准备程序

使用动态分配的内存

使用系统库

使用信号处理程序

使用 setuidsetgid

数据收集的程序控制

C 和 C++ 接口

Fortran 接口

Java 接口

C、C++、Fortran 和 Java API 函数

动态函数和模块

collector_func_load()

collector_func_unload()

数据收集的限制

基于时钟的分析的限制

时钟分析中的运行时失真和扩大

收集跟踪数据的限制

跟踪过程中的运行时失真和扩大

硬件计数器溢出分析的限制

硬件计数器溢出分析中的运行时失真和扩大

后续进程中数据收集的限制

OpenMP 分析的限制

Java 分析的限制

用 Java 编程语言所编写的应用程序的运行时性能失真和扩大

数据的存储位置

实验名称

实验组

子孙进程的实验

MPI 程序的实验

内核和用户进程上的实验

移动实验

估计存储要求

收集数据

使用 collect 命令收集数据

数据收集选项

-p option

-h counter_definition_1...[, counter_definition_n]

-s option

-H option

-M option

-m option

-S option

-c option

-I directory

-N library_name

-r option

实验控制选项

-F option

-j option

-J java_argument

-l signal

-t duration

-x

-y signal [ ,r]

输出选项

-o experiment_name

-d directory-name

-g group-name

-A option

-L size

-O file

其他选项

-P process_id

-C comment

-n

-R

-V

-v

使用 collect 实用程序从正在运行的进程中收集数据

使用 collect 实用程序从正在运行的进程中收集数据

使用 dbx collector 子命令收集数据

dbx 运行收集器:

数据收集子命令

profile option

hwprofile option

synctrace option

heaptrace option

tha option

sample option

dbxsample { on | off }

实验控制子命令

disable

enable

pause

resume

sample record name

输出子命令

archive mode

limit value

store option

信息子命令

show

status

在 Oracle Solaris 平台上使用 dbx 从正在运行的进程中收集数据

从不受 dbx 控制的正在运行的进程中收集数据

从正在运行的程序中收集跟踪数据

从 MPI 程序收集数据

对 MPI 运行 collect 命令

存储 MPI 实验

从脚本收集数据

collectppgsz 一起使用

4.  性能分析器工具

5.  er_print 命令行性能分析工具

6.  了解性能分析器及其数据

7.  了解带注释的源代码和反汇编数据

8.  操作实验

9.  内核分析

索引

从 MPI 程序收集数据

该收集器可以从使用消息传递接口 (Message Passing Interface, MPI) 的多进程程序收集性能数据。

该收集器支持 Oracle Message Passing Toolkit 8(以前称为 Sun HPC ClusterTools 8)及其更新。该收集器可以识别其他版本的 MPI;当您运行不带其他参数的 collect -h 时,将显示有效的 MPI 版本列表。

http://www.oracle.com/us/products/tools/message-passing-toolkit-070499.html 上可以找到 Oracle Message Passing Toolkit MPI 软件,它用于安装 Oracle Solaris 10 和 Linux 系统。

Oracle Message Passing Toolkit 已集成在 Oracle Solaris 11 发行版中。如果系统中安装了此工具包,您可以在 /usr/openmpi 中找到它。如果您的 Oracle Solaris 11 系统中尚未安装此工具包,当为系统配置了软件包系统信息库时,可以使用命令 pkg search openmpi 搜索该软件包。有关在 Oracle Solaris 11 中安装软件的更多信息,请参见《Adding and Updating Oracle Solaris 11 Software Packages》(添加并更新 Oracle Solaris 11 软件包)。

有关 MPI 和 MPI 标准的信息,请参见 MPI Web 站点 http://www.mcs.anl.gov/mpi/。有关 Open MPI 的更多信息,请参见 Web 站点 http://www.open-mpi.org/

要从 MPI 作业收集数据,必须使用 collect 命令;dbx collector 子命令不能用于启动 MPI 数据收集。对 MPI 运行 collect 命令中提供了详细信息。

对 MPI 运行 collect 命令

collect 命令可用于跟踪和分析 MPI 应用程序。

要收集数据,请使用以下语法:

collect [collect-arguments] mpirun [mpirun-arguments] -- program-name [program-arguments]

例如,以下命令对 16 个 MPI 进程的每个进程运行 MPI 跟踪和分析,在单个 MPI 实验中存储数据:

collect -M OMPT mpirun -np 16 -- a.out 3 5

-M OMPT 选项指明将进行 MPI 分析,Oracle Message Passing Toolkit 为 MPI 版本。

初始收集进程重设 mpirun 命令的格式来指定对各个 MPI 进程运行 collect 命令(带有适当的参数)。

紧接在 program_name 前面的 -- 参数是 MPI 分析所必需的。如果不包括 -- 参数,collect 命令将显示一条错误消息且不会收集实验。


注 - 不再支持使用 mpirun 命令在 MPI 进程上产生显式 collect 命令的技术来收集 MPI 跟踪数据。您仍可以使用这种技术来收集其他类型的数据。


存储 MPI 实验

由于多进程环境比较复杂,因此从 MPI 程序收集性能数据时应当注意一些有关存储 MPI 实验的问题。这些问题涉及到数据收集和存储的效率以及实验的命名。有关命名实验(包括 MPI 实验)的信息,请参见数据的存储位置

用来收集性能数据的每个 MPI 进程都创建其自己的子实验。当 MPI 进程创建实验时,将锁定实验目录;所有其他 MPI 进程必须一直等待,直到解除锁定,这些进程才可以使用该目录。将试验存储在所有 MPI 进程可以访问的文件系统上。

如果未指定实验名称,则使用缺省的实验名称。在实验中,收集器将为每个 MPI 等级创建一个子实验。收集器使用 MPI 等级以格式 M_rm.er 构造子实验名称,其中 m 是 MPI 等级。

如果打算在实验完成后将其移动到其他位置,则使用 collect 命令指定 -A copy 选项。要复制或移动实验,请勿使用 UNIX cpmv 命令;而是使用 er_cper_mv 命令,如第 8 章中所述。

MPI 跟踪在每个节点的 /tmp/a.*.z 中创建临时文件。MPI_finalize() 函数调用期间将删除这些文件。确保文件系统有足够的空间用于实验。对长时间运行的 MPI 应用程序收集数据之前,执行短期试运行以确认文件大小。有关如何估计所需空间的信息,另请参见估计存储要求

MPI 分析以开源 VampirTrace 5.5.3 版为基础。它可识别多个受支持的 VampirTrace 环境变量以及新的环境变量 VT_STACKS,该环境变量控制调用堆栈是否记录在数据中。有关这些变量的含义的详细信息,请参见 VampirTrace 5.5.3 文档。

环境变量 VT_BUFFER_SIZE 的缺省值将 MPI API 跟踪收集器的内部缓冲区限制为 64 MB。某一 MPI 进程达到限制的大小时,缓冲区将刷新到磁盘,前提是尚未达到 VT_MAX_FLUSHES 限制。缺省情况下,将 VT_MAX_FLUSHES 设置为 0。该设置将导致 MPI API 跟踪收集器在缓冲区已满时刷新磁盘的缓冲区。如果将 VT_MAX_FLUSHES 设置为正数,就是对允许刷新的次数进行了限制。如果缓冲区已满且无法刷新,不再将该进程的事件写入跟踪文件。结果是试验可能不完整,在某些情况下,实验可能不可读。

要更改缓冲区大小,请使用环境变量 VT_BUFFER_SIZE。该变量的最佳值取决于要跟踪的应用程序。设置较小的值将增加应用程序可以使用的内存,但是将触发 MPI API 跟踪收集器频繁进行缓冲区刷新。这些缓冲区刷新可能会显著改变应用程序的行为。另一方面,设置较大的值(如 2 GB)将可以使 MPI API 跟踪收集器刷新缓冲区的次数降至最低,但是将减少应用程序可以使用的内存。如果没有足够的内存可用来容纳缓冲区和应用程序数据,可能会造成应用程序的某些部分交换至磁盘,这也会导致应用程序的行为发生显著改变。

另一个重要的变量是 VT_VERBOSE,该变量可记录各种错误和状态消息。如果出现问题,请将此变量设置为 2 或更大的值。

通常,当 mpirun 目标存在时,MPI 跟踪输出数据是后处理的;将处理的数据文件写入实验,而将关于后处理时间的信息写入实验标题。如果利用 -m off 显式禁用 MPI 跟踪,就不执行 MPI 后处理。后处理失败时,报告错误,且任何 MPI 标签或 MPI 跟踪度量都不可用。

即使 mpirun 目标没有实际调用 MPI,仍然会记录实验,但不会生成任何 MPI 跟踪数据。该实验报告 MPI 后处理错误,任何 MPI 标签或 MPI 跟踪度量都将不可用。

如果将环境变量 VT_UNIFY 设置为 0collect 不会运行后处理例程。首次在实验上调用 er_printanalyzer 时,将运行这些后处理例程。


注 - 除非您能够访问源文件或者拥有具备相同时间戳的副本,否则在计算机或节点间复制或移动实验时不能在带注释的反汇编代码中查看带注释的源代码或源代码行。可以在当前目录中放置指向原始源文件的符号链接,以便查看带注释的源代码。也可以使用“设置数据显示”对话框中的设置:通过“搜索路径”标签(请参见`Search Path`(搜索路径)标签),您可以管理要用来搜索源文件的目录列表;通过“路径映射”标签(请参见`Pathmaps`(路径映射)标签),您可以将文件路径的前面部分从一个位置映射到另一个位置。