主题数据提取

数据经理和统计人员可以提取累积的主题数据,以进行给定研究的数据分析或监管报告。

“科目数据提取”提供按表单组织的赞助者表格数据,用于下游临床编程,包括生成研究结果和监管报告。

注:

Oracle Clinical One Platform 中,SAS 传输文件格式当前正在版本 8 上运行,因此请确保使用版本 9.3 或更高版本的 SAS 客户机。有关更多详细信息,请参阅 SAS 文档平台 脚注 1

模式

适用于所有 3 种模式:测试、培训和生产。

可提取数据的角色

具有运行受试者数据提取权限的用户可以生成此报告,并且只能查看他们有权查看的数据。

注:

根据您的权限,“科目数据提取”可能包括解盲数据。

受试者数据提取可以包含盲法或非盲法数据,具体取决于您在研究中的权限。只有在已对隐藏数据进行数据分类并且用户角色包括相应的数据分类权限时,才能访问隐藏数据。用户可能有权访问某些隐藏的数据分类信息,但不一定可以访问所有信息。

输出详细信息

下面是有关如何将数据显示在“科目数据提取”中的详细信息列表:
  • 生成主题数据提取时,可以在以下四种主要输出格式之间进行选择:sas7bdatXPORTCPORTCSV 。为了简单起见,在本文档中,术语 SAS 格式统称为 sas7bdat、XPORT 和 CPORT。术语 CSV 格式是指 CSV 文件。
  • 如果没有为表单输入主题数据,则表单数据集仅包括标题行;文件的其余部分为空。
  • 不包括已清除表单的记录。这也适用于已删除的重复表单。

    同样,如果从动态表单的父问题(导致动态表单被隐藏)中清除数据,则提取中不会包含该表单的记录。

  • 当问题使用代码列表作为其选项时,提取将包括选项的值、标签和代码。
  • 当以 SAS 格式生成受试者数据提取时,将显示不带前导零的数字值。

    例如,如果站点用户收集的值为 "0001.12345",则以 SAS 格式提取的数据会将该值显示为 "1.12345"。

  • 确保定义 SAS 属性。这些必填字段默认为“问题参考代码”和“标签”,但研究设计者可以根据需要进行更新。主题数据提取将使用为 SAS 属性设置的值。
  • 在两部分表单中,“表前问题”部分中的问题与表中的问题组合在一起,为您提供要分析的单个统一数据记录。
  • 对于实验室表单,样品收集日期和禁食问题也会由于同样的原因与结果合并。
  • 如果试验机构用户未回答问题或对其应用数据标志,则提取中的相应字段将填充特定于每个数据标志的代码。有关在与每个问题(QUESTIONLABEL、QUESTIONLABEL_R、QUESTIONLABEL_F 和 QUESTIONLABEL_D)对应的四列中如何映射数据标志的更多详细信息,请参见 form-item-output-mapping-subject-data-extract.html#GUID-37036FC3-983B-4C8F-81CC-C5CE5F53EE07
    可以显示以下代码:
    • 不适用 (NA):C48660
    • 未完成 (ND):C49484
    • 未知 (UNK):C17998
    • 未回答:-99999

      注:

      该报告排除所有问题都标记为未回答的表单。
  • 生成“受试者数据提取报表”时,将包括一个名为 FORMASSOCIATION 的数据集,该数据集提供有关研究中存在的所有表单关联的详细信息。

    注:

    科目数据提取包括研究设计中定义的所有链接和显示表单规则的表单关联数据。
  • 科目数据提取为每个表单包括一条记录;每条记录都是生成提取时该表单数据的快照。

设置

筛选器 说明
文件名 为数据提取选择适当的命名惯例。这些命名惯例仅适用于以 CSV 格式提取的数据:
  • < 表单名称 >
  • < 研究名称 >_ 表单名称 >_< 时间戳 >
  • < 研究名称 >_< 表单名称 >
  • < 表单名称 >_< 时间戳 >
试验机构 选择您分配到的一个或多个站点。此下拉列表包括处于所有状态的站点:新建、活动、已停用。
文件类型 选择报告的输出类型:

提示:对于监管提交,请使用 XPORT 。有关 SAS 中的分析,请使用 sas7bdat 。要获得一般视图和灵活性,请使用 CSV

CSV :您需要一种易于使用的格式来查看、共享或分析各种程序(包括 Excel 等电子表格和各种数据分析工具)中的数据。

如果您选择 CSV 格式,则对于研究中设计的每个表单,您将收到单独的 CSV 文件。表单中的每个问题或项目都有四个对应的列,如下面的“字段说明”部分所述。

传输 (XPORT) :如果您需要提交数据以供监管(例如 FDA 提交)或需要最广泛兼容的 SAS 格式。

如果以 SAS 格式(CPORT、传输 (XPORT) 或 sas7bdat)生成输出,则将包括每个表单的各个数据集,每个数据集都具有 SAS 标签和变量名称。

CPORT (如果要归档数据或在 SAS 环境之间高效传输数据)。这种 SAS 专用格式对于 SAS 中的备份和迁移任务特别有用。

:CPORT 专为 SAS 软件而设计,可在 SAS 环境中提供灵活性。

sas7bdat ,如果您希望在 Excel 或其他程序中轻松打开官方 SAS 格式,或者您只是想快速查看数据。

:使用 sas7bdat 时,数据集在 ZIP 文件中提供。在 ZIP 中,每种表单都具有自己的本地 SAS 格式 (.sas7bdat) 数据集,whichD 包括每个数据元素的所有变量名称和标签。

字段说明

关键字列 SAS 标签 说明
租户 ID 租户标识符 指明组织标识符。
研究 ID 研究标识符 研究经理创建研究时指定的研究 ID。
国家/地区 调查人地点所在国家(地区) 站点经理在 Oracle Clinical One Platform 中创建站点时指定的站点所在国家/地区。
站点 ID 地点标识 指明收集数据时的站点 ID。
INVID 调查人标识符(DEA 编号) 站点管理员在 Oracle Clinical One Platform 中创建站点时指定的主体调查员 ID。
INVNAM 调查人名字和姓氏 站点管理员在 Oracle Clinical One Platform 中创建站点时指定的主体调查员名称。
USUBJID 唯一主题 ID (GUID) 涉及产品的所有申请或提交的所有研究中的唯一主题 ID。
SCRNID 筛选编号

筛选或注册后分配给受试者的编号。

:这与 SUBJID 列匹配,除非您要将受试者编号替换为随机化编号

子标识 主体标识符(主题编号) 指明研究内的唯一受试者编号。
访问编号 访问标识符 指明研究设计者指定的访视 ID。

对于完成或退学操作,如果研究设计不包括完成或退学事件,则此字段为空。

访问 访视标题 指明研究设计者指定的访视或事件标题。
未匹配 未计划/周期访问例程编号 指明周期访问的未计划访视实例编号或周期编号。
SVSTDTC 访问起始日期(访问起始日期/时间) 指明访视的开始日期,以 ISO 8601 字符格式表示。

对于完成或退学操作,如果研究设计不包括完成或退学事件,则此字段为空。

表单参考代码(源表单) 指明表单的参考代码,作为研究设计者定义的参考代码。
标签 实验室 ID 实验室 ID。

:对于 VISIT_SYS 数据集,此字段为空,因为访视级别和表单或部分字段不适用。

NAM 实验室名称 实验室名称。

:对于 VISIT_SYS 数据集,此字段为空,因为访视级别和表单或部分字段不适用。

重复编号 重复表单中的行号。
对于不同类型的表单,此列通过以下方式显示数据:
  • 对于一节(平面)表单,不会填充这些字段。
  • 对于重复表单,此列填充了研究中使用的重复表单实例数。
  • 对于实验室表单和两部分表单,此列将填充每个实验室表单的实例编号。

:对于 VISIT_SYS 数据集,此字段为空,因为访视级别和表单或部分字段不适用。

重复 ID 重复部分唯一标识符

这是分配给两部分表单的“表”部分中的“问题”的唯一编号,包括实验室表单。

重复号码 重复部分中的行号

这是行的唯一编号(无论位于实验室表单还是两部分表单中)。此数字对于主题的每个区段(在双区段表单中)、表单和事件都是唯一的。

输入者 最初在表单中输入数据的用户。 指明最初将数据输入表单或回答问题的用户的用户名。
输入日期 用户在表单中输入数据的日期。日期为 UTC 时区。 用户在表单中输入数据或回答问题(以 ISO 8601 字符格式表示)的 UTC 时间和日期。
最后更改者 修改任何表单项的最新用户或系统用户。 指明已修改表单上任何问题的最新用户的用户名。查询不作为表单更新考虑在内。
上次更改日期 修改的任何表单项的最近日期。日期为 UTC 时区。 上次修改问题的 UTC 时间和日期,用 ISO 8601 字符格式表示。
符号、验证、冻结、锁定或未答复的标志等表单操作不被视为最后一次更新。
  • 删除表单(如重复表单、两部分表单或重复部分行)将显示在此字段中。

  • 只有在动态表单上清除数据才会影响日期;在不更改数据的情况下发布或隐藏数据不会影响日期。

  • 对于完成或退学操作,如果研究设计不包括完成或退学事件,则此字段为空。

参考代码

注:每个问题都使用表单设计中指定的问题参考代码显示在提取中。例如,如果问题的引用代码为 AGE ,则“ITEM(商品)”列将输出为 AGE。

问题标签的答案。 指明站点用户输入的问题的答案。

表单问题以四个不同的列表示:原始 (ITEM_R)、格式化 (ITEM_F)、解码 (ITEM_D) 和项本身 (ITEM)。有关特定数据类型的映射的更多详细信息,请参见 form-item-output-mapping-subject-data-extract.html#GUID-37036FC3-983B-4C8F-81CC-C5CE5F53EE07

REFCODE_R

注:每个问题都使用表单设计中指定的问题参考代码显示在提取中。例如,如果问题的引用代码为 AGE ,则 ITEM_R 列将输出为 AGE_R。

问题标签的原始值。 指明原始值:在 Oracle Clinical One Platform 中输入的字母数字值,不进行转换。这包括数据输入标志。

表单问题以四个不同的列表示:原始 (ITEM_R)、格式化 (ITEM_F)、解码 (ITEM_D) 和项本身 (ITEM)。有关特定数据类型的映射的更多详细信息,请参见 form-item-output-mapping-subject-data-extract.html#GUID-37036FC3-983B-4C8F-81CC-C5CE5F53EE07

REFCODE_F

注:每个问题都使用表单设计中指定的问题参考代码显示在提取中。例如,如果问题的引用代码为 AGE ,则 ITEM_F 列将输出为 AGE_F。

问题标签的数据类型。 指明格式化值:在 Oracle Clinical One Platform 中输入的值,根据表单设计转换为问题数据类型。

表单问题以四个不同的列表示:原始 (ITEM_R)、格式化 (ITEM_F)、解码 (ITEM_D) 和项本身 (ITEM)。有关特定数据类型的映射的更多详细信息,请参见 form-item-output-mapping-subject-data-extract.html#GUID-37036FC3-983B-4C8F-81CC-C5CE5F53EE07

REFCODE_D

注:每个问题都使用表单设计中指定的问题参考代码显示在提取中。例如,如果问题的引用代码为 AGE ,则 ITEM_D 列将输出为 AGE_D。

答案的问题标签的数据类型。 指示解码的原始值,并根据数据类型进行其他注意事项。如果问题具有代码值,则会在此字段中填充该值。

表单问题以四个不同的列表示:原始 (ITEM_R)、格式化 (ITEM_F)、解码 (ITEM_D) 和项本身 (ITEM)。有关特定数据类型的映射的更多详细信息,请参见 form-item-output-mapping-subject-data-extract.html#GUID-37036FC3-983B-4C8F-81CC-C5CE5F53EE07

DeletedQn 已删除的问题

如果在以前版本的研究中删除了某个表单项,但已收集该表单项的数据,则此数据将显示在此列下。

:已删除表单项的 SAS 标签使用已删除表单的 GUID 显示为 D<GUID>。

VISSTAT 访视状态

指明研究中记录的访视或事件的当前进度或完成状态。可以为以下值之一:

:此字段仅存在于 VISIT_SYS 数据集中。

  • 正在处理
  • 未完成
  • INCOMPLETE_ERROR
  • 完成
  • COMPLETE_ERROR
  • 未开始

对于筛选、屏幕失败、完成或撤消操作,此字段为空。

有关访视状态的更多信息,请参阅访视状态和图标说明

SKIPYN 已跳过访视

指明研究协调员记录的未进行或未参加的访视或事件。

:此字段仅存在于 VISIT_SYS 数据集中。

  • 跳过访视的 Y
  • N 表示未跳过的访视

    对于筛选、屏幕失败、完成或撤消操作,此字段为空。

DSDECOD 处理期限

这表示为主题发生的事件。可以为以下值之一:

注:此字段仅存在于 VISIT_SYS 数据集中。

  • 已筛选:指示成功筛选受试者的事件。

    如果受试者未通过初始筛选,您可能会看到多个事件实例,例如“屏幕故障”和“屏幕故障”。

  • 屏幕故障:指示受试者筛查失败的事件。

    如果事件被撤消,它将不再包含在输出中。

  • 随机化:指明受试者在研究中随机化的事件。
  • 已完成:指明受试者完成研究的事件。

    如果事件被撤消,它将不再包含在输出中。

  • 撤消:指明撤消受试者的事件。

    如果事件被撤消,它将不再包含在输出中。

如果未发生事件,则此字段为空。

有关主题状态的更多信息,请参阅可用主题状态

目的地日期 处置日期

指明事件发生的日期。

日期是 UTC 时区,格式为 YYYY-MM-DD。

:此字段仅存在于 VISIT_SYS 数据集中。

  • 对于 ScreenedRandomizationCompletedWithdrawalScreen Failure 事件,日期显示 Oracle Clinical One Platform 中事件发生的时间。
  • 对于屏幕故障退学完成事件,日期反映站点用户输入的日期。

如果未发生事件,则此字段为空。

原因 原因

指定为用户输入的操作或结果(例如跳过访视)提供的说明或理由。

:此字段仅存在于 VISIT_SYS 数据集中。

对于筛选、屏幕失败、完成或撤消操作,此字段为空。

源表单 ID 来源表单 ID 指明来源表单的 ID,即包含启动表单关联的问题的表单。

此字段仅存在于表单关联数据集中。

来源项目标识 来源项目标识 指明来源项目 ID。源项是启动表单关联的问题/项。

:此字段仅存在于表单关联数据集中。

RVISITNUM 相关访问标识符 指明访问 ID,该访问包含与来源表单相关/链接的表单。

:此字段仅存在于表单关联数据集中。

RVISIT 相关访问标题 指明访问的名称,该访问包含与来源表单相关/链接的表单。

:此字段仅存在于表单关联数据集中。

RVISITINST 相关未计划/周期实例 指明包含来源表单相关/链接的表单的未计划访视或周期访视的实例编号。

:此字段仅存在于表单关联数据集中。

RSVSTDTC 相关访问开始日期 指明访视的开始日期,该访视包含与来源表单相关/链接的表单。

:此字段仅存在于表单关联数据集中。

RDOMAIN 相关表单参考代码 指明与来源表单相关/链接的表单的名称。

:此字段仅存在于表单关联数据集中。

RFORMID 相关表单标识 指明与来源表单相关/链接的表单的名称。

:此字段仅存在于表单关联数据集中。

重复编号 相关重复次数

指明与来源表单关联的重复表单实例的编号。

:此字段仅存在于表单关联数据集中。

重复 ID 相关重复部分唯一标识符 指示与来源表单关联的平面部分的实例编号。

:此字段仅存在于表单关联数据集中。

RSREPEATNUMBER 重复部分中的相关行号 指示与来源表单链接的部分的实例编号。

:此字段仅存在于表单关联数据集中。



标题

脚注 1:SAS 是 SAS 研究所在美国和其他国家的注册商标或商标。其他品牌和产品名称是各自公司的注册商标。