北京物流信息联盟

标准化数据采集平台构建及在临床试验数据质量控制的应用

2022-06-18 14:49:29

来源:临床药理学 2016, 21(12):1384-1388 

收稿日期:2016-08-30

[摘要]规范、完整的试验数据是临床试验统计分析的先决条件,也是临床试验结果真实可信的有力保障。当前电子数据采集系统(EDC)以其能够优化试验设计、保障数据真实可靠、控制试验成本和风险等优势得到了国内临床试验数据管理行业的极大重视,但也存在数据采集规范化、标准化不足的问题。本文以基于ClinCapture二次开发的药物临床试验数据采集平台eClinicaXY为例,阐述了标准化数据采集平台的架构设计、遵循标准以及在临床试验数据质量管控方面的优势特点。

[关键词]临床试验;数据采集平台;标准化;数据 质量控制


临床试验数据管理的目的在于采用严格的质呈控制获取完整、可靠的临床研究数据,进而通过科学严谨的统计分析确定研究治疗的有效性与安全性。 当前我国临床试验数据的标准化管理尚处于发展阶段,数据与执行流程质昼管控不足与现如今整体临床研究统一规范化要求之间的矛盾还未能完全显现[l] ,使得试验数据解读及异常数据核查往往存在一定的延滞性和局部性,徒然增加数据清洗审核周期及试验结果的不确定性。

电子数据采集系统(electronic data capture , EDC)是包含事件计划和用户沟通方案在内的适用于临床试验数据采栠、传输和管理的软件平台。据统计,EDC可平均同步筛查81.3%的数据疑问,使整个试验成本降低60%以上[2-3]。自CFDA于2015年开展药物临床试验自查及2016年发布《临床试验的电子数据采集技术指导原则》以来,标准化数据采集平台可对临床试验关键数据节点进行协同、计划性追踪监控的作用愈加引起我国制药行业的重视。本研究以基于ClinCapture二次开发的药物临床试验数据采集平台eClinicaXY为例,阐述标准化数据采集平台在半开放数据采集环境中强化临床试验数据闭合质昼管控及异常筛查的架构设计和优势特点。

 

1  数据采集平台架构设计

eClinicaXY是依据GNU LGPL协议、基于开源电子数据采集系统ClinCapture二次编译开发的药物临床试验数据采集平台,在原有系统框架基础上融合了临床数据交换标准(Clinical Data Interchange Standard Consortium, CDISC)、电子通用技术文档(Electronic Common Technical Docu­ment,eCID)等临床试验标准化数据结构以及操作痕迹稍查等技术,并以SpagoBI作为数据报表、展示的辅助工具。

eClinicaXY构建为平台型软件运营模式(SaaS,软件即服务),采用不同临床试验项H共享标准数据结构但schema独立的模式,将不同试验项目分配到各单独运行实例上[4] ,以满足不同试验项目方案异构而所有试验数据均符合统一递交标准的要求。整体数据服务框架由交互呈现层、应用业务层、支撑环境层构成,采用基于B/S的MVC架构模式设计,以HITP/HITPS为传输协议,Oracle高可用数据库为数据存储解决方案。数据采栠平台采用JQuery+Ajax技术搭建数据实时交互系统,通过页面并行请求、异步响应、局部更新的方式在浏览器中对多中心整体试验进程实时追踪监测[5], 用户可通过web浏览器与经授权的后台数据库进行交互。平台分层结构图见图1。

交互呈现层:位于系统框架最上层,采用由HTML5、JSP等技术,用于接收和显示用户输入及自动化产生的外部数据,为用户提供交互式操作的web界面 ;

应用业务层:位于交互呈现层和支撑环境层之间,负责系统业务处理及逻辑功能实现,对业务功能单元封装并将各功能模块按临床试验执行耍求动态耦合为整体框架,具有数据传递、映射的作用,同时具备横向可扩展性[6];

支撑环境层:位于系统框架最底层,主要负责支撑数据平台稳定运行及数据库访问。

此外,由于XML(eXtensible Markup Lan­guage,可扩展标记语言)具有支持异构数据和语义的自解释性而被用于数据存储和传输[7],利用XML文档的特性将其与关 系型数据库结合起来,即可满足在不改变原有数据标准结构的基础上支待异构数据采集弹性扩展的要求。


2  所遵从的相关规定与行业标准

当前临床试验的设计与实施大多采用各公司自身惯用的方案和数据标准,使得各试验项目的执行标准、验证规则及业务数据规范都不尽相同,造成了数据采栠的不完整及相同意义数据表达的多样化[8]。eClinicaXY数据采栠平台以FDA推荐的标准数据结构和验证规则作为基础数据框架,同时融合国家药政部门相关规定及行业标准要求,确保整体临床试验数据的采集、递交和存储均以“标准化”、“统一化”的方式完成。


2.1 临床数据交换标准(CDISC)  

CDISC标准是由临床数据交换标准协会开发作为临床试验数据和元数据交换、提交以及存档的行业标准,也是eClinicaXY数据采集平台的基础数据结构标准,包含临床数据获取协调标准(CDASH)、研究数据制表模型 (SDTM)、分析数据模型(ADaM)等多个部分。CDISC规定了统一的临床试验数据框架及元数据[9] , 如AE代表不良事件域,其下包含AE­TERM(不良事件报告词)、AEBODSYS(身体系统或器官分类)、AESER(严重不良事件)、AEREL(因果关系)等固定数据字段,每个数据字段为一个七元组(变量名称、描述性的变量标签、数据类型、受控术语集或数据格式、变量来源、变量角色、注释)。目前CDISC已被FDA、EMEA等作为推荐标准。

 

2.2  ICH国际 医学用语词典(MedDRA)术语集

MedDRA术语栠是由ICH 开发用于医疗产品文档和安全监察的标准术语集,常用于药物临床试验不良事件的标准化编码,包含系统器官分类、高位组语、高位语、首选语、低位语5层结构[10]。eClinicaXY数据采栠平台以受控术语的方式将Me<lDRA 术语栠栠成到数据框架中,作为自发性不良反应及不良事件报告中疾病、诊断、症状、体征等的输入内置术语。


2.3  WHO 药物编码词典( WHO DDE)   

WHO DDE是由WHO制定的用于对临床试验中药品信息和药物安全数据进行编码、分析和报告的层级式药品编码系统。eClinicaXY 数据采集平台借鉴WHO DDE中对药物术语的命名编码,将其整合到数据库中作为受试者合并用药的参考术语。

此外,eClinicaXY数据采集平台的构建也遵从21 CFR Partll中关于电子记录和电子签名、FDA《临床试验中应用计算机系统的技术指导原则》中关于数据安全和痕迹稽查、CFDA《 临床试验的电子数据采栠技术指导原则》、《药物临床试验质蜇管理规范》(GCP)和HL7等国家及行业对电子化临床试验的规定和要求。

 

3  数据采集平台模块框架

伴随信息化技术的进步和物联网的发展,、智能终端辅助数据识别与处理的多层次网络化数据采集系统。在此基础上,、交互式网络应答(IVRS)、电子痕迹稽查、自定义报告牛成等功能[11]。eClinicaXY数据采集平台结合现阶段电子数据采栠主流趋势,主要包含以下功能模块:

 

3.1  研究项目/试验中心设宜模块

 (1)可严格设定试验类型、研究项目分期、方案核实/IRB通过日期、受试者特征等;(2)可通过JQuey语句设定受试者核查条件,系统将在每位受试者入组时自行复核是否符合入/排条件,避免误纳;(3)自定义是否允许动态质疑、SDV 查询、管理性编辑、CRF及文本评估等;(4)通过用户级别、用户类型、用户角色多层次设定访问权限,确保用户处于符合职能要求的工作域内。


3.2  受试者/研究事件分配模块

(1)基于Ran­domization.net第三方接口的受试者随机化,;(2)可在系统中预设试验于预、人口统计学、动态或自定义分组,受试者可根据试验方案按单一或多重分组权重接受不同的于预;(3) 根据符合CDSIC数据采集域的eCRF模版文件生成研究事件,将所有研究事件分解为计划、非计划和普通三类,各事件分别分配至对应随访时点形成整体试验流程。

 

3.3  数据采集与管理模块

该模块包含数据提交、数据监察和管理、数据提取三部分,可实现 (1)按方案执行时间流创建受试者数据条目列表,根据不同受试者所处的试验阶段分别执行时点对应操作;(2)栠成MedDRA、WHO DDE术语编码及可配堂的药品字典资源,在试验数据生成时即完成术语表述标准化;(3)以XML标准格式编辑数据核查规则,从数据质昼、逻辑合理性、时间序列准确性方面实现数据流实时核查;(4)集成源数据验证(SDV)、注释及质疑管理,从多角色层面确保试验数据的真实性、准确性和完整性;(5)以电子签名和操作痕迹稍查日志的方式追踪受试者状态及系统内每一步操作,保证试验的真实性和可溯游性。

 

3.4  试验结果报告模块

(1)以仪表板(dash­board)和交互式图表的方式实时展现各阶段研究事件完成及数据分布悄况;(2)可接入SpagoBI智能商务BI套件,申办方和项目监察员可在不导出试验数据的前提下通过数据图表实时追踪所属研 究项目进展悄况,及早发现试验异常操作、受试者不良事件、异常或具有异常趋势的数据;(3)可根据耍求自定义导出数据栠,简化统计分析数据栠的确定及递交数据的整合;(4)可以多种格式(PDF/SAS/EXCEL/SPSS/TXT)生成受试者病例报告数据及注释CRF(annotated CRF),也可通过SAS服务器在线生成临床试验结果分析报告。

 

4  执行技术路线

eClinicaXY数据采栠平台以研究事件(如个体特征、实验室检查等)作为数据采集域单元将整体临床试验分解为顺序时间节点要索,其中研究事件由基于CDASH标准构建的eCRF模版文件自动生成,分为时间相关重复事件、时间相关独立事件和累积性事件三类。每个研究事件附有特定的XML核查验证规则。系统根据临床试验执行流程将各研究聿件分别安排至对应的执行时间点,通过特定“时间窗-研究事件”顺序组合的模式构建电子化临床试验过程。当试验项目创建完成并启动后,eClinicaXY 数据采集平台以研究事件执行流的方式创建受试者数据条目列表,分别采集受试者各试验阶段产生的结果数据并整合成为符合CDISC递交标准的全局数据集合。

eClinicaXY数据采集平台临床试验执行技术路线可分为如下儿步:(1)项目设置,项目管理员根据具体临床试验方案设定研究项目详细信息、受试者入组条件及分组、项目参数等,数据 管理员根据方案CRF和数据管理计划编写eCRF源文件和XML数据核查文档,并以同名配对的方式导人系统。项目管理员将生成的研究事件组合为试验执行流程,在系统内技术测试和小范围可接受测试通过后将研究项目状态设置为“有效”;(2)受试者入组,各中心将受试者信息输人系统,待筛选完成后系统按照预先设定的试验类型和随机化方法为受试者自动分配唯一标识(SUB­JID),通过“受试者唯一标识-无序随机号-治疗方案-尤序药物包装号”盲态联动的药号分离方式确保试验盲态的顺利实施;(3)试验数据录入,研究者或CRC根据每位受试者的试验进程将产生的研究数据以隔离双份录人的形式录人对应数据条目,若首次录入出现逻辑错误或二次录入与首次录人不一致时会触发预设核查条件并在数据保存之前提醒操作者,循环直至所有数据核查无误。若有疑问可随时通过交互应答系统向研究者发出质疑;(4)数据导出,待最后一例受试者完成试验且尤遗留质疑时数据管理员可根据数据库锁定清单锁定数据库并依照试验方案以CDISCODM 格式导出受试者数据,之后由统计程序员将其分割、重组为统计分析数据集和递交数据集。整体执行技术路线见图2。


5  优势特点及实现效果

通过构建符合国家相关法规及行业标准的质昼控制体系,依据方案将整体临床试验细化为节点要素并建立严谨、一致的核查文件,不仅可以缩短数据清洗周期,而且可以在试验数据真实、完整的前提下及早发现异常或具有异常趋势的数据。当前临床试验数据质昼问题主要体现在转录错误、不完整、安全性不足及语义表达碎片化等方面[12],标准化数据采栠平台可以最大限度避免上述问题,确保数据质抵控制的ALCOA+ 原则(可归因庄易读性、同时性、原始性、准确性、完整性、一致性、持久性和可获得性)。

 

5.1  数据完整性及真实性验证

传统以纸制CRF为数据媒介的临床试验最大弊端在于仅能依靠参与人员自觉遵守GCP准则来确保试验数据的完整性和真实性,数据及相关文件的访问、修改无法得到有效的楷查追踪。标准化数据采集平台根据CDISC 数据框架建立通用临床试验数据模型,最大程度使临床试验实际产生的数据与需要递交的标准数据相匹配。在此基础上结合标准术语栠、MedDRA术语词典、XSL模板文档、XML和JQuery核查规则文件共同构建横向数据与纵向数据相结合的具有较强稳健性的eCRF库,直接在数据库内部完成原始试验数据的核查、编码与映射,确保递交数据的完整性与规范性。

此外,标准化数据采集平台集成了基于身份标识密码技术(Identity-Based Cryptograph, IBC)的多层次用户权限和操作痕迹稽查功能,痕迹稽查业务对象模型为一个六元组A=(U,S,D,R,VB,VA),其中U为操作者,S为操作对象,D为操作日期时间,R为操作目的,VB为更新前值,VA为更新后值,保证试验数据的安全性和可溯源性。

 

5.2  数据录入核查

药物临床试验经常会发生数据录人错误直至统计分析时才发现的现象,例如收缩压为80mmHg 而舒张压为110nunHg。标准化数据采集平台的数据核查功能可在JQuery吓数据录人初步筛查和XML规则逻辑核查的基础上利用数据库中存在的函数依赖以及进一步自定义化的近似函数依赖作为数据质扯规则来约减半结构化数据清洗的复杂程度[13-14]。

数据核查的主体对象主要为数据缺失及冗余、事件数据逻辑一致性、正常值范围及临床意义判定、随机化及方案违背等。系统根据预先设定的XML校验规则文档,对方案中规定的主要和次耍疗效指标、关键的安全性指标在数据录入初期或经标准化编码映射入库后进行100%校验复核。在监测到异常数据后及时向对应责任权限的平台操作人员提出警示并复核,追踪分析异常数据变化悄况。

 

5,3 整体数据适应性决策   

临床试验有效性和安全性数据流是一组面板数据序列,将实时数据流在数据库中分割为原始数据区段,标准化映射完成后进一步按照目标字段的固有统计学特性建立描述其整体分布的可视化模型,同时不断用新 采集到的数据段修正当前关联模型的拟合度并探索具备统计显著性的事件,以此分析临床试验的进展悄况,对数据流中的异常和离群值俶出响应。通过对异常或具有异常趋势的特定时间及区间数据进行整体比较或与先期研究数据对比并由研究者从专业角度综合分析,及早识别疗效数据分布趋势及安全性数据异转发生情况[15]。在试验数据标准化整合和全面质最管控的整体框架下对试验实施做出科学严谨的适应性决策(如样本昼再估计、适应随机化等),以便提前采取调整措施,在保护受试者权益的同时全面控制临床试验整体执行质昼。

 

6  结语

真实、完整、可溯源的高质蜇临床研究数据对试验结果的可靠性和准确性起若至关重要的作用。现代化标准的临床试验数据管理已不再局限于传统简单的数据录入,还包括通过严谨、一致的质昼控制措施确保数据的规范化与准确化[16]。融合了CDISC 标 准数据框架、MedDRA 术语词典、XML及JQuery数据核查文件等标准化文档的模型驱动架构与需求驱动架构相结合的标准化临床试验数据采集平台不仅具有源数据管理统一规范化、数据编码动态联动、即时数据异常校验、数据安全生命周期可控等优势特点,而且可实现临床试验执行过程中数据误录及时修正与异常数  据早期筛查等功能,以此辅助制药公司优化质昼控制资源配宜,降低传统临床试验数据收集模式中因采集、编码、验证相互隔离而导致的质呈管控空泛化。标准化的临床试验数据采集平台,同时搭配协同运行的组织环境、执行流程、人员配置和管控机制必将成为未来临床试验数据管理的发展趋势。


参考文献略

欢迎留言你的看法、异见


生物统计/数据管理 数据库/IT等岗位推荐


北京:新锐CRO高薪诚聘SAS程序员/统计师/DataBase Designer,友商大咖联袂推荐!

广州:招揽各路合伙人,华南首家专注数统的CRO喊你来!

上海:老牌专业数统CRO大量社招扩军,大量校招专业培训储备人才!


友情链接

Copyright © 2023 All Rights Reserved 版权所有 北京物流信息联盟