北京物流信息联盟

刘保延:把老中医的经验“大数据化”,得出治疗规律

2022-06-03 11:15:17


针会天下编者按:就如计算机刚开始在中国应用时,关于中文输入法的争论一样,那时候,很多人都说中文的独有特点,以及计算机固有的西方特性,没有办法用计算机快速录入中文。随着五笔输入法的诞生,尤其是智能拼音输入法的诞生,以前的那些观点都不攻自破。


目前的中医界以及计算机界也在说,中医无法用计算机语言来解读,更无法用大数据的方法产生应用。


若干年后,我想,谁说这样的话,如果他还活着,那就只能自己去打脸了。


========================


中国中医科学院首席研究员刘保延谈到一个让很多人惊叹的实例:


他们将中医科学院名医薛世寿治疗发烧效果的800多个病例收集起来,其中共涉及9500多个处方,再将他治疗发烧的9500多个处方进行数据挖掘。


得出的结果是:单从药味(中医所用药物的总称)来看,仅1.8%的处方在药味组成上是一致的,而且还不包括药量这一维度。如果加上用药量这一条件,没有一个病人的处方是一致的。


这反应出一个问题:中医临床实践的个体化属性很强,老中医需对每一个病人进行非常个性化的研究和对症下药。


那么个体化的中医临床实践背后,到底有没有固定的“规律”可寻:


为此,刘保延团队开发了中医数据挖掘分析平台,并建立三大类的10个模型,分析了40多位老中医的经验,总结出他们核心处方是什么、加减药变化规律是什么、疗效怎么样……


那么为了实现这个目标该如何去做,以下是正文内容:


========================


现代医学和中医药学有不同的发展道路,不同的发展道路决定了它各自的优势、特点,以及对信息化的依赖和需求。


中医药研究上,有它特殊的范式,这种研究范式叫做真实世界的临床科研一体化。


这种复杂范式为何被称作临床科研一体化?



在中医药研究当中,所有的发明和实践都是在临床当中产生的,中医是一个从临床中来,到临床中去的学科。


中医临床实践的特点:个体化


中医药有一个很大的特点就是个体化。


既然中医的临床实践是个体化的,这就导致,对每一个病人都需要研究。对待病人不能照猫画虎,要根据病人的反应、表现和医生自己的思考,来决定该给这个病人用什么样的治疗方法。


所以针对每一个病人的诊疗,都有创新,都有成功的经验,也有失败的教训在其中。


“怎么总结实践结果里的经验和教训,从而指导下次临床?”



这部分工作原本都是靠人脑来记忆。医生从学生学习期,到最后成为大家所说的老中医,得靠自己的脑子不断去记忆、思考和思索。


中医界有这样一句话,很多人都听过:中医的水平,得看这个人有没有悟性,悟性越高掌握的就越好,其实悟性的背后就是这个人的思考、经验积累、记忆搜索能力。



把个性化过程数字化


那么有没有可能把这种个体化过程,他的一些东西,这些信息变成数字化的,把这些数字化里面的规律挖掘出来,不断丰富它,让它的经验扩大,把它教训成下一步成功的起点。


总结为一点,中医研究方法,个体化治疗是其重要的特点。


那么能不能把这种特点发挥到极致,让它对每个病人的治疗都能得到很好的效果?


要达到上述提到的要求,医院不能用简单的方式来做,这其中就需要“以人为核心”,临床科研一体化以数据为导向、问题为驱动,把医学实践和科学计算进行交替,以临床科研信息共享平台系统作为支撑,来完成临床到临床的过程。


跟名师、做临床、读经典、有悟性,这是中医学习的一个特征,但这些特征的特点是临床与科研是一体的。


现阶段,医院该如何借助信息技术,让“一体”更加有效地发挥出作用,更快地构建并完善这个体系。


所以在研究当中,最根本的问题就是怎么把中医的临床诊疗过程数字化、数据化。


中医诊疗是一个从数据到信息,从信息到知识,从知识到决策,从决策到智慧,这么一个信息转化的流程,这其中“数据的产生”是它的核心。



如何构建核心,也就是如何产生数据,是数字化中医药信息系统研发最基本的任务。


在这样的思路下,借助现有的信息技术,来把这个平台搭建起来,让中医多个环节中让人机进行结合,从而使计算机帮助中医做更多事。


系统构成与应用情况



整个数字化中医药信息系统,要达到从临床实践中产生数据,通过对数据利用来进一步挖掘规律,从而指导临床,把它形成闭环。这个过程该如何做?


主要可分为两大块工作:


第一,数字资源的建设层:它的目的就把临床过程、诊疗过程数字化。


第二,数据资源分析利用层:目的在于把临床复杂的数据找出规律,分析它,利用它。



首先要建立高度结构化的电子病历系统


具体的构建方式,在数据资源层里让诊疗数据化,首先要建立一个高度结构化的电子病例系统,以病人为核心,把它诊疗过程中产生信息全部规范地记录下来,同时把它变成可分析的数据。


而要做到这一点,则先要建立一个中医临床术语应用系统,如果没有规范的术语应用系统,结构化的电子病例基本无法实现。


搭建中医临床术语应用系统


中医临床术语应用系统大体由以下几个部分构成:



中医临床术语应用系统的核心是中医临床术语集,把中医临床当中涉及到的一些术语规范化,把它的上位词、下位词,以及左位右位的东西全部确定下来,建立中医临床术语的本体数据库。


在术语集层级下,要进一步在电子病例当中再建立一个《中医临床术语字典》,这些术语很小、很细分,但到了术语字典的规模和阶段,它就可以和临床紧密结合,把临床当中所要用到的东西放到术语字典里面。


在术语字典的支撑下,通过基本元素和复合元素的方法,用模板编辑器建立一个结构化的模板,通过模板再来书写电子病例,形成结构化电子病例后,最终产生了这些数据。



从上图可以看到,在右下角的数据前处理阶段,还要通过中医临床术语集进一步对这些术语、对收集到的数据进行规范,然后进行分解和预梳理,形成临床术语应用体系。


目前中国中医科学院的临床术语集已达39万条,这其中的每一条术语,都能查到它来源于什么地方,它的上位词是什么,下位词是什么,跟其它词有哪些关系。


39万条术语全部建立起关系后,在这基础上又进一步浓缩,并把临床的具体应用结合起来,建立临床术语字典,术语集独立在电子病例之外,而术语字典是与电子病例系统结合在一体的组成部分。


在术语字典的基础上,进一步对术语进行整合,建立基本元素,中国中医科学院现在拥有900—1000条基本元素,在基本元素的基础上再建立复合元素,通过复合元素进一步建立不同的模板体系:个人模板、科室模板等等。


到现在为止,中国中医科学院已拥有300多个复合元素、3000多个模板。


上面谈到的流程是第一步:术语已经有了。


高度结构化电子病历的功能与问题


在术语应用系统的支撑下,第二步就要建立一个高度结构化的电子病例,这也是临床科研一体化的载体。那电子病历怎样才能起到把临床和科研结合起来的作用。


在分析电子病历所起到的效果之前,先来看下电子病历的基础功能、主要功能和特色功能:



基本功能包括:用户的授权与认证、审计管理、数据存储管理、字典管理等等,这是常规电子病例都需具备的。


主要功能包括:电子病例创建,电子病例的检索查询、痕迹保存、打印等。


在这基础上,结构化是我们的核心,如果没有结构化,就没有数字化:医生把病例写完了,变成文本放在那,要用起来难度比较大。


因此要想把电子病历有效利用,首先要结构化。


但是也面临一个问题:结构化程度越高,往往便捷性、书写速度和医生思维习惯的矛盾就越突出,怎么把这些矛盾解决好?让大夫用起来很顺畅,而且速度快,大家也能忍受?


我们在这方面做了大量工作,到目前为止,医生如果熟练系统后,写一份高度结构化的电子病例,即便是大病例,通常20多分钟左右就可以完成,如果和预诊系统结合起来,速度还有提升空间。


总体来说,医生从一开始不接受,到现在用的很顺畅。


以往的文本病例粘贴往往容易贴错,现在结构化的病例让这种事情不会再出现。


因为我们做的主要是结构化电子病例系统,医院本身也一直有HIS、LIS、PACS、RIS,因此我们要把袋子病历系统嵌入在上述一系列的系统里面,把与病人相关的信息全部整合为一体。


从医疗角度来说,病例的质量控制非常重要。


把病例质量控制做好对医生是一种帮助,这也是我们很大的任务。所以从基础质控一直到科室质控,再到医院层的全院质控,非常灵活地通过这里面的一些选项,让计算机以提示的形式保证每个病例的合格率达到100%。


从医疗角度再到中医角度,中医电子病例和西医病例有很多共同特点以外,中医电子病例基本上是中西医结合,西医的内容要有,中医的内容也要有。


中国中医科学院在中医内容上做了大量的研发工作,比如药物的调动,在电子病例中把具体的药方名写上,药就可以出来,同时也可以加减。以及把上一次用的药自动调到这一次来,把门诊和病房联动起来,这些方法在我们都可实现。


在舌象、脉象、针灸里面,选的穴位直接可选在上面。我们现在也有舌象仪、脉象仪,把病例整合到里面。


大病房的病例比较容易做,而门诊的病例是一个难点。对中医来说,门诊老中医的病例数据对研究来说更加重要。


所以如何开发一个比较适合门诊思路的病例,这是一个比较大的考验。所以我们也开发了门诊电子病例系统,该系统基本可以满足我们对老中医经验的初步总结、挖掘和整理工作。


与科大讯飞之间的合作


中国中医科学院也把移动电子病历的方法,用在病例调阅查询中。其中与科大讯飞之间合作,我们把语音识别系统也用到调阅查询里面来,而且成立了一个联合实验室,专门研究问诊的语音识别,从而建立一个说写病例的项目:在医生说的同时,也自动能把病例写出来,变成结构化。


这些工作现在也正逐渐完善,这个也是把每个病人不同的时点、表现、他的干预方法、检验结果都罗列出来,让医生一目了然,看到病人病情的变化情况。


科研辅助


科研辅助也是非常重要的任务,对于病例的科研,其实不是每个患者、每个病历都有“科研价值”和科研目标,对于有科研目标的病例,需进行很好的科研管理。


等下一个病人来了后,虽然是一般的住院病人,也可以把他分为不同的方案使用,随机化管理。其次,病人离院后的随访管理以及患者结局的管理,对于疗效评估都非常重要。


以前这些东西大家都没有记住方法,现在也研发了自动化量表、床旁的填写和记录设备来做这些事情,为结局的管理奠定非常好的基础。


现在做临床研究,基本上是用临床观察表的方式记录患者信息。而临床观察表是二次记录方法,与原始的信息往往可能有一定差别。所以现在看到病例有造假的现象,往往是在二次填写出现了一些漏洞。


那么我们目标和需求是什么呢?


病例是结构化的,自动从病例里生成临床观察表,医生就不要去填了。


根据这样的需求,我们开发了临床观察表的自动生成和指控工具。根据工具可定制,自动根据病人的病情变化,把他的信息填写到观察表里面,不用人手工再去填。


从纳入排序标准到各项指标记录等,填完以后质量怎么样,还需要有一个专门的质控系统看质量。


对于中医临床路径如何进行管理,这也是我们做的工作之一,同时也在医院里实施。


除了本医院的病人以外,院外其他医院的病人如果也想把病例收集起来,那该怎么办?


我们现在建立很多联合体,但不可能把病例系统都装在每个医院。于是我们又研发了病例登记系统,把其他医院的病人通过简单的方式,把他们的信息收集起来。


有了这些数据后,有两条途径可使用:一种是直接把数据导出来进行分析;另外一条路径是走数据仓库,数据挖掘的道路。



直接导出来,对病例的解析是项非常重要的任务,所以我们研发了数据解析方法:哪些病例需要分析,通过解析系统,很容易把数据导出来进行分析。

数据仓库与挖掘分析


在此基础上,有了这么多数据,如何利用这些数据?在研发当中需进行第二步工作:即数据资源的分析利用工作。



以数据仓库为核心,在进入数据仓库以前,需要对数据要进行前处理,也叫预处理。


预处理结束后,导进来。有了大量数据后,首先需要看这些数据里到底有什么,所以又需要建立一个在线的检索、查询和展示系统,让人了解数据里面到底有什么,不同的组合可能会出现什么。


进一步对隐性的知识建立一些模型,分析隐性知识当中可能潜在的规律等。


中医药数据预处理系统目前已经处理了10多万份病例,建立的有关规也有100多万条,为几十个课题提供了服务。包括这么几大部分:从健康之间的关联关系,还有任务批量式的数据导入。


第一部分是匹配,第二部分是批量导入,建立规则。


影射情况、调用功能导入以后,数据和原始数据之间的核查功能,再到标准数据的转换功能。通过系统基本可实现定制批量的把数据导入到数据仓库里来,保证数据仓库的肯定性变成非常好用的数据。


有了数据仓库以后,又建立了临床数据多维检索查询与展示系统。


临床数据多维检索查询与展示系统首先数据之间的关系建立起来,在这基础上,通过这样的方法把你所要的数据项拖动过来,选择要展示的图像。


到最后就可根据要求把数据展示出:数据到底有什么功能、什么内容,进一步进行数据分析、数据整理,奠定这么一个工具。



数据挖掘分析其实也是一个非常重要的功能,一些非常潜在的隐性知识怎么发现?


我们建立了中医数据挖掘分析平台,通过这平台建立了三类10种模型,发现老中医经验的核心处方是什么,加减变化规律是什么,疗效怎么样。我们目前进行了40多位老中医的经验整理和研究。



这个系统也在几十家医院当中使用,我们也进行了一些规律的研究:比如中风病早期病情不断在变化,这些变化有没有拐点?有没有在要改变治疗方法的时候,通过这个研究后发现6-8天时,往往是他症候变化的拐点。


而这样的研究用过往的方法很难发现。


分析老中医的经验:他的核心处方是什么,治疗某一个病用药怎么加减变化?


通过现在这种方法都可以找得到部分规律:


比如老中医治疗冠心病用什么药,怎么加减的,我们从他的很多病例当中分析挖掘,发现他常用的处方有16种药,怎么加减变化,这背后都分析挖掘出很多规律。


在这基础上,我们也获得了12项专利,17项软件著作权,也形成55项标准和规范来支撑后续的发展。


文源:AI掘金志


========================


扩展阅读:大数据能不能帮助中医走出目前的困境?(引自知乎)


大数据注重相关性忽略因果关系的特性,有没有可能促成中医的实践和现代科学理论的最终统一?


补充一些想法,首先医学方面的问题我没有任何发言权,学医的大牛们欢迎拍砖。


我是学计算机的,这两年对大数据关注的比较多,最近忽然觉得大数据的一些特点非常巧合的可以解决现在中医面临的一些问题。


一些简单的想法:


大数据目前在互联网和电子商务相关行业的应用比较成熟,其他行业里的应用的规模相对比较小,但是中国大陆有潜力比其他地区更早突破这个限制,我个人认为是中国的中医就是潜力之一。


中医我个人的理解是一门经验型的学科,中医的理论,所谓阴阳五行这些,都是摆在那里好看的,中医真正开方子的时候最重要的依据还是前人留下来的病历跟药方,这跟大数据注重相关性忽略因果关系的特性契合的非常好,计算机不需要知道板蓝根的具体成分是什么,当医疗记录足够丰富的时候,计算机可以根据这些记录预测眼前这个咳嗽发热的病人需不需要服用板蓝根。而且数据的容错性跟答案的准确性只跟数据容量有关,数据容量越大,容错性就越好,准确性就越高。


《大数据时代》介绍过几个非常好的实例。当数据容量足够大的时候,数据里的错误和数据库的结构可以被忽略,Google采集到的搜索数据都是模糊和非精确的,但是Google通过用户的搜索数据对传染病爆发的预测是目前为止最及时最准确的;MS Word的语法检查算法的实例里,算法相同的情况下50%的数据增幅增加了20%的准确性。


很多人都提到数据精度的问题,跟学西医的朋友交流的时候他们也表达过同样的顾虑(其实本质的顾虑跟中医一样,还是新技术会对饭碗有多大冲击,所以),现在医疗系统也倾向于把大数据的应用限制在护理方面,用于诊断一直都是“评估阶段”,不过最近有一个叫Enlitic的处在实验阶段的投资计划吸引了不少注意,项目之一是分析海量的MRI和X光片来帮助医生确诊癌症,一些机构也在做独立的研究,比如IBM。


回到采集机制上,首先我完全同意用现代的数据分析手段来运作古典方式采集到的数据不是最有效的解决方案,西医们大都不反对在MRI上连根网线直接到数据库,中医诊断时需不需要用一张高分辨率的舌苔照片作为归档的诊断依据,或者把脉的时候要不要绑上心率监视器,或者其他必要的客观采集方式,也不是一两天就能有答案的问题。


其实主要的疑问还是那个,如果要把大数据作为统一中医丰富经验跟西医先进理论的途径之一,目前我们的瓶颈都有哪些。 


其实,中国人在纠结要不要把中医踢出医疗系统的时候,西方人已经在投钱要把中医发扬光大了。


========================


大数据可以做到的事情:   


其一:可以先从中药配方入手,每种药材的主要浸出物的成分,配比都可以得到。每种有效成分和人体内蛋白质的相互作用,是否能使人体内蛋白质变性或者对人身体有毒害,这些做生物的研究人员在这方面已经做了大量的工作。每种药物的有效成分是如何参与人体内的新陈代谢活动,如何参与代谢网络的调控的,这些都可以有望通过大数据把这些机理搞清楚。   


其二:橘生淮南而为橘,生淮北而为枳,不同的地理,气候条件下,产生的药材,药性的有效成分是不同的,即使是同一个地方,不同年份的生产的药材的药性成分也不会完全相同。但是中医的药方中药物的配比却是相对固定(有经验的中医会根据患者的病情酌情增加或减少药方中某种药物的成分,但是不是每个大夫都会这样)。如何通过每种药材的实际含药性进行重新配方,也是大数据可以做的事情。   


其三:不同的人,病情,体质各不相同,对于药物副作用的耐受性都不同。这也需要大数据把这一因素考虑进来。  


我只想到以上三点,中医的进一步发展的确离不开大数据。(王洋)


========================


作为一个IT信息系统从业人,个人对这个问题有点看法:IT信息系统,有着独特的技术优势,可以解决当前阻碍中医发展相关的突出问题。


1、可以多参数、多角度、海量记录病例的详细记录以及治疗过程,随时调用。2、可以集中全国顶尖医生,从多个领域方面,并行开展中医技术的研究,探索。例如,经络学说,阴阳虚实理论等等。

3、可以开发智能化学习程序,通过计算自动运算,从海量的病例数据中,归纳总结规律。

4、超级计算机,化学计算服务器,虚拟现实技术,计算机智能化学习技术……这些信息技术的发展,为中医信息化,提供了坚实的基础。(程朗)


========================


中医与大数据


1、中医强调疾病是情绪和身体本身相互关系的结果。

2、中医本身注重的就是前人留下的药方和病例,通过对这些经验的总结不断更新出更好的配方。

3、大数据注重相关性的特点与中医的辩证下药非常契合,通过不断的对数据积累分析来完成更优的选择

4、大数据的三个理念:是全体数据而不是随机取样;是混杂性而不是精确性;是相关关系而不是因果关系

5、大数据在中医中可以做到的:量化中药配方,获取每种药物的主要浸出物的成分及配比;如何通过每种药物的实际含药性进行重新配方;不同的人,病情、体质各不相同,因此对于药物副作用的耐受性也就不同(钟红雨)




分享是一种美德,转发是一种境界。


你的一次转发、有可能会帮助无数人……


转发时请注明原创作者和出处!


针灸中国网(www.acucn.com)

微信公众号:针会天下

微信群:针会天下群


联系微信号:13124729881 (江东)


添加该微信后进入”针会天下“微信群(匿名群)

可加入NCCAOM学习班报名咨询微信群(实名群)。

微信群定期发布最新中医针灸资讯,NCCAOM考试信息,中医英语学习资料,美国中医从业和就业等资讯。


联系人: 徐老师

联系电话:13813846072



友情链接

Copyright © 2023 All Rights Reserved 版权所有 北京物流信息联盟