一站通用户名: 密码 注册
中医人旗下网站:医学眺望医师考试认识中医人日文英文
 
您现在的位置: 中医人 >> 中医学院 >> 思考中医 >> 正文

广告赞助more>>

数据挖掘技术在中医医案领域的应用进展

  • 文章导读:

     

    (1)在心气虚证中加入能辨病位的临床表现;

    (2)从心阳虚证或心阳虚脱证中去掉瘀血的临床表现;

    (3)将心脉痹阻证与瘀阻脑络证合并。

    研究者希望这一诊断软件能成为关于证候规范或标准制定的一种评判手段。谭氏等[ 13 ]利用流行病学调查关于胆石病的临床资料,对296例胆石病患者临床症状和临床诊断得出的中医病因病机建立了Logistic回归模型,对中医病因病机进行了统计分析和预测,将预测结果和临床诊断结果进行对比表明,流行病学调查中采用的中医病因病机诊断标准是科学合理的,获得的296例胆石病患者的主要中医病因病机分布也是拥有较高可信度的分布。

    (3)关联规则挖掘在数据挖掘领域中,关联规则( association rule)是一个应用较为广泛的研究方向。两个或多个变量的取值之间存在某种规律性,如“同时发生”或“从一个对象可以推出另一个对象”就称为关联。关联规则挖掘[ 14 ]就是通过关联分析找出数据库中隐藏的知识,利用这些知识可以根据已知情况对未知问题进行推测。朱氏等[ 15 ]采用关联规则分析名中医445例哮喘医案的病因、病位、证候与四诊信息的关联关系,病因、病位、证候、四诊信息与用药的关联关系,以及中药之间的关联关系,最终认为中医医案中的用药、四诊信息、病因、病位、证候之间存在一定关联性,可通过关联规则分析获取其中规律。邹氏等[ 16 ]以古代心悸医案为研究对象,建立数据库,进行频数分析和关联分析,挖掘出治疗心悸的基础方为半夏陈皮人参茯苓白术甘草当归白芍远志茯神酸枣仁龙骨。欧阳氏等[ 17 ]集已出版发行的名中医牙痛医案,采用关联规则和链接分析方法进行统计,分析显示牙痛治疗有两个核心组方,以浙贝母赤芍连翘金银花、蒲公英、菊花为第一核心中药组方,石膏知母生地黄、牛膝、牡丹皮为第二核心中药组方,两组方与牙痛的中医治疗理论非常吻合。李氏等[ 18 ]以临床收集的628例名医病案为对象,采用基于FP2tree的算法,对证型2症状、症状2药物,证型2药物之间的关联规则进行了挖掘。经过分析发现,挖掘出的大部分规则能得到合理的解释并具有一定的实际意义。陈氏[ 19 ]采用频数分析及关联规则挖掘技术,提出了一个萃取古代各家名医治疗各种病症的经验的方法与模式,并经由中风病症的验证,证明本模式的可行性。研究结果找出了古代名医治疗中风最常使用的7种中药,并找出了最常用来治疗中风的9个药对,以及最常用的3个三药对。作者认为:“经由古代中医医案的数据挖掘,的确可以将古代名医的治疗经验萃取出。其探勘后的知识不但可行而且具有临床应用性”。

    (4)聚类分析挖掘又称集群分析,是指利用物以类聚的原理,把大量无序的数据分成数类,有助于对大量数据中的规则予以认识,它是一种数理统计
    方法,可将一些观察对象依据某些特征加以归类,在生物学和医学分类问题中有着广泛的应用。在中医医案研究中,聚类分析能较好地避免分类过程中掺杂的主观因素,能客观地准确地反映研究对象,并从中可能发现其内在的客观规律[ 20 ] 。周氏[ 21 ]统计了明清时期26部现存医案中的津液亏损病案573例,采用R型系统聚类分析方法,得出津液亏损中每个亚型的几个主要用药,并揭示了明清时期津液理论的某些特征。周氏等[ 22 ]广泛收集了反映明清时期医家各学派的医案资料59例,运用系统聚类分析方法对变量进行聚类分析,以寻求治疗消渴病的用药规律,结果发现生地知母麦冬甘草(生炙) 、佩兰叶、茯苓肉桂熟地山药黄连是治疗消渴病的有效药物,对当代临床实践具有重要的指导意义。

    (5)人工神经网络挖掘人工神经网络是指模拟人脑工作机制的一种计算模型,它是由非处理单元组成的非线性大规模自适应系统,以类似于人脑神经网络的并行处理结构进行信息的高级处理。由于它具有自适应性、并行处理能力和非线性处理的优点,所以在医学领域被广泛应用[ 23 ] 秦氏等[ 24 ]将人工神经网络与粗糙集理论相结合,用粗糙集理论对人工神经网络进行预处理,求取核属性,构造粗糙人工神经网络,并应用到中医类风湿病的诊断建模。仿真结果表明,用粗糙集理论辅助设计人工神经网络,改善了人工神经网络的学习能力, 并在实践中取得了令人满意的效果, 叶氏等[ 25 ]尝试应用人工神经网络的反向传播算法( backp ropagation algorithm, BP) ,通过研究中医医案,形成专家知识,对BP网络进行训练,从而使网络获得一定的学习能力,将训练所“学习”而来的“知识”运用到新的病症判断中,从而实现对新知识的获取。(6)其它挖掘方法的应用赵氏[ 26 ]根据中医理论和慢性乙型肝炎中医辨证标准中肝郁脾虚、瘀血阻络证,选择了临床上常见的26项症状、体征,对肝郁脾虚+瘀血阻络证91例患者的症状进行了统计分析。通过多元线性回归分析,建立了症状、体征与证型之间的线性回归方程,提示临床所选26 项症状、体征与病情有很好的相关性,能较全面地反映肝郁脾虚+瘀血阻络证;孙氏等[ 27 ]通过直接分析西苑中医院H IS系统电子病例的证型诊断相关因素,分别构造了中医证型分类朴素贝叶斯和扩展贝叶斯模型。

    实验结果显示:在中医临床证型诊断模型中,贝叶斯分类算法具有良好的分类性能。沈氏等[ 28 ]以武汉市某大型综合性医院199622000年伤害住院病案为资料,联合应用因子分析和Cox回归分析探讨住院时间的影响因素,发现住院时间的长短受医疗水平、伤害类型、入院病情、手术次数等多方面因素的影响。研究结果为临床医师正确处理伤害病人、缩短住院时间提供了依据。刘氏等[ 29 ]进行了基于决策树的医案数据分析,发现MDL剪枝法能够有效地减少得到的决策树的复杂度,近3 /4的决策树被减去,然而整个决策树在测试集上的分类精确度几乎没有下降。最终从数据中得到了一些有用的知识。但是其中有一些知识是很荒谬的。另外,他们还发现医疗是一个具有时间概念的事件,而决策树本身只能处理在某一时间点下的事件的状况,因此需要寻找一个有效的方法来处理此类数据,避免产生一些不合实践的结论。

    2 问题与展望

    从以上研究情况可以看出,越来越多的学者开始重视数据挖掘技术对中医医案的发掘与利用的重要作用与有效性,已经初步积累了一些医案数据挖掘的可行方法,并且发现数据挖掘确实能确发现医案中隐藏的部分规律,可以指导与纠正中医理论与实践的部分问题,但目前尚未有大规模与系统进行医案的整理与挖掘。数据挖掘在医案研究中应用尚存在以下一些问题:一是研究的重点仍以疾病的诊治用药分析最多,基础研究相对较少,但近年来有增多的趋势;二是许多研究结论虽然与临床有较高的吻合性,但仍有些结论与临床实践有明显的出入;三是医案挖掘方法仍以统计学的方法如频数分析、Lo2gistic回归分析方法为主,一些复杂挖掘方法在医案中应用不多;四是从事医案挖掘的研究人员相对较少与集中。因此,今后医案挖掘过程中,尚要注意以后两点:一是要对医案的特征进行更深入的分析,选择最合适的挖掘方法,以期挖掘结果更能反映医案中隐藏的规律,为促进中医临床实践水平起到作用;二是要发展计算机技术中的文本挖掘方法,更多地选用聚类分析、人工神经网络等挖掘方法,以期更深层次地挖掘隐藏在大量医案后面的规律。总之,数据挖掘作为一门新技术,虽然目前在中医医案研究应用中尚处于起步和试验阶段,但必将随着技术的成熟与方法的改进而取得更大的成就!

    参考文献

    [ 1 ]崔雷主编. 医学数据挖掘[M ] ,高等教育出版社, 2006年7月第一版.
    [ 2 ]孙燕,臧佳新,任廷革. 基于数据挖掘技术的医案整理方法探讨[ J ] ,中国中医药信息杂志, 2006, 13 (11) : 106.
    [ 3 ]王佑华,陆金根,柳涛,等. 中医医案中的知识发现研究[ J ]. 中西医结合学报, 2007, 5 (4) : 368.
    [ 4 ]陈涛,李克乾,陈茂华,等. 4400例当代名医医案的舌象分布频数分析[ J ]. 辽宁中医杂志, 2007, 34 (9) : 1217.
    [ 5 ]陈涛,陈茂华,梁嵘. 4400例当代名中医医案的脉象分布频数分析[ J ]. 时珍国医国药, 2008, 19 (5) : 1236.
    [ 6 ]谢元华,张京春,蒋跃绒,等. 陈可冀辨治高血压病医案的数据挖掘分析[ J ]. 中西医结合心脑血管病杂志, 2008, 6 (2) : 135.
    [ 7 ]张京春,谢元华. 陈可冀院士辨治冠心病医案的数据挖掘[ J ]. 世界中西医结合杂志, 2008, 3 (1) : 4.
    [ 8 ]简晖,张启明,刘学文,等. 历代医家治疗痹证医案的证候频数统计分析[ J ]. 中国中医基础医学杂志, 2007, 13 (8) : 630.
    [ 9 ]刘学文,简晖,张启明,等. 历代痹证医案文献的病因、病位、发病时间分析[ J ]. 江西中医学院学报, 2007, 19 (1) : 23.
    [ 10 ]周萍,肖小燕,王斌. 计算机辅助心身疾病相关医案的用药规律研究[ J ]. 中医药临床杂志, 2008, 20 (3) : 224.
    [ 11 ]张启明,王永炎,张志斌,等. 外感病因中证候要素的提取[ J ].山东中医药大学学报, 2005, 29 (5) : 339.
    [ 12 ]宋观礼,张启明,王永炎,对规划教材《中医诊断学》心病辨证的“系统"分析[ J ]. 山东中医药大学学报, 2006, 30 (3) : 188.
    [ 13 ]谭华,皮明钧. 基于Web和SQL /ASP技术构建胆石病数据挖掘系统[ J ]. 湖南中医药大学学报, 2008, 28 (3) : 72.
    [ 14 ]苏占东,游福成,杨炳儒. 关联规则的综合评价方法研究与实例验证[ J ]. 计算机应用, 2004, 24 (10) : 17.
    [ 15 ]朱立成,林色奇,薛汉荣,等. 名中医哮喘医案445例关联规则分析[ J ]. 江西中医学院学报, 2007, 19 (5) : 83.
    [ 16 ]邹石,周莺,吴丽丽. 古代心悸医案信息284例数理分析[ J ]. 江西中医学院学报, 2007, 19 (5) : 91.
    [ 17 ]欧阳志强,蒋力生,王如意,等. 名中医牙痛医案63例中药配伍及方证对应规律分析[ J ]. 江西中医学院学报, 2007, 19 (5) : 88.
    [ 18 ]李文林,赵国平,陆建峰,等. 关联规则在名医临证经验分析挖掘中的应用[ J ]. 南京中医药大学学报, 2008, 24 (1) : 21.
    [ 19 ]陈擎文. 数据挖掘技术在古代名中医中风医案之应用研究[ J ] ,中华中医药学刊, 2008, 26 (10) : 2254.
    [ 20 ]刘稼. 聚类分析在中医药研究中的应用及意义[ J ]. 中医药学刊, 2004, 22 (5) : 927.
    [ 21 ]周德生. 明清时期津液亏损病案573例辨证用药统计分析[ J ].中医药研究, 1998, 14 (4) : 12.
    [ 22 ]周君,冯妍. 明清时期消渴病案59例用药统计分析[ J ]. 国医论坛, 2005, 20 (6) : 18.
    [ 23 ]曹显庆,牟永阁. 人工神经网络技术在医学研究中的应用[ J ].现代临床医学生物工程学杂志. , 2003, 9 (1) : 57.
    [ 24 ]秦中广,毛宗源,邓兆智. 粗糙集在中医类风湿证候诊断中的应用[ J ]. 中国生物医学工程学报, 2001, 20 (4) : 354.
    [ 25 ]叶进,邢传鼎. 基于人工神经网络的病症诊断原型系统[ J ]. 东华大学学报(自然科学版) , 2003, 29 (4) : 43.
    [ 26 ]赵晓威. 慢性乙型肝炎肝郁脾虚加瘀血阻络证宏观指标统计分析[ J ]. 深圳中西医结合杂志, 2002, 12 (2) : 88.
    [ 27 ]孙亚男,宁士勇. 贝叶斯分类算法在冠心病中医临床证型诊断中的应用[ J ]. 计算机应用研究, 2006 (11) : 164.
    [ 28 ]沈敏,刘筱娴. 1444例女性伤害病人住院时间的影响因素分析[ J ]中国医院统计, 2005, 12 (2) : 115.
    [ 29 ]刘昆,刘业政. 基于决策树的医疗数据分析[ J ]. 计算机工程,2002, 28 (2) : 41.

    上一页  [1] [2] 

    昵称:  (欢迎留言,注意文明用词!
      评分: 1分 2分 3分 4分 5分
      内容:
    * 所有评论仅代表网友意见,中医人保持中立