![]() | ![]() | ||
|
![]() ![]() |
数据挖掘技术在中医医案领域的应用进展 |
作者:黄利兴 指… 文章来源:江西中医学院学 点击数303 更新时间:2011-4-26 9:33:27 文章录入:huangyf81 责任编辑:huangyf81 |
|
随着中医医案文献不断涌现,如何对大量的医案进行整理与挖掘,发现其中隐含的知识与规律,是医案研究的重要问题。数据挖掘技术的发展,使中医医案的发掘与整理有了良好的工具。数据挖掘( data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,是知识发现( knowledge discovery in database)的关键步骤[ 1 ] 。有学者[ 2, 3 ]提出可用于医案数据挖掘的方法有描述性分析、聚类分析、关联分析、因子分析、判断分析、遗传算法等。近年来,数据挖掘在中医医案方面得到广泛应用。 1 数据挖掘方法 (1)频数统计分析频数统计方法比较简单,但对医案的发掘仍有较大意义,可以发现许多有价值的规律与结论。陈涛[ 4, 5 ]等统计了4400 例当代名医医案的舌象及脉象分布频数的情况,发现一些以前不为人们注意的新知识,如嫩舌也主实证等。谢氏等[ 6, 7 ]对陈可冀院士治疗的高血压与冠心病医案进行统计分析,发现数据挖掘结果能够客观反映了陈可冀院士对这二个疾病的诊治特色与经验。简氏等[ 8, 9 ]统计了历代名老中医痹证医案489 个,建立痹证医案数据库,运用频数分析对证候及病因、病位、发病时间等进行统计。研究结论与传统中医理论有着较高的一致性,符合中医对痹证的认识。还有学者[ 10 ]建立古代情志医案中心身疾病相关医案的ACCESS数据库,运用频数分析法,对出现频次在50次以上常用的54种药物进行分析,总结了心身疾病用药的特色。 (2) Logistic回归分析Logistic 回归分析方法是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。当前,在医学领域有着较广泛的应用。 张氏等[ 11, 12 ]建立历代医案数据库,采用非条件Logistic多元逐步回归筛选外感病因的症状,并给出各症状对诊断这些外感病因的贡献度和特异性。发现外感病因的证候要素是风邪、寒邪、热邪、湿邪、燥邪、疠气、外毒、疟邪和内伏风邪。还在这个数据库的基础上,采用非条件Logistic多元逐步回归方法,形成中医证候及其临床表现的知识库并编制“中医临床辅助诊断系统”软件,该软件只要输入患者的四诊信息,就可以概率的方式给出辨证结果。研究者输入《中医诊断学》心病证候的临床表现,比较软件和教材给出的辨证结果。根据比较结果,作者建议:
|
![]() ![]() |