名老中医具有丰富的临床诊疗经验,是中医学术的带头人。名老中医临床经验、用药规律和学术思想的总结与传承不仅能丰富中医学的理论体系,还能推动中医学术的进步和理论创新,也是培养新一代名中医的重要途径之一。名老中医组方用药规律研究是中医药总结和发展的核心内容之一。中医处方信息数据错综复杂,方剂配伍包含了病-证-方-药-量的多维关联,其本质就存在一种数据关系,具有模糊性、复杂性和非线性动态变化的特性,符合数据处理的要求和特征。
数据挖掘又称数据库知识发现,是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含的、人们事先未知的但又潜在有用的并且最终可理解的信息和知识的过程[1]。采用数据挖掘技术对名老中医用药规律进行研究,人机交互,反复多次,可总结归纳名老中医用药特点,指导临床实践并提高临床疗效;同时以药物为连接点进一步探讨疾病的治则治法、病因病机、方药配伍机制,还可提炼出临证经验中蕴藏的新理论、新方法、新知识,实现名医经验的有效总结与传承。本文通过对数据挖掘方法在名老中医用药规律研究中的应用进行评述,希冀为数据挖掘方法在名老中医用药规律及经验传承领域的进一步深入应用提供参考。
一、关联规则分析
关联规则分析是中医临床资料研究中运用最广泛、最成熟的数据挖掘方法,可见于病-证-症-药之间关联的研究。关联规则分析的优点是非常简单,其分析结果常以类似产生式规则的形式表达,相对比较清晰直观,因而更容易被解释和理解。但其在用药规律的挖掘中也存在一些问题,如高置信度、低支持度的关联规则发现效率低,不能确定“相互依赖”的规则,找到的强规则并不一定是有趣的、甚至是错误的。针对以上问题有学者提出双向关联规则挖掘算法用于用药规律研究,同时将分析结果与临床经验互相印证,能得到有意义的药组及药对[9]。
二、聚类分析
聚类分析过程中没有一个已知类别归属的学习样本集,是一种无监督学习,因此,可以避免传统分类方法的人为主观性。对于名老中医用药规律研究而言,它可以从药物客观属性(四性、五味、归经、功效)出发,将药物分成不同的类别,并获得具有临床治疗意义的基础方。但其在实际应用中也存在一定问题,如聚类分析不具有线性的计算复杂度,难以适用于样本量庞大的数据库;无法利用数据类别归属的先验知识,其结果的测试和验证较为复杂;预先输入参数例如希望产生类的数目及不同的聚类算法对聚类分析结果的影响较大。聚类算法的选择取决于数据的类型、聚类的目的及应用,可以对同样的数据尝试多种算法,以发现数据可能揭示的结果。针对不同分析结果,需征求名老中医反馈意见,将客观的数据结果与主观的思想结合,最终得到具有临床指导意义的基础方。
三、因子分析
四、无尺度网络
无尺度网络(scale-freenetworks)是最为经典的复杂网络模型之一,是指网络的节点度分布满足幂律分布[19]。研究表明,中医理论指导下的复方配伍过程具有无尺度复杂网络现象[20],无尺度网络分析为名老中医复方配伍、药物相互作用等的研究提供了依据。高剑虹等[21]应用无尺度网络模型分析方法探讨方和谦治疗肝郁脾虚证药物配伍规律,结果发现,位于网络中心的药物即核心药物为党参、炒白术、茯苓、当归、香附、柴胡、炒白芍、炙甘草、紫苏梗、大枣、薄荷、生姜,加减应用频次较高的药物种类有补肾滋阴药、理气和胃药、清热散结药、滋养胃阴药。郭旸等[22]基于无尺度网络方法对戴希文治疗慢性肾脏病用药经验进行研究,得出处方配伍网络及网络药物关联频度信息,总结出核心方药15味,随证加减18组,结果体现出戴希文诊治慢性肾脏病扶正祛邪的治疗总则及扶正不壅补的用药特点。
无尺度网络以处方为基础,以处方中药物为节点,以药物间配伍关系为边,边的权重表示两药物间配伍的频度,建立药物配伍网络图,分析得出核心药物组成及处方配伍规律。无尺度网络的优势在于可以提供图示化、直观化的药物配伍关联图,其结果更具可读性。但同时也应当注意到无尺度网络在名老中医用药规律研究中可能存在的问题,例如在实际研究中样本太少或取样偏差会导致对网络结构的错误认识等。
五、展望
如上所述,关联规则、聚类分析、因子分析、无尺度网络数据挖掘方法在名老中医用药规律的研究中发挥着重要作用,是全面深入挖掘名老中医的临床经验、用药特点及学术思想的有力工具。在数据挖掘过程中应遵循“人机结合、以人为主”的原则,在数据挖掘方法的选择上应根据研究目的的不同选择最科学有效的挖掘方法,综合考虑各种方法的优点、缺点和适用范围,取长补短、联合应用,比较分析结果,将最终提炼的成果在实践中反复验证,从而提高研究结果的可靠性、科学性。
【参考文献】
[1]张云涛,龚玲.数据挖掘原理与技术[M].北京:电子工业出版社,2004:1.
[2]曾孝文.关联规则数据挖掘方法的研究[J].计算机与现代化,2006(9):90-92,96.
[3]苏新宁,杨建林,江念南,等.数据仓库和数据挖掘[M].北京:清华大学出版社,2006:116-150.
[4]黄玉华,柴松岩,张德政,等.基于关联规则的柴松岩治疗多囊卵巢综合征用药规律研究[J].中国中医药信息杂志,2012,19(5):23-26.
[5]徐建龙,聂莉芳.基于关联规则的聂莉芳教授治疗IgA肾病用药规律分析[J].中国中医药信息杂志,2010,17(4):96-98.
[6]赵宇明,尤海燕,刘哲,等.基于数据挖掘的王庆国教授对刘渡舟教授用药传承规律的研究[J].北京中医药大学学报,2012,35(5):293-296.
[7]吴嘉瑞,赵梦迪,郭位先,等.基于数据挖掘的孟河名医杨博良治疗月经病用药规律研究[J].中华中医药杂志,2014,29(10):3086-3089.
[8]张北华,高蕊,李振华,等.中医药治疗慢性胃炎的专家经验数据挖掘分析[J].中医杂志,2015,56(8):704-708.
[10]何清波,苏炳华,钱元.医学统计学及其软件包[M].上海:上海科学技术文献出版社,2003:285.
[11]王祖龙,李晖,孙红.褚玉霞治疗先兆流产用药经验分析[J].中国中医基础医学杂志,2011,17(10):1108-1109.
[12]闫禹竹,程为平,毕述玥,等.基于数据挖掘方法分析程为平教授治疗癫痫的用药经验[J].中医药学报,2014,24(3):42-44.
[13]许金海,邬学群,叶洁,等.基于聚类分析的施杞教授治疗腰椎间盘突出症的用药规律研究[J].中国中医骨伤科杂志,2013,21(3):20-24.
[14]田野,李舒.战丽彬治疗恶性肿瘤用药规律的数据挖掘分析[J].中医杂志,2014,55(8):657-660.
[15]孙振球,徐勇勇.医学统计学[M].北京:人民卫生出版杜,2002:26.
[17]陈亮,张寅,杜娜,等.运用因子分析探讨丁霞教授治疗慢性胃炎的用药规律[J].中华中医药杂志,2014,29(8):2489-2492.
[18]郭闫葵,郭松霞,高琛,等.浦家祚教授辨治眩晕用药规律研究[J].中国中医药科技,2014,21(1):14-15.
[19]BARABASIAL,ALBERTR,JEONGH.Mean-fieldtheoryforscale-freerandomnetworks[J].PhysicalA,1999,272:173-187.
[20]周雪忠,刘保延,王映辉,等.复方药物配伍的复杂网络方法研究[J].中国中医药信息杂志,2008,15(1):98-100.
[21]高剑虹,李文泉,范春琦,等.方和谦治疗肝郁脾虚证中药配伍规律研究[J].北京中医药,2013,32(2):95-98.
[22]郭旸,饶向荣,张润顺.基于无尺度网络方法总结戴希文治疗慢性肾脏病经验[J].中国中医药信息杂志,2011,18(7):26-28.
[23]吴嘉瑞,唐仕欢,郭位先,等.基于数据挖掘的名老中医经验传承研究述评[J].中国中药杂志,2014,39(4):614-617.