〖治学探微〗数据挖掘方法在名老中医用药规律研究中的应用

名老中医具有丰富的临床诊疗经验,是中医学术的带头人。名老中医临床经验、用药规律和学术思想的总结与传承不仅能丰富中医学的理论体系,还能推动中医学术的进步和理论创新,也是培养新一代名中医的重要途径之一。名老中医组方用药规律研究是中医药总结和发展的核心内容之一。中医处方信息数据错综复杂,方剂配伍包含了病-证-方-药-量的多维关联,其本质就存在一种数据关系,具有模糊性、复杂性和非线性动态变化的特性,符合数据处理的要求和特征。

数据挖掘又称数据库知识发现,是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含的、人们事先未知的但又潜在有用的并且最终可理解的信息和知识的过程[1]。采用数据挖掘技术对名老中医用药规律进行研究,人机交互,反复多次,可总结归纳名老中医用药特点,指导临床实践并提高临床疗效;同时以药物为连接点进一步探讨疾病的治则治法、病因病机、方药配伍机制,还可提炼出临证经验中蕴藏的新理论、新方法、新知识,实现名医经验的有效总结与传承。本文通过对数据挖掘方法在名老中医用药规律研究中的应用进行评述,希冀为数据挖掘方法在名老中医用药规律及经验传承领域的进一步深入应用提供参考。

一、关联规则分析

关联规则分析是中医临床资料研究中运用最广泛、最成熟的数据挖掘方法,可见于病-证-症-药之间关联的研究。关联规则分析的优点是非常简单,其分析结果常以类似产生式规则的形式表达,相对比较清晰直观,因而更容易被解释和理解。但其在用药规律的挖掘中也存在一些问题,如高置信度、低支持度的关联规则发现效率低,不能确定“相互依赖”的规则,找到的强规则并不一定是有趣的、甚至是错误的。针对以上问题有学者提出双向关联规则挖掘算法用于用药规律研究,同时将分析结果与临床经验互相印证,能得到有意义的药组及药对[9]。

二、聚类分析

聚类分析过程中没有一个已知类别归属的学习样本集,是一种无监督学习,因此,可以避免传统分类方法的人为主观性。对于名老中医用药规律研究而言,它可以从药物客观属性(四性、五味、归经、功效)出发,将药物分成不同的类别,并获得具有临床治疗意义的基础方。但其在实际应用中也存在一定问题,如聚类分析不具有线性的计算复杂度,难以适用于样本量庞大的数据库;无法利用数据类别归属的先验知识,其结果的测试和验证较为复杂;预先输入参数例如希望产生类的数目及不同的聚类算法对聚类分析结果的影响较大。聚类算法的选择取决于数据的类型、聚类的目的及应用,可以对同样的数据尝试多种算法,以发现数据可能揭示的结果。针对不同分析结果,需征求名老中医反馈意见,将客观的数据结果与主观的思想结合,最终得到具有临床指导意义的基础方。

三、因子分析

四、无尺度网络

无尺度网络(scale-freenetworks)是最为经典的复杂网络模型之一,是指网络的节点度分布满足幂律分布[19]。研究表明,中医理论指导下的复方配伍过程具有无尺度复杂网络现象[20],无尺度网络分析为名老中医复方配伍、药物相互作用等的研究提供了依据。高剑虹等[21]应用无尺度网络模型分析方法探讨方和谦治疗肝郁脾虚证药物配伍规律,结果发现,位于网络中心的药物即核心药物为党参、炒白术、茯苓、当归、香附、柴胡、炒白芍、炙甘草、紫苏梗、大枣、薄荷、生姜,加减应用频次较高的药物种类有补肾滋阴药、理气和胃药、清热散结药、滋养胃阴药。郭旸等[22]基于无尺度网络方法对戴希文治疗慢性肾脏病用药经验进行研究,得出处方配伍网络及网络药物关联频度信息,总结出核心方药15味,随证加减18组,结果体现出戴希文诊治慢性肾脏病扶正祛邪的治疗总则及扶正不壅补的用药特点。

无尺度网络以处方为基础,以处方中药物为节点,以药物间配伍关系为边,边的权重表示两药物间配伍的频度,建立药物配伍网络图,分析得出核心药物组成及处方配伍规律。无尺度网络的优势在于可以提供图示化、直观化的药物配伍关联图,其结果更具可读性。但同时也应当注意到无尺度网络在名老中医用药规律研究中可能存在的问题,例如在实际研究中样本太少或取样偏差会导致对网络结构的错误认识等。

五、展望

如上所述,关联规则、聚类分析、因子分析、无尺度网络数据挖掘方法在名老中医用药规律的研究中发挥着重要作用,是全面深入挖掘名老中医的临床经验、用药特点及学术思想的有力工具。在数据挖掘过程中应遵循“人机结合、以人为主”的原则,在数据挖掘方法的选择上应根据研究目的的不同选择最科学有效的挖掘方法,综合考虑各种方法的优点、缺点和适用范围,取长补短、联合应用,比较分析结果,将最终提炼的成果在实践中反复验证,从而提高研究结果的可靠性、科学性。

【参考文献】

[1]张云涛,龚玲.数据挖掘原理与技术[M].北京:电子工业出版社,2004:1.

[2]曾孝文.关联规则数据挖掘方法的研究[J].计算机与现代化,2006(9):90-92,96.

[3]苏新宁,杨建林,江念南,等.数据仓库和数据挖掘[M].北京:清华大学出版社,2006:116-150.

[4]黄玉华,柴松岩,张德政,等.基于关联规则的柴松岩治疗多囊卵巢综合征用药规律研究[J].中国中医药信息杂志,2012,19(5):23-26.

[5]徐建龙,聂莉芳.基于关联规则的聂莉芳教授治疗IgA肾病用药规律分析[J].中国中医药信息杂志,2010,17(4):96-98.

[6]赵宇明,尤海燕,刘哲,等.基于数据挖掘的王庆国教授对刘渡舟教授用药传承规律的研究[J].北京中医药大学学报,2012,35(5):293-296.

[7]吴嘉瑞,赵梦迪,郭位先,等.基于数据挖掘的孟河名医杨博良治疗月经病用药规律研究[J].中华中医药杂志,2014,29(10):3086-3089.

[8]张北华,高蕊,李振华,等.中医药治疗慢性胃炎的专家经验数据挖掘分析[J].中医杂志,2015,56(8):704-708.

[10]何清波,苏炳华,钱元.医学统计学及其软件包[M].上海:上海科学技术文献出版社,2003:285.

[11]王祖龙,李晖,孙红.褚玉霞治疗先兆流产用药经验分析[J].中国中医基础医学杂志,2011,17(10):1108-1109.

[12]闫禹竹,程为平,毕述玥,等.基于数据挖掘方法分析程为平教授治疗癫痫的用药经验[J].中医药学报,2014,24(3):42-44.

[13]许金海,邬学群,叶洁,等.基于聚类分析的施杞教授治疗腰椎间盘突出症的用药规律研究[J].中国中医骨伤科杂志,2013,21(3):20-24.

[14]田野,李舒.战丽彬治疗恶性肿瘤用药规律的数据挖掘分析[J].中医杂志,2014,55(8):657-660.

[15]孙振球,徐勇勇.医学统计学[M].北京:人民卫生出版杜,2002:26.

[17]陈亮,张寅,杜娜,等.运用因子分析探讨丁霞教授治疗慢性胃炎的用药规律[J].中华中医药杂志,2014,29(8):2489-2492.

[18]郭闫葵,郭松霞,高琛,等.浦家祚教授辨治眩晕用药规律研究[J].中国中医药科技,2014,21(1):14-15.

[19]BARABASIAL,ALBERTR,JEONGH.Mean-fieldtheoryforscale-freerandomnetworks[J].PhysicalA,1999,272:173-187.

[20]周雪忠,刘保延,王映辉,等.复方药物配伍的复杂网络方法研究[J].中国中医药信息杂志,2008,15(1):98-100.

[21]高剑虹,李文泉,范春琦,等.方和谦治疗肝郁脾虚证中药配伍规律研究[J].北京中医药,2013,32(2):95-98.

[22]郭旸,饶向荣,张润顺.基于无尺度网络方法总结戴希文治疗慢性肾脏病经验[J].中国中医药信息杂志,2011,18(7):26-28.

[23]吴嘉瑞,唐仕欢,郭位先,等.基于数据挖掘的名老中医经验传承研究述评[J].中国中药杂志,2014,39(4):614-617.

THE END
1.数据挖掘机器之心1993年Quinlan提出的C4.5,是数据挖掘中最简单常用的决策树算法之一。其他的决策树算法还有CART,由Breiman于1984年提出,它是一种基于树的分类和预测方法,模型使用简单,易于理解(规则解释起来更简明易)。 类似的还有K-means算法,它最初在1955年由Steinhaus提出,在众多不同的科学邻域被发现。时至今日,K-means仍然是最https://www.jiqizhixin.com/graph/technologies/7904de1e-5ab5-4f0a-aa60-693cb2978766
2.数据挖掘的四种基本方法数据挖掘的四种基本方法 东奥美国注册管理会计师 2024-12-06 14:51:12 遗传算法 遗传算法是一种依据微生物自然选择学说与基因遗传原理的恣意优化算法,是一种仿生技能全局性提升办法。遗传算法具有的暗含并行性、便于和其他实体模型交融等特性促使它在数据发掘中被多方面运用。https://www.dongao.com/cma/zy/202406204447292.html
3.常见的数据挖掘方法有哪些帆软数字化转型知识库常见的数据挖掘方法包括分类、聚类、关联规则、回归分析、时间序列分析、神经网络、决策树、贝叶斯网络。这些方法在数据挖掘中各有千秋。分类用于将数据划分到预定义的类别中、聚类则是将数据点分组成自然簇、关联规则挖掘有助于发现数据之间的有趣关系、回归分析用于预测数值型数据、时间序列分析用于处理时间相关的数据、https://www.fanruan.com/blog/article/615481/
4.数据挖掘的常用方法都有哪些?在数据分析中,数据挖掘工作是一个十分重要的工作,可以说,数据挖掘工作占据数据分析工作的时间将近一半,由此可见数据挖掘的重要性,要想做好数据挖掘工作需要掌握一些方法,那么数据挖掘的常用方法都有哪些呢?下面就由小编为大家解答一下这个问题。 首先给大家说一下神经网络方法。神经网络是模拟人类的形象直觉思维,在生物http://api.cda.cn/view/26507.html
5.下面()不是数据挖掘的常用方法。A.关联规则挖掘B.分类分析C下面( )不是数据挖掘的常用方法。 A.关联规则挖掘B.分类分析C.聚类分析D.结构化开发热门考试 高考 一级建造师 二级建造师 初级经济师 中级经济师 教师资格证 企业法律顾问 注册会计师CPA 中级会计师 考研 百度题库 百度题库旨在为考生提供高效的智能备考服务,全面覆盖中小学财会类、建筑工程、职业https://tiku.baidu.com/web/singledetail/a333e9d8d15abe23482f4db6?tosite=wenkutiku1
6.两种最为常用的数据挖掘方法论51CTO博客导读:本文介绍两种最为常用的数据挖掘方法论——CRISP-DM方法论和SEMMA方法论。 01 CRISP-DM方法论 CRISP-DM方法论由NCR、Clementine、OHRA和Daimler-Benz的数据挖掘项目总结而来,并被SPSS公司大力推广。CRISP-DM方法论将数据挖掘项目的生命周期分为6个阶段,分别是商业理解、数据理解、数据准备、建模、评估和准备工作,https://blog.51cto.com/u_13389043/6250220
7.数据挖掘中常用的数据清洗方法数据的合法性,比如数据与常识不符,市区内开车速度到达了400km/h 数据的一致性,比如不同来源的不同指标,实际的内涵与表示意义是一样的 数据清洗的结果是对各种脏数据进行对应标准的干净的、连续的数据,提供给数据统计、数据挖掘等使用。 1、数据完整性问题 https://www.jianshu.com/p/c2b15fcf7100
8.数据挖掘常用分析方法与算法研究.pdf臂浇兆踞玖勉晌揣捆彰宫甸捻厂去荡数据挖掘常用分析方法与算法研究椽啪础谩吊瘩硫飞啪屈次孽谜犀媒尘芳扔针制气估盎捷赊募卤驰禽颜该娘须十很苗静辣贡映府灭详眩俘纸制反榔亩沙俊堕栈西厩屋建余玻哲只瞬消俺勿蔬脾挝恕抑购扔凭搏兼轿箕公键作蛔兑惟部计抓纺苦石赏郁尧谋恐无躲斌贿穿咸规削图https://max.book118.com/html/2017/0629/118893352.shtm
9.数据挖掘之七种常用的方法经管文库(原现金交易docx 203.39 KB0个论坛币 GDP和人均GDP平减说明.xls 27 KB0个论坛币 关键词:数据挖掘 https://bbs.pinggu.org/thread-13312809-1-1.html
10.常用的数据分析方法论有哪些数据分析就是将收集到的数据通过加工、整理和分析的过程,使其转化为信息,通常来说,数据分析常用的方法有PEST分析法;5W2H分析法;逻辑树分析法;描述统计法;方差分析法;时间序列分析法。 1、PEST分析法 PEST分析是战略咨询顾问用来帮助企业检阅其外部宏观环境的一种方法。是指宏观环境的分析 https://36kr.com/p/1485598311399560
11.数据挖掘与分析的六种经典方法论最近梳理了一下数据挖掘与分析的常用方法论,这里简要介绍6种模型。 1、CRISP-DM 模型 CRISP-DM是CrossIndustry Standard Process for Data Mining(跨行业数据挖掘标准流程)的字母缩写。CRISP-DM是由一家欧洲财团(时称SIG组织)在20世纪90年代中后期提出来的,是一套用于开放的数据挖掘项目的标准化方法,也是业内公认https://www.niaogebiji.com/article-30475-1.html
12.知识学习笔记异常检测概述集成是提高数据挖掘算法精度的常用方法。集成方法将多个算法或多个基检测器的输出结合起来。其基本思想是一些算法在某些子集上表现很好,一些算法在其他子集上表现很好,然后集成起来使得输出更加鲁棒。集成方法与基于子空间方法有着天然的相似性,子空间与不同的点集相关,而集成方法使用基检测器来探索不同维度的子集,将这些https://maimai.cn/article/detail?fid=1681725773&efid=LlA7mSgbubGa3CMUFD6t0w
13.摩托车半热熔胎使用时需要注意哪些事项?适用于高速行驶的场合本文利用网络爬虫技术,从互联网上收集了大量的与摩托车半热熔轮胎相关的数据,数据包括半热熔轮胎的品牌、型号、价格、性能参数等方面的信息,在收集数据的过程中,需要注意数据的准确性和完整性,并对数据进行清洗和预处理。 关联规则是数据挖掘中的一种常用方法,用于发现数据之间的关联性和规律性,关联规则挖掘可以帮助我https://www.dongchedi.com/article/7233349793031045647
14.Web日志挖掘中一种改进的会话识别方法AET本文主要研究数据预处理阶段的会话识别。在分析现有的会话识别方法基础上,提出一种基于访问站点首页和导航页的改进会话识别方法,最后通过实验验证了改进的会话识别方法比现有方法更有效。 1 数据预处理 数据预处理是Web日志中最基础、最频繁的工作,是整个数据准备的核心工作。数据预处理的结果将直接影响到挖掘算法产生的http://www.chinaaet.com/article/76480