摘要:本文对人工智能(artificialintelligence,AI)技术的机器学习算法,特别是传统机器学习和深度学习分析中医四诊信息以实现诊断智能化的应用和局限进行概述,并结合多源多模态信息处理、智能辨病辨证等探讨了智能诊断的发展现状,为智能决策的辅助诊疗提供基础。基于AI应用于中医诊断的适用性,分析目前中医诊断智能化赋能的技术难题,如缺乏四诊采集标准和大型带标注的先验数据集,缺乏多算法共建智能诊断模型的研究,以及对智能诊疗模型的疗效评价研究等,并详细分析解决路径,以期为中医诊断智能化应用提供发展方向。
1、机器学习算法迭代是辅助中医诊断智能化的关键
ML具有自主学习能力,并具备根据数据基数的增加而自动优化的优势[3]。ML借助合适的算法对已知训练集进行学习,分析潜在规律(如分布特征、类别属性等),以对新数据集进行分析和预测[4]。
目前,ML的各类算法经过长期更新迭代,主要基于特征学习方式、模型形式、适用数据范围的不同分为传统ML和深度学习(deeplearning,DL)算法。传统机器学习指基于手工设计特征工程的经典机器学习算法,如支持向量机、多层感知器网络、随机森林、决策树、k近邻、贝叶斯算法、聚类分析、集成学习等,其依赖于人工设计数据特征,对数据表示的要求高。随着大数据的广泛应用,以及传统机器学习在大数据规模计算和非结构化数据(图像、音频)处理上的技术疲软,DL飞速发展并广泛应用。DL是机器学习的方法之一,见图1,通过多层非线性运算提取数据的内在规律和层次特征,揭示未知数据的类别属性,主要算法包括卷积神经网络(convolutionalneuralnetworks,CNN)、循环神经网络(recurrentneuralnetwork,RNN)等。DL是ML的重要发展和延伸,通过特征自动学习和模型深化,在图像、音频等非结构化数据的识别和分析上较传统ML优势明显,且无需人为干预[5],ML和DL区别见图2。当前,互联网、云平台及大数据等联合构建的样本数据库对于DL精进算法、改良模型、提高识别精度最终实现中医智能化辅助诊疗至关重要[6]。
图1人工智能、机器学习、深度学习的关系示意图
图2传统机器学习和深度学习的区别示意图:以舌诊图像为例
2、机器学习在四诊信息单一数据源中的应用
2.1望诊与图像信息
中医望诊所获得的患者图像信息可以最直观地反映患者的外部症状,故素有“望而知之谓之神”之说。其中,望诊主要包括望舌和望面两部分。舌诊是中医诊断的重要组成部分,通过望舌质(神色形态)和舌苔(质色)可以揭示疾病的病位和病性[7],如《医门棒喝》所言“观舌本可验其阴阳虚实,审舌垢即知其邪之寒热浅深也”。然而受限于医者经验和流派等主观因素,传统舌诊有不可避免的模糊性和不确定性。因此,将AI技术用于舌象处理和模式识别,构建舌诊信息的智能识别分析系统确有必要。
随着DL理论的发展,CNN作为一种包含卷积计算且具有深层结构的前馈神经网络,具有良好的表征学习能力,无需人工设计特征提取,在图像识别和分类任务上优势明显,其鲁棒性和迁移学习能力优于传统的ML算法。因此望诊智能化是DL在中医辅助诊疗领域的一个重要突破点。目前CNN识别舌诊的流程如下(图3):(1)与传统ML方法相同,标准化采集舌图像,舌图像预处理,舌体分割。(2)设计、优化模型结构,并基于已标注的舌象数据测试集进行网络参数训练。(3)基于DL算法进行舌象分类,包括舌质舌苔等提取特征和分析。(4)结合中医舌诊知识库完成证候的推断。Zhou[15]在CNN网络的基础上提取舌图像的特征,这种方法在舌诊图像的体质分类识别上比传统ML准确率增加9%。
图3舌诊智能化辅助诊断流程图
总之,得益于传统ML算法的铺垫和DL的发展,计算机视觉对图像信息的处理和识别能力迎来高速发展。传统ML算法在小样本数据训练、避免过拟合风险等方面具有优势,但在大规模数据的处理上存在计算复杂度高,超参数难以调节等局限,同时对图像和音频等非结构化数据的处理依赖于人工标注的特征提取,无疑在增加成本的同时加大了人为误差。DL具有更高的识别精度及大规模数据处理能力,并有更优的鲁棒性和可迁移性,但DL极度依赖于训练数据的数量、质量及计算资源。因此,选择何种算法进行图像的AI诊断还需要结合具体的情境来决定。
2.2切诊与脉象信息
在脉诊客观化研究中,脉诊仪是关键所在,虽然传感器技术和分析算法不断更新迭代,但目前仍有一定问题:(1)多探头、数组式传感器技术尚未完全成熟[26]。(2)目前采集的脉象信息难以完全反映脉象四要素,不能准确体现中医脉诊的临床思维,因此目前仅适用于辅助医生诊断而不能独立辨病辨证[25]。(3)目前脉诊的AI辅助诊断主要局限于脉图信号分析算法,如传统ML算法的SVM、k-NN、DT、BP神经网络等[14]。总之,目前脉诊仪多用于科研和治未病用途,临床使用度有限,究其原因是这些设备没有超出医生的感知和诊断能力,受传感器采集信号的灵敏度和稳定性影响,其准确性、重复性等均有所限制[27]。
2.3闻诊与语音、气味信息
嗅诊本质是气味分子与受体作用产生物理震动或化学刺激的过程,但常温下医生嗅觉仅能识别有明显挥发的化学分子。电子鼻技术通过气味传感器阵列收集并识别单一或复杂气体,通过与气味图谱对比或者结合ML算法以预测气味属性[34,35]。宋镇贵[36]通过电子鼻收集气味信息,基于小波分析提取口腔气味的病理特征。刘英东[37]在此基础上结合电子鼻、信号处理及模式识别等技术,优化人工神经网络识别算法并构建病理气味的数据分析模型。目前嗅诊客观化研究临床报道较少,主要局限于口臭的分析,在脏腑病位识别与病性诊断方面还具有较大研究空间,是中医闻诊客观化研究方向之一。
总之,开展闻诊定性、定量的客观化研究是四诊合参现代化的途径,目前仍面临以下问题:(1)按照中医理论和诊断方法归类,西医的叩诊、听诊也应当归属于闻诊的体系中[38]。(2)目前声诊客观化研究对象主要局限于肺系病证,但根据五脏相音理论,声诊客观化应当具备识别五脏病位及辨别病性的能力,如依据肠鸣音识别脾胃系疾病、根据听诊信息识别心肺系统疾病,在声诊信息的证型量化上也可依据太息识别肝郁程度、呼吸深浅识别肾不纳气程度等[30]。(3)嗅诊能定性定量分析气味成分但却无法评价口臭、粪臭的程度,不同个体的气味成分标准差过大,因此大样本临床调查确有必要。(4)小样本研究报道涉及的指标特异性不强,在特征提取及ML算法识别分类上不具备代表性。因此,后续应当进一步规范声音采集和分析的标准,探索哪种声样适合分析哪些病证,再研究哪些元音或字句能与脏腑特征、中医证型对应。
2.4问诊与文本信息
通过问诊收集患者的病情资料,自古便是历代名医重视的四诊环节之一,“问而知之谓之工”,张景岳更是将问诊视为“诊病之要领,临证之首务”。然而在实际的临床问诊过程中,患者的症状、体征、证候等信息互相夹杂,数据维度高,并受患者主观感知,医者的知识储备、流派及经验等因素影响,导致问诊受主观性的影响最大。因此,完善问诊的客观化、标准化研究以减少主观因素对问诊信息收集及诊断造成的干扰,提升问诊的有效性、可靠性及科学性至关重要。
3、多源多模态信息处理
目前研发的四诊合参智能化系统虽然基于大规模临床数据建立,但并不具备临床医生的中医思维,缺乏独立演算能力。随着AI技术的发展,结合语音识别、自然语言处理及ML算法实现人机对话,并借助5G网络、云计算、大数据标注平台等构建异构、异标准、跨平台的AI辅助四诊合参技术是智能辨病辨证的发展基础,构建四诊信息多源采集、整合和分析的一体机是实现智能辨病辨证的路径之一[55]。
4、智能辨病与辨证
5、智能决策(专家系统和数据挖掘)
无论是专家系统还是数据挖掘,都是建立在数据的采集、提取和分析上,而不同医院、不同中医学术流派、不同时代的中医古籍与医案等数据千差万别,严重影响中医客观化、规范化进程中数据的稳定性、纯洁性及可重复性,暂未能实现局部统一的数据化。因此需要借助大数据技术促成中医药古籍、医案的电子化,将典籍和医案资料转化为规范化数据。同时,临床医疗需要构建更为统一和规范的信息采集与数据管理机制,借助信息化手段,先从区域医疗资源整合入手,逐步探索、解决全国医疗资源整合的难点问题,再转化为计算机语言可识别的结构化数据。对于数据信息的质量控制则应当构建开放、共享的区域医疗大数据平台,对中医临床病历、健康信息、生物样本等进行统一管理与整合。
6、存在问题及解决路径
6.1缺乏有效可靠的四诊信息采集和数据集作为算法和模型先验数据
因此,针对四诊信息采集问题,目前仍需要研制能够反映脉象四要素量化的多通道、多探头复合传感器;完善声诊的采集标准,基于中医嗅诊理论研发电子鼻气味采集系统,探索“声样-病证”与“气味-病证”的分析契合度;进一步完善中医症状体征术语规范,建立具有中医诊断特色的问诊信息采集量表和症状量化分级标准。总之,继续开展四诊名词术语标准、四诊仪器采集、操作规范等系列标准研究,建立新的四诊采集平台,构建大型标注数据集,为构建智能诊断的算法模型提供可靠的先验数据是基础性的工作与难题。
6.2多算法共建疾病智能诊断模型的研究范式尚未形成
中医智能化辨证主要基于四诊设备采集的症状体征信息与证候间的关联研究,但由于关联的非单一线性关系,采集的四诊客观化数据与证候间的关联便涉及复杂性、相对模糊性与多维性。因此,更需要通过综合多种AI技术和算法,形成一个稳定可行、多算法融合的“单类疾病-多种证候”智能诊断模型范式研究。
类似于冠心病心绞痛证候应证组合规律的研究[82],可通过引入疾病的证候要素作为症与证之间的智能化媒介,再运用多种算法构建模型来智能化辨证并按证候要素的权重以形成主次证候的复合诊断。例如,可以先基于聚类算法将疾病的临床主要症状聚类并确定证候要素及主要证候的组合特征。基于聚类分析存在的单分配问题,单纯以聚类算法的证候智能诊断无法符合中医理论指导下“证候-症状”的多对应特点。因此,随后采用贝叶斯网络对疾病临床医案的证型与症状的关联性进行分析,在智能辨证算法中间过程使用以提高辨证识别率。再通过判别分析与Logistic回归分析完成证候的鉴别诊断。在上述智能辨证过程中还可以通过证候要素的权重组合完成主次证候的复合诊断。比如可以采用因子分析降维方法和二分类Logistic回归分析研究证候量化和疾病不同分期的证候诊断,由于因子分析无法符合不同证候要素权重和组合特征下的个体差异,后续可以采用主成分分析来生成信息权重数和系统效应权数,消除变量间的共线性特征,实现证候要素不同重要程度信息的权重分析。通过上述多种算法结合可以建立更加符合中医理论指导下的“四诊症状体征信息群-证候要素-证候”的智能诊断模式。
6.3缺乏智能诊疗模型的疗效评价研究范式
目前,多数已发表的中医智能辅助诊疗系统均显示较好的目标任务识别与分类性能。但由于缺少对智能预测和决策的综合解释,无法得知结论的内在逻辑与可靠性,目前仍采用与领域专家推理过程和结论对比、离散式的准确率、回归率和ROC曲线下面积等对系统进行评价[83],而忽视了智能诊疗系统的临床疗效评价。因此需要结合中医和AI技术本身的特点来进行中医智能辅助诊疗模型的疗效智能化评价研究,此关键技术目前仍受技术基础能力限制。
智能化疗效评价同样分为个体和群体化疗效评价。群体化疗效应当借助循证医学最佳证据的临床决策和AI技术结合来评价疗效、安全性,并通过自主学习算法优化中医临床诊疗方案。个体化疗效评价可基于四诊客观化设备采集诊前、诊后的症状体征资料,依据中医药核心结局指标、目标成就、证候要素等变化,选用合适的ML算法构建分类器,先从重大疾病/慢病/优势病种的中医疗效智能化评价入手,为其他疾病智能辅助诊疗模型的个体化疗效智能评估提供思路。如贝叶斯网络能描述不定性问题间的因果联系,可以明确每一种干预措施与核心临床结局指标间的因果关系,以实现智能化中医疗效评价[84]。总之,深入理解AI和中医药学科的特点,从两者的思维方式来明确关联是智能化疗效评价的基础。
7、结语
随着AI与大数据等信息技术运用于中医智能化并产生新的辅助诊疗模式,本研究探讨了AI技术特别是传统ML和DL在中医四诊、多源多模态信息处理、智能辨病辨证等智能诊断中的运用,可为智能决策支持系统的辅助治疗提供支撑。但仍需重视AI为中医诊断赋能过程中的基础与技术性问题,如四诊采集标准和大型带标注的数据集等基础工作和难题;多算法集成的智能辨病辨证模型、针对智能决策诊疗支持的智能化疗效评价等技术难题尚处于起步阶段,还应当采取一切先进的技术与合适的方法来探索和开发。总之,解决中医智能诊断中的技术难题,构建中医智能诊断模型和相应的智能化疗效评价模型是助力中医药客观化进程、创造新时代AI式中医特色医疗体系的必经途径。
参考文献:
[1]孙忠人,游小晴,韩其琛,等.人工智能在中医药领域的应用进展及现状思考[J].世界科学技术-中医药现代化,2021,23(6):1803-1811.
[2]罗思言,王心舟,饶向荣.人工智能在中医诊断中的应用进展[J].中国医学物理学杂志,2022,39(5):647-654.
[3]李连新,杨璠,朱兆鑫,等.中医人工智能辨证研究现状与发展[J].世界科学技术-中医药现代化,2021,23(11):4268-4276.
[5]关菀,马志龙,徐春,等.深度学习技术在中医领域中的应用[J].中国卫生信息管理杂志,2022,19(2):281-285.
[7]吴欣,徐红,林卓胜,等.深度学习在舌象分类中的研究综述[J].计算机科学与探索,2023,17(2):303-323.
[11]陆萍.基于图像处理和模式识别的齿痕舌象研究[D].上海:华东理工大学,2014.
[18]朱龙,刘霏,靳枫.面部望诊客观化研究进展[J].贵州中医药大学学报,2020,42(4):76-81.
[19]刘媛,赵鹏程,陆小左.一种面诊图像的分割算法[J].电脑知识与技术,2017,13(26):183-185.
[20]赵文,张佳,徐佳君,等.四诊合参智能化发展现状及实现路径[J].中医杂志,2020,61(1):58-62.
[21]颜建军,陈松晔,燕海霞,等.基于递归图和卷积神经网络的脉象分析识别[J].计算机工程与应用,2020,56(7):170-175.
[22]张佳骕,顾林跃,姜少燕.基于卷积递归神经网络的血压测量模型[J].北京生物医学工程,2018,37(5):494-501.
[23]刘攀.基于HHT和多分类支持向量机的脉象信号分析与研究[D].上海:华东理工大学,2015.
基金资助:国家自然科学基金面上项目(82174278);广东省重点领域研发计划项目(2020B1111100001);广州市中医方证重点实验室(202102010014);