心房颤动(房颤)是最常见的心律失常之一,现全世界房颤患者众多,且随年龄增大,发病率上升。但是目前的辅助检查对于房颤的诊断率较低,鉴于人工智能(AI)广泛地运用到医学领域中,用AI诊断房颤也成为了研究热点。本文简单介绍了AI及其在房颤中的应用。
正文
与此同时,由于互联网、云计算的发展,大数据时代使人工智能(artificialintelligence,AI)成为了可能并且迅猛发展。AI企图了解智能的实质,并生产出一种新的能以人类智慧相似方法做出反应的智能机器。现医疗使用较多的主要是自动语音识别、决策系统、影像分析、机器人、专家系统。鉴于AI强大的预测潜能,我们可以将其利用在房颤识别和预测方面,能够使临床实践变得更加有效、方便、个性化。
1与传统数据分析比较
统计学强调推断,机器学习(machinelearning,ML)强调预测。统计学方法核心是依据样本和人口学参数进行推断总体,我们需要先假设成立,再依据P值和检验方法判断此项是否成立而比较。然而AI和ML主要在算法的基础上,利用数据结构进行预测和推断。但是我们不应该将统计学和ML划分明确的界限,它们都属于同一类,只是用于处理不同的问题。
2人工智能
AI是计算机科学的一个分支,使机器和计算机系统模仿人类智力处理问题,包括ML、深度学习(deeplearning,DL)等(图1)。
图1数据科学中常用术语的文氏图
2.1机器学习
ML是聚焦计算机如何从数据中学习的科学技术。它由统计学(寻找数据关系)和计算机科学(强调有效的计算机算法)的交互作用产生。其研究使计算机依靠经验学习不断优化自身性能,达到真实模拟人类学习的目的。ML的过程大致分为数据预处理、特征选择、数据分类、模型训练及优化。
2.2深度学习
DL是ML中的一个新研究领域,目的在于构建类似人脑的神经网络。神经网络含有多隐层的多层感受器,通过组合较低层输出形成更加抽象的高层表示属性类别或特征。这种多层非线性运算模型,可采用从大量数据中学习有效的特征表示,广泛用于分类、回归等问题中。其包括人工神经网络、卷积神经网络等。
2.2.1人工神经网络(artificialneuralnetwork,ANN)
人脑中有大量的神经元细胞和神经纤维,一个神经元发出多根轴突连接其它多个神经元,无数神经元之间互连形成错综复杂的网络。ANN基于此基本原理,形成一种模拟人脑组合众多信号计算单元的数学模型,对复杂信息能够简单统筹地处理。ANN由大量处理单元(神经元)构成(图2),这些神经元排列成多层结构,层间神经元通过一定的权值(weight)互相连接,输入数据通过隐喻层的处理而产出相应结果。
图2人工神经网络
Inputlayers:输入层;Hiddenlayers:隐藏层;Outputlayers:输出层;箭头表示神经元间的连接权值和信号传输的方向;神经元间的权值决定了该神经元接受的信号强度;单个神经元模型代表一个输出函数,接受前层多个信号
2.2.2卷积神经网络(convolutionneuralnetwork,CNN)
在众多的DL模型中,CNN是应用最为广泛的一类。其仿造生物的视知觉机制,通过多次卷积计算,在图像、音频数据集特征提取分类方面,依靠其认知模式能力得到不错的结果。CNN不需要输入和输出之间精确的数学表达关系,却能够有效地学习两者之间的非线性映射关系(图3)。
图3卷积神经网络
Convolution:卷积层;Pooling:池化层;Fully-connected:全连接层;卷积层由多个特征面构成,每个特征面有多个神经元,每个神经元以一定的权值与上一层中的局部区域相连;池化层中的神经元与卷积层的局部区域相连,起到二次提取的作用;全连接层整合前面所有层中具有类别区分性的局部信息;最后通过输出层得到每个类别的后验概率
2.3机器学习技术
尽管ML有很多策略和技术,但主要分为3种(图4):监督式学习(supervisedlearning)、无监督式学习(unsupervisedlearning)和强化学习(reinforcementleaning)。
图4机器学习技术
2.3.1监督式学习
监督式学习可由训练资料中学习到或建立一个模式,并依此模式推测新的实例。监督式学习的任务就是依靠正确标签的训练资料,得到任何可能出现的输入值的输出,输出可能是预测或者是分类。比如c给定一系列事先标签好的ECG数据训练,最终得到的模型便可以用来判断新的ECG是否属于正常。
2.3.2无监督式学习
无监督式学习不需要预测结果,主要集中发现数据中不同变量之间基本的结构和关系。这种方法输入数据是不带标签的,输出数据也是未知的,系统也会依靠输入数据的基础寻找特定的模式。聚类分析是无监督式学习常用的算法,将研究对象按照一定的规则或标准分成不同的类别,每一类别都有其相应的特征。
2.3.3强化学习
强化学习,又称再奖励学习,通过给定的输入数据和结果循环试验来学习行为。它包括有一个可以实时作用于环境的智能体(Agent)。当环境接受一个由Agent发出的动作后,其状态发生变化,同时产生一个强化信号反馈给Agent,Agent根据强化信号和环境当前状态再选择下一个动作(图5)。
图5强化学习示意图
目前AI在房颤方面的应用主要有两个方面,一是利用大量ECG数据进行模拟医生分类和判别房颤;二是收集患者的基线资料来预测房颤。由于无症状性或阵发性房颤患者日益增多,仅靠我们做短时程的ECG检测已经不能够做出最正确的判断。因此利用数据训练算法的研究已经呈井喷式发展。
3.1利用心电图检测并预测房颤
因CNN在图像处理和特征提取方面的优势,便主要利用它来作为研究对象。绝大数研究使用监督式学习的CNN,且其中的步骤大致相同,即ECG数据预处理、特征提取和分类算法模型。通过识别ECG信号的ML技术已经取得了较大的成功和进步。目前的研究一般基于以下几点来对ECG特征进行提取。
3.1.1基于心电图波形
除了特征性的P波改变,对于ECG其它特征,例如QRS、T波等,也被考虑为可提取的特征供算法学习。Dai等提出了一种在提取心房活动时减少QRS波残留的新型方法,在识别房颤中得到较高的准确性。Khamis等将QRS波、T波形态纳入学习的范围,用5920份ECG训练算法,因综合了多种特征变量,最终平均F1比值为0.78。研究中所描述的特征和方法,其性能具有可比性并且未发生过拟合现象。ECG上波形复杂,除了明显的PQRST波以外,甚至可能存在人类无法察觉的不明显波形,却能被机器捕捉乃至成为决定性因素,这需要人们进一步的探索和验证。
3.1.2基于心率变异性
3.1.3基于心电图时程
3.1.4基于心电图导联
通常我们采用8导联或12导联ECG记录心脏在各个方向上的电信号。大多数研究都是将患者12导联ECG数据输入模型中。但是Chen等依然使用CNN,经过训练后发现使用单导联ECG数据所得到的模型性能只比使用全导联ECG的模型性能逊色一点。通常aVR导联在临床中容易被忽略,但是在该研究中其对于心律失常的检测综合性能是最优的。目前很多研究采用的数据均为单导联短时程,这不仅去除了过多干扰信号,还能够减少机器处理的数据量,加快了机器的整体速度。从不同导联入手,不断试验机器性能,或许也是行之有效的。
因此我们可以从该方面利用ECG数据来进行分析和预测,同时ML有相应的能力去处理我们想要处理的具体数据。
3.2利用基线数据预测房颤
非监督式学习的聚类算法虽然没有监督式学习的算法使用广泛,但是由于现如今患者生活习惯和个体特征大相径庭,统一模版型的治疗或许不再适应每个人,更好地识别高危患者加以早期干预,或许是无监督式学习的应用所在。
4前景
除此之外,房颤的发生通常因为心房的异位起搏点,导管射频消融是治疗方法之一。现利用AI技术不仅可以识别异位起搏点,还可以在射频消融过程中,利用AI三维重建技术,进行消融指数的自动化计算,实现更加充分、有效的治疗。当然,房颤发生有众多的机制,电生理机制、自主神经系统的作用、遗传学基础等,我们期望未来可以借助AI更加深入地了解房颤。
5问题和局限性
5.1数据问题
5.2机器学习中的黑匣子
机器的不透明性和难解释性是一个重要的问题。我们输入数据得到输出结果,称为预测。但是为什么机器会得到想要的结果,我们是不清楚的。尽管有许多方法技术解释了模型的结果,通过分析具体的参数和特征之间的权重来证实其正确性,强调了每一个预测结果最具区别的部分,但是我们还是不能够确切地知道ML和DL为何就能够做出正确的决策。医学领域中,疾病的诊断是有因果可循的,医生还是更加愿意相信自己多年的临床经验,从临床症状、直接的辅助检查来逻辑推理出正确的结果。因为没有生物学上的可靠依据,想要掌握推广AI技术也实属难事。
5.3泛化问题
拟合一直是ML亟待解决的问题。虽然现在有很多研究都取得了不错的结果,敏感性、特异性、准确性等都很高,但是不能够代表此研究训练出来的模型可以推广。许多方法仅仅使用来自一个数据库的数据进行训练和测试,如MIT/BIH数据库甚至更小型的数据库。来自单个数据库的数据可能并不能很好地全面评估一个算法的表现力。诊断和监控房颤的算法需要能够尽可能的泛化,同时还要有高特异性和高敏感性,但目前许多算法并不能满足所有的要求。
5.4伦理问题
伦理一直是医学非常重视的方面。设想一个依靠ML诊断的患者发生了医疗事故,随后责任归属便出现了分歧。除此之外,数据必然包含了患者的隐私和临床信息。因此,合法使用这些信息也是重要的方面。尽管现在有了相应的法律法规,比如将患者的个人信息用于统计学目的是被允许的,但是出于尊重,在这些信息用于训练诊断和决策的AI模型之前,患者都应该有知情权。
5.5其它
目前AI还处于初级阶段,还有很多技术不成熟,加之基本都是程序设计师在构建模型,而临床医生鲜有参与。现在的AI是基于国际开源的一些模型,所以应用局限于语音图像识别;整个设计依靠现代简单的数学逻辑,难以构建遵循临床医学规律的具备逻辑推理能力的数据模型,因此对于房颤这类临床疾病预测是有潜在干扰的。AI应用在基层医疗理论上是可行的,但是许多基层医生对于机器得出的结果有时难以抉择,对疾病的准确诊断存在一定风险。
6结语
AI看起来遥不可及,然而它已经渗透到医疗领域的方方面面。由于云计算、大数据的快速发展,医学乘上时代的快车,利用AI来为医务人员和患者服务。随着ML、DL技术的发展和应用,患者在利用常规辅助检查诊断时,可以考虑使用AI来预测和识别房颤。对于患者来说,能早期识别房颤、降低卒中等并发症的发生率、明显改善预后、提高生活质量;对于医生来说,能早期识别疾病、尽早加以干预、调整治疗方案,同时还能减轻工作负担。但是,在AI广泛应用到临床实践之前,我们还有很长的一段路要走。算法模型的各种问题亟待解决,同时也要求医疗人员去了解掌握数据科学并参与其中的构建,这样医生才能足够信任机器去替代自己进行一部分工作。