2、什么是人工智能?有什么不同的地方吗?
人工智能是一个高级的概念性术语(conceptualterm),它描述的是在机器中模仿“自然智能”(naturalintelligence)的运动。机器学习被认为是一组可以使机器更加“智能”的统计工具。
3、机器学习中有哪些方法?
应用于神经成像的最流行的机器学习技术可以分为两大类:有监督(supervised)和无监督(unsupervised)学习。有监督学习需要被标记的数据(labelleddata,例如已被标记或分类的数据),而无监督方法则是检测未标记数据中的模式。不同的机器学习方法在其复杂性方面也有所不同。这两种类型的机器学习方法都可以从相当简单的线性模型到更复杂的非线性算法。模型越复杂,所需的计算能力(computationalpower)就越强。
下面我们将讨论有监督和无监督学习的一些重要方法。我们还将讨论一些脑成像研究中独有的方法,如多体素模式分析(multivoxelpatternanalysis,MVPA)。
3.1有监督学习
正如ChristophePhillips在OHBM2017关于模式识别的课程(4分34秒处)中所描述的,有监督学习的思路是通过训练,找到已观测数据(如fMRI图像)和解释变量(explanatoryvariable)之间的映射(mapping),这个解释变量可能是被试的疾病标签或认知评分。然后,我们可以使用新的、未标记的受试者并预测他们的疾病类型或认知评分。
Christophe进一步解释(7分10秒处),有监督的机器学习问题可以进一步细分为离散的分类预测(discreteclassificationprediction)以及连续的或回归预测(continuous,orregression,predictions)。无论采用哪种方式,有监督学习(10:50分钟处)最终依赖于输入和目标变量之间的映射函数、该函数的形状以及其参数的优化。以下是一些常用的算法。
3.1.1线性回归(linearregression)
作为一种经典的统计技术,线性回归已经为大多数人所熟悉。然而,这种历史悠久的方法已经重新焕发生机,成为一种有监督学习方法。我们可以将线性回归视为一种预测技术,它使用一个或多个特征来预测一个具有连续值的响应(response,7:35分钟处)。将线性回归作为标准统计工具或机器学习工具使用,这两者之间的主要区别在于,在机器学习中,我们会测试线性模型对未见过的数据的预测能力(predictivepower),而这些数据对该模型的训练没有贡献。
3.1.2逻辑回归(logisticregression)
本质上,逻辑回归背后的理念与线性回归完全相同。唯一的区别是由数据中拟合出的映射函数。在线性回归中,我们拟合出的是一条直线(line),或者在n维空间中对它进行一些推广,即平面(plane)或超平面(hyperplane),而在逻辑回归中,拟合出的是逻辑函数(logisticfunction)。该函数是一个“S形”的曲线。逻辑函数具有非常好的有界性(通常将这些边界设置为0和1),因此,可用于表示概率。通过设置阈值(cut-off),通常是一半,可以使用逻辑回归对我们的样本(sample)进行分类,例如,划分为患者组和对照组。
3.1.3支持向量机(supportvectormachine,SVM)
3.1.4深度学习(deeplearning)
与其它有监督学习算法一样,深度学习需要训练数据集和测试数据集。此外,拥有的层越多,通常需要的(已标记的)数据和计算资源就越多。实际上,一旦计算能力提高到深度网络可行的程度,特别是在图形处理单元(graphicalprocessingunit,GPU)可用之后,深度学习就越来越受欢迎,而GPU等硬件芯片最初是为加速处理数字视频和图形渲染而开发的(3:10分钟处)。
3.1.5多体素模式分析(MVPA)
在结构和功能MRI数据的经典分析方法中,即一般线性模型(generallinearmodel,GLM)的应用中,每个体素是被分开考虑的。由于它采用线性方程,所以,该方法在数学上是简洁和易处理的。然而,这种“大量单变量分析”(massiveunivariate)方法忽略了体素之间的相互依赖性(参见RobertCox在4:16分钟处谈论fMRI分析方法,以及MikePratt在0:35分钟处的讨论)。考虑到脑的动态活动往往牵涉到整个脑的网络,单个体素的独立性假设是有争议的。为了解决这个问题,一类更新的统计模型——多体素模式分析(MVPA)被引入进来,以解释大脑中多个体素的联合贡献对于感兴趣的现象的影响(参见JanainaMouro-Miranda在6:08分的讲话)。也就是说,MVPA描述了一类模式识别(patternrecognition)技术,这些技术在MikePratt关于MVPA的演讲(3分33秒处)以及专注于MVPA的OHMB2017会议中有展示。
MVPA借鉴了机器学习中常用的算法策略。首先,将数据分成训练集和测试集。然后,采用训练集数据和分类器(classifier,例如,SVM)对模型进行训练,以区分对应于不同实验条件(experimentconditions)的多体素模式,并在测试集上对该模型进行验证(validation)。上述验证是通过将多体素测试集数据输入到训练模型中,来预测其所处的实验条件,这经常被称为解码(decoding,参见BertrandThirion在5分38秒以及MikePratt在8:04分钟处的演讲)。在解码中,我们试图从多尺度神经过程(multiscaleneuralprocess)中预测其所代表的内容,例如感知或认知状态等,这些状态在多数情况下是由实验条件诱导出的(Pratt在11:55分钟处的讲话)。分类器可以是线性的或非线性的,不过,每种都有其自身的局限性。线性分类器(例如,线性判别分析,lineardiscriminationanalysis,LDA)被认为更容易训练和解释,然而,它们的灵敏度取决于每个体素在观察到的模式中的贡献(参见JoEtzel在18:00分钟处的讲话)。尽管非线性分类器(例如,人工神经网络,参见VinceCalhoun的演讲)能够在体素模式之间找到更复杂的关系,但它们需要在大型数据集上进行训练。
MVPA这个术语是由Norman、Polyn、Detre和Haxby于2006年提出的,他们当时是在fMRI数据分析的框架内引入了它。不过,考虑到该术语的更广泛定义,MVPA所涵盖的大多数方法不仅限于fMRI,也同样可以应用于结构成像。
3.2无监督学习
在有监督学习中,除了输入数据(例如,fMRI图像)之外,我们还需要输出,其可以是标签(例如健康与疾病)或分数(某种认知或行为学得分)。然而,很多情况下,我们要么没有合适的标签,要么所拥有的标签不可靠,例如在精神病学成像中。在这种情况下,无监督的机器学习方法打开了一扇新的大门。
3.2.1聚类(clustering)
在脑成像研究中,无监督聚类技术最为人所知的应用是脑区分割(brainparcellation)。脑区分割不是一个新问题,也不一定要涉及机器学习。所有神经影像学家都听说过19世纪的神经解剖学家KorbinianBrodmann根据细胞结构(cytoarchitecture)标记了大脑区域,这是最原始的脑分区方法。正如SimonEickhoff在去年的主题演讲中解释的那样,细胞结构不是分割大脑的唯一特征,还有其它一些,如受体结构(receptorarchitecture)、皮质髓鞘结构(corticalmyelinstructure)和连接结构(connectivitystructure)。
其他聚类方法,例如层次聚类(hierarchicalclustering)或谱聚类(spectralclustering),基本思想相同,都是将数据(在这种情况下是脑体素)分割成多个离散的组,但假设或技巧略微不同。例如,层次聚类假设数据具有层次结构,也就是说可以将整体的脑数据分成两组,而每组又可以继续分成两组,直到我们达到单个体素的水平。当然,也可以从单个体素开始,自底向上进行聚合,直到将所有体素都包括进同一组中。另一方面,谱聚类还有一个额外的步骤(谱变换),它允许忽略比较微弱的相似性。SarahGenon在她的教育课程讲座中描述了如何使用扩散MRI数据进行此类分析。
3.2.2拉普拉斯算子特征映射/扩散嵌入(LaplacianEigenMaps/DiffusionEmbedding)
有时,你可能对将体素分组为固定数量的几块(parcel)不感兴趣,而是根据感兴趣的特征探索感兴趣区域(regionofinterest)中体素的关系。DanielMargulies在他的教育演讲中描述了可用于研究脑连接图(connectopies)或连通图(connectivitymaps)的技术。最初的方法类似于上面描述的方法,即为大脑中的每个体素创建一个特征向量。然后,使用相似性度量将这些特征相互比较以创建相似性矩阵。然后,分解该矩阵并获得新的矢量,该矢量可以描述感兴趣区域或整个脑的相似性的主要梯度(primarygradient)。Daniel的主题演讲描述了如何使用这类分析来阐明宏观皮层连接的原理。
3.3关联模型(associativemodel)
也可以对关联模型进行显着性检验以进行推断(inference)。ValeriaKebets描述了(11:20分钟处)如何执行置换检验(permutationtest)以确定哪些成分是显著的,如何确定成分是否在组之间表达不同,最后,哪些变量在驱动所提取的成分。Janaina还详细介绍了(16:50分钟处)她的团队如何在PLS分析中应用多重交叉验证框架(multiplehold-outvalidationframework)。
4将机器学习方法应用于脑成像研究时,有哪些因素需要考虑?
正如前面所探讨的那样,机器学习技术在很多方面为脑成像研究打开了大门。它们可以帮助我们进行依赖于复杂交互的预测,帮助查找我们之前未发现的数据模式,并自动执行耗时的手动任务,例如分割(segmentation)。但是,这种方法的不足或缺陷也必须同时考虑。首先,更复杂和更强大的机器学习技术需要大型数据集。在AndrewDoyle的视频中,他(25:30分钟处)讨论了脑成像领域的应用与经典图像处理问题的区别:脑成像数据通常是非常大且高维的数据,但样本量相对较小。较小的样本量,对于一些应用(例如图像分割或MVPA)可能不是大问题,但对于其他应用(例如患者分类),却是非常大的问题。Arbabshirani等人最近的一篇出版物探讨了从脑成像数据进行个体标签的预测具有挑战性的原因。Varoquaux(2018)的另一篇论文侧重于小样本量模型交叉验证所面对的挑战。
当然,数据越嘈杂,需要的数据量也就越多。脑成像数据被认为是很嘈杂的。此外,如果不能提供可靠的标签,即使是最好的有监督学习算法也将无法成功。另一个问题,特别是对于诸如深度学习等更复杂的方法,是如何评估所得模型的生物学意义(biologicalmeaning)。最近的研究进展已经可以使我们更好地理解和评估深层网络中实际发生的事情。然而,由此产生的模型可能无法告诉我们有关生物学或病理学机制的任何信息,甚至可能这些模型仅仅代表了训练数据中存在的偏差(bias),这会限制它们对其他数据的适用性。例如,今年的replicationaward颁给了一项研究,该研究表明某些已发表的模型缺乏普适性。
在完全解决这些问题之前,作为研究人员,我们所能做的最好的事情就是了解我们正在使用的算法及其局限性。这样我们就可以选择最合适的技术,严格应用于合适的样本量并且避免过拟合。幸运的是,有大量关于机器学习技术的在线资源,包括教科书(例如Bishop,2006),AndrewNg的著名的关于机器学习和深度学习的Coursera课程,以及在线博客和论坛等。来自MRI社区的大量论文提供了用于脑成像的机器学习工具的概述,或者更具体的示例,例如机器学习如何塑造认知神经成像以及如何将机器学习分类器用于fMRI数据等。OHBMOnDemand上拥有大量的教育课程视频和关于脑成像的机器学习应用的讨论,并且我们也期待今年在罗马的OHBM上有更多的令人兴奋的教育和研讨会讨论在脑成像研究中使用机器学习技术。