脑成像研究中的机器学习

2、什么是人工智能?有什么不同的地方吗?

人工智能是一个高级的概念性术语(conceptualterm),它描述的是在机器中模仿“自然智能”(naturalintelligence)的运动。机器学习被认为是一组可以使机器更加“智能”的统计工具。

3、机器学习中有哪些方法?

应用于神经成像的最流行的机器学习技术可以分为两大类:有监督(supervised)和无监督(unsupervised)学习。有监督学习需要被标记的数据(labelleddata,例如已被标记或分类的数据),而无监督方法则是检测未标记数据中的模式。不同的机器学习方法在其复杂性方面也有所不同。这两种类型的机器学习方法都可以从相当简单的线性模型到更复杂的非线性算法。模型越复杂,所需的计算能力(computationalpower)就越强。

下面我们将讨论有监督和无监督学习的一些重要方法。我们还将讨论一些脑成像研究中独有的方法,如多体素模式分析(multivoxelpatternanalysis,MVPA)。

3.1有监督学习

正如ChristophePhillips在OHBM2017关于模式识别的课程(4分34秒处)中所描述的,有监督学习的思路是通过训练,找到已观测数据(如fMRI图像)和解释变量(explanatoryvariable)之间的映射(mapping),这个解释变量可能是被试的疾病标签或认知评分。然后,我们可以使用新的、未标记的受试者并预测他们的疾病类型或认知评分。

Christophe进一步解释(7分10秒处),有监督的机器学习问题可以进一步细分为离散的分类预测(discreteclassificationprediction)以及连续的或回归预测(continuous,orregression,predictions)。无论采用哪种方式,有监督学习(10:50分钟处)最终依赖于输入和目标变量之间的映射函数、该函数的形状以及其参数的优化。以下是一些常用的算法。

3.1.1线性回归(linearregression)

作为一种经典的统计技术,线性回归已经为大多数人所熟悉。然而,这种历史悠久的方法已经重新焕发生机,成为一种有监督学习方法。我们可以将线性回归视为一种预测技术,它使用一个或多个特征来预测一个具有连续值的响应(response,7:35分钟处)。将线性回归作为标准统计工具或机器学习工具使用,这两者之间的主要区别在于,在机器学习中,我们会测试线性模型对未见过的数据的预测能力(predictivepower),而这些数据对该模型的训练没有贡献。

3.1.2逻辑回归(logisticregression)

本质上,逻辑回归背后的理念与线性回归完全相同。唯一的区别是由数据中拟合出的映射函数。在线性回归中,我们拟合出的是一条直线(line),或者在n维空间中对它进行一些推广,即平面(plane)或超平面(hyperplane),而在逻辑回归中,拟合出的是逻辑函数(logisticfunction)。该函数是一个“S形”的曲线。逻辑函数具有非常好的有界性(通常将这些边界设置为0和1),因此,可用于表示概率。通过设置阈值(cut-off),通常是一半,可以使用逻辑回归对我们的样本(sample)进行分类,例如,划分为患者组和对照组。

3.1.3支持向量机(supportvectormachine,SVM)

3.1.4深度学习(deeplearning)

与其它有监督学习算法一样,深度学习需要训练数据集和测试数据集。此外,拥有的层越多,通常需要的(已标记的)数据和计算资源就越多。实际上,一旦计算能力提高到深度网络可行的程度,特别是在图形处理单元(graphicalprocessingunit,GPU)可用之后,深度学习就越来越受欢迎,而GPU等硬件芯片最初是为加速处理数字视频和图形渲染而开发的(3:10分钟处)。

3.1.5多体素模式分析(MVPA)

在结构和功能MRI数据的经典分析方法中,即一般线性模型(generallinearmodel,GLM)的应用中,每个体素是被分开考虑的。由于它采用线性方程,所以,该方法在数学上是简洁和易处理的。然而,这种“大量单变量分析”(massiveunivariate)方法忽略了体素之间的相互依赖性(参见RobertCox在4:16分钟处谈论fMRI分析方法,以及MikePratt在0:35分钟处的讨论)。考虑到脑的动态活动往往牵涉到整个脑的网络,单个体素的独立性假设是有争议的。为了解决这个问题,一类更新的统计模型——多体素模式分析(MVPA)被引入进来,以解释大脑中多个体素的联合贡献对于感兴趣的现象的影响(参见JanainaMouro-Miranda在6:08分的讲话)。也就是说,MVPA描述了一类模式识别(patternrecognition)技术,这些技术在MikePratt关于MVPA的演讲(3分33秒处)以及专注于MVPA的OHMB2017会议中有展示。

MVPA借鉴了机器学习中常用的算法策略。首先,将数据分成训练集和测试集。然后,采用训练集数据和分类器(classifier,例如,SVM)对模型进行训练,以区分对应于不同实验条件(experimentconditions)的多体素模式,并在测试集上对该模型进行验证(validation)。上述验证是通过将多体素测试集数据输入到训练模型中,来预测其所处的实验条件,这经常被称为解码(decoding,参见BertrandThirion在5分38秒以及MikePratt在8:04分钟处的演讲)。在解码中,我们试图从多尺度神经过程(multiscaleneuralprocess)中预测其所代表的内容,例如感知或认知状态等,这些状态在多数情况下是由实验条件诱导出的(Pratt在11:55分钟处的讲话)。分类器可以是线性的或非线性的,不过,每种都有其自身的局限性。线性分类器(例如,线性判别分析,lineardiscriminationanalysis,LDA)被认为更容易训练和解释,然而,它们的灵敏度取决于每个体素在观察到的模式中的贡献(参见JoEtzel在18:00分钟处的讲话)。尽管非线性分类器(例如,人工神经网络,参见VinceCalhoun的演讲)能够在体素模式之间找到更复杂的关系,但它们需要在大型数据集上进行训练。

MVPA这个术语是由Norman、Polyn、Detre和Haxby于2006年提出的,他们当时是在fMRI数据分析的框架内引入了它。不过,考虑到该术语的更广泛定义,MVPA所涵盖的大多数方法不仅限于fMRI,也同样可以应用于结构成像。

3.2无监督学习

在有监督学习中,除了输入数据(例如,fMRI图像)之外,我们还需要输出,其可以是标签(例如健康与疾病)或分数(某种认知或行为学得分)。然而,很多情况下,我们要么没有合适的标签,要么所拥有的标签不可靠,例如在精神病学成像中。在这种情况下,无监督的机器学习方法打开了一扇新的大门。

3.2.1聚类(clustering)

在脑成像研究中,无监督聚类技术最为人所知的应用是脑区分割(brainparcellation)。脑区分割不是一个新问题,也不一定要涉及机器学习。所有神经影像学家都听说过19世纪的神经解剖学家KorbinianBrodmann根据细胞结构(cytoarchitecture)标记了大脑区域,这是最原始的脑分区方法。正如SimonEickhoff在去年的主题演讲中解释的那样,细胞结构不是分割大脑的唯一特征,还有其它一些,如受体结构(receptorarchitecture)、皮质髓鞘结构(corticalmyelinstructure)和连接结构(connectivitystructure)。

其他聚类方法,例如层次聚类(hierarchicalclustering)或谱聚类(spectralclustering),基本思想相同,都是将数据(在这种情况下是脑体素)分割成多个离散的组,但假设或技巧略微不同。例如,层次聚类假设数据具有层次结构,也就是说可以将整体的脑数据分成两组,而每组又可以继续分成两组,直到我们达到单个体素的水平。当然,也可以从单个体素开始,自底向上进行聚合,直到将所有体素都包括进同一组中。另一方面,谱聚类还有一个额外的步骤(谱变换),它允许忽略比较微弱的相似性。SarahGenon在她的教育课程讲座中描述了如何使用扩散MRI数据进行此类分析。

3.2.2拉普拉斯算子特征映射/扩散嵌入(LaplacianEigenMaps/DiffusionEmbedding)

有时,你可能对将体素分组为固定数量的几块(parcel)不感兴趣,而是根据感兴趣的特征探索感兴趣区域(regionofinterest)中体素的关系。DanielMargulies在他的教育演讲中描述了可用于研究脑连接图(connectopies)或连通图(connectivitymaps)的技术。最初的方法类似于上面描述的方法,即为大脑中的每个体素创建一个特征向量。然后,使用相似性度量将这些特征相互比较以创建相似性矩阵。然后,分解该矩阵并获得新的矢量,该矢量可以描述感兴趣区域或整个脑的相似性的主要梯度(primarygradient)。Daniel的主题演讲描述了如何使用这类分析来阐明宏观皮层连接的原理。

3.3关联模型(associativemodel)

也可以对关联模型进行显着性检验以进行推断(inference)。ValeriaKebets描述了(11:20分钟处)如何执行置换检验(permutationtest)以确定哪些成分是显著的,如何确定成分是否在组之间表达不同,最后,哪些变量在驱动所提取的成分。Janaina还详细介绍了(16:50分钟处)她的团队如何在PLS分析中应用多重交叉验证框架(multiplehold-outvalidationframework)。

4将机器学习方法应用于脑成像研究时,有哪些因素需要考虑?

正如前面所探讨的那样,机器学习技术在很多方面为脑成像研究打开了大门。它们可以帮助我们进行依赖于复杂交互的预测,帮助查找我们之前未发现的数据模式,并自动执行耗时的手动任务,例如分割(segmentation)。但是,这种方法的不足或缺陷也必须同时考虑。首先,更复杂和更强大的机器学习技术需要大型数据集。在AndrewDoyle的视频中,他(25:30分钟处)讨论了脑成像领域的应用与经典图像处理问题的区别:脑成像数据通常是非常大且高维的数据,但样本量相对较小。较小的样本量,对于一些应用(例如图像分割或MVPA)可能不是大问题,但对于其他应用(例如患者分类),却是非常大的问题。Arbabshirani等人最近的一篇出版物探讨了从脑成像数据进行个体标签的预测具有挑战性的原因。Varoquaux(2018)的另一篇论文侧重于小样本量模型交叉验证所面对的挑战。

当然,数据越嘈杂,需要的数据量也就越多。脑成像数据被认为是很嘈杂的。此外,如果不能提供可靠的标签,即使是最好的有监督学习算法也将无法成功。另一个问题,特别是对于诸如深度学习等更复杂的方法,是如何评估所得模型的生物学意义(biologicalmeaning)。最近的研究进展已经可以使我们更好地理解和评估深层网络中实际发生的事情。然而,由此产生的模型可能无法告诉我们有关生物学或病理学机制的任何信息,甚至可能这些模型仅仅代表了训练数据中存在的偏差(bias),这会限制它们对其他数据的适用性。例如,今年的replicationaward颁给了一项研究,该研究表明某些已发表的模型缺乏普适性。

在完全解决这些问题之前,作为研究人员,我们所能做的最好的事情就是了解我们正在使用的算法及其局限性。这样我们就可以选择最合适的技术,严格应用于合适的样本量并且避免过拟合。幸运的是,有大量关于机器学习技术的在线资源,包括教科书(例如Bishop,2006),AndrewNg的著名的关于机器学习和深度学习的Coursera课程,以及在线博客和论坛等。来自MRI社区的大量论文提供了用于脑成像的机器学习工具的概述,或者更具体的示例,例如机器学习如何塑造认知神经成像以及如何将机器学习分类器用于fMRI数据等。OHBMOnDemand上拥有大量的教育课程视频和关于脑成像的机器学习应用的讨论,并且我们也期待今年在罗马的OHBM上有更多的令人兴奋的教育和研讨会讨论在脑成像研究中使用机器学习技术。

THE END
1.重要学习网址收藏1ZhemgLee的技术博客19.33万字!深度学习笔记在线版发布! 总1:https://mp.weixin.qq.com/s/hxHqHnGykjbyZk25GxZ8cA 分1:https://github.com/fengdu78/deeplearning_ai_books 20.最新PPT科研绘图教程库 https://mp.weixin.qq.com/s/JIjneaIdw6XYIoClbXSG9Q 21.太赞了!100个案例,Matplotlib 从入门到大神!(附源代码) https://blog.51cto.com/u_15240054/2873341
2.deeplearningai官网,专注于人工智能领域的在线课程学习平台《神经网络与深度学习》(Neural Networks and Deep Learning):由 deeplearning.ai 提供的免费课程,介绍了神经网络和深度学习的基本概念和原理。 《深度学习入门:基于Python的实践》(Deep Learning for Coders):由 fast.ai 提供的课程,着重于以实践为导向的深度学习入门,帮助学习者快速掌握深度学习的实际应用。 https://feizhuke.com/sites/deeplearning-ai.html
3.DeepLearning教程翻译米罗西非常激动地宣告,Stanford 教授 Andrew Ng 的 Deep Learning 教程,于今日,2013年4月8日,全部翻译成中文。这是中国屌丝军团,从2月20日战役打响之日,经过 50 天的团结奋战,取得的全面彻底的胜利。 此次战役的巨大胜利,之所以令人激动,有三方面的原因。 https://www.cnblogs.com/zhehan54/p/7083402.html
4.《DeepLearning》中文印前版开放下载,让我们向译者致敬机器之心在众多网友的帮助和校对下,草稿慢慢变成了初稿。尽管还有很多问题,但至少 90% 的内容是可读的,并且是准确的。我们尽可能地保留了原书 Deep Learning 中的意思并保留原书的语句。 然而我们水平有限,我们无法消除众多读者的方差。我们仍需要大家的建议和帮助,一起减小翻译的偏差。 https://www.jiqizhixin.com/article/2647
5.论文翻译DeepLearningdeeplearning学术写作翻译【论文翻译】Deep Learning Yann LeCun? Yoshua Bengio? Geoffrey Hinton 深度学习 Yann LeCun? Yoshua Bengio? Geoffrey Hinton Abstract Deep learning allows computational models that are composed of multiple processing layers to learn representations of data with multiple levels of abstraction. https://blog.csdn.net/diaokui2312/article/details/107746725/
6.GitHubsoloyuyang/deeplearningbookDeep Learning 中文翻译 公开1个多月,在众多网友的帮助下,草稿中的草稿慢慢变成了草稿。原本打算我们翻译人员先相互校对一遍再让网友校对,但由于时间不足,于是更改计划,打算一起校对。 直译版逐渐向意译版过渡,我们希望尽可能地保留原书Deep Learning中的意思并保留原书的语句。 然而我们水平有限,哈姆雷特成千上万,https://github.com/soloyuyang/deeplearningbook-chinese
7.RegressionandClassificationCourse(DeepLearning.AI)Learn the fundamentals of machine learning with Andrew Ng in this updated 3-course Specialization by DeepLearning.AI and Stanford Online. Build and train models using Python, NumPy, and scikit-learn for real-world AI applications. Ideal for beginners.https://www.coursera.org/learn/machine-learning
8.DeepLearning(UFLDL)翻译版合集开发技术微风**风情上传3.46MB文件格式docxDeepLearning机器学习深度学习UFLDL UFLDL的深度学习教程翻译,适合入门。 (0)踩踩(0) 所需:1积分 Simply Expression Language 2024-12-18 16:45:59 积分:1 Images and Base64 2024-12-18 16:45:32 积分:1 physicalDep https://www.coder100.com/index/index/content/id/2530433
9.[DeeplearningAI笔记]序列模型3.6Bleu得分/机器翻译得分指标即如果机器翻译的长度大于人工翻译输出的长度,BP=1,而其他情况下 BP 的定义会遵从一个式子,从而减小 Bleu 得分的值。 Bleu 得分是一个单一实数评价指标,其在机器翻译和图片描述中应用广泛,用以评价机器生成的语句和实际人工生成的结果是否相近。 参考资料 https://cloud.tencent.com/developer/article/1679650
10.《深度学习DeepLearning》中文版高清完整PDF版下载神经网络和深度学习(Neural Networks and Deep Learning) 中文pdf完整版 内容为时下最火热的神经网络和深度学习,该教程来源于美国Michael Nielsen的个人网站,他致力于把神经网络与深度学习的高深知识以浅显易懂的方式讲解出来,成为众多大牛推荐的必读网络资源之一。国内有识之士把其翻译成中文,方便了广大读者。是不可多https://www.iteye.com/resource/u014036026-9822874
11.DeepL翻译:全世界最准确的翻译即时翻译文本&完整的文档文件。为个人和团队提供准确的翻译。每天有数百万人使用DeepL进行翻译。https://www.deepl.com/
12.2神经网络与深度学习(NeuralNetworksandDeepLearning)免费在线预览全文 《神经网络与深度学习》 NeuralNetworksandDeepLearning https://nndl.github.io/ 邱锡鹏 xpqiu@ 2020 年3 月7 日 序 很高兴为邱锡鹏教授的《神经网络与深度学习》一书写个序. 近年来由于阿尔法围棋战胜人类顶级高手新闻的轰动效应,让人工智能一 下子进入了寻常百姓家,成为家喻户晓的热词. 阿尔法https://max.book118.com/html/2021/0710/8060137027003120.shtm
13.翻译'DeepNg'–字典中文DeepLearning.ai :DeepLearning course by AndrewNg, Founder of coursera DeepLearning.ai :深度学习课程,作者coursera的创建者,吴恩达 ParaCrawl Corpus In June of 1982, 123 of the white ministers of theNGchurch had a joint letter published in the official mouthpiece of the church, Die Kerkbode, sayinghttps://glosbe.com/en/zh/Deep%20Ng
14.8个学习AI的网站(免费自学人工智能必备)学吧导航DeepLearningAI网站也是由人工智能和机器学习领域的权威吴恩达教授创建的在线学习平台,该网站提供与深度学习相关的各种课程和资源,深度学习是机器学习的一个子领域,专注于人工神经网络和深度神经网络。课程设计为初学者和有经验的实践者都可以使用,分为入门、中级、高级三个层次,涵盖一系列与深度学习有关的主题,包括神经https://www.xue8nav.com/2090.html
15.推荐章节(DeepLearning)书评现在市面上系统讲解Deep Learning的书不多,出版的更少,毕竟像CNN这种东西本身就没人真懂,在这领域经验主义远强于逻辑主义。这本书是我目前读过讲DL最好的一本(虽然我读过的并不多,有其他好书还请推荐)。这里推荐几个写的很好的章节。第一部分:这部分其实没什么好说的,基本就是统计学习最基础的线性代数,概率https://book.douban.com/review/8291848/
16.最强通用棋类AI,AlphaZero强化学习算法解读Recall that systems like DeepBlue would rely on a human-defined “evaluation function”, which would take as an input the board state and output the “value” of the state. Nowadays, it’s extremely easy for DeepLearning models to take as an input an image and classify it as a dog orhttps://www.flyai.com/article/770
17.数据驱动软测量深度学习调研(QingqiangSunandZhiqiangGeA Survey on Deep Learning for Data-driven Soft Sensors (Qingqiang Sun and Zhiqiang Ge, Senior Member, IEEE) 本文是来自浙江大学葛志强教授团队21年的一篇关于深度学习软测量的综述,文章详细总结了当前深度学习在软测量领域的各项工作以及未来的研究热点及展望。 https://www.jianshu.com/p/95f3d67d40f9
18.DeepLearningTool的两个版本Deep Learning Tool 0.4 (via MVP, MVTec's Package Loader)Deep Learning Tool 0.4 (for offlinehttps://www.51halcon.com/forum.php?mod=viewthread&tid=4390
19.MachineLearningMastery——免费在线学习机器学习,从基础到高级免费在线学习机器学习,从基础到高级 网址:Start Here with Machine Learning (machinelearningmastery.com) https://home.designshidai.com/7815.html
20.什么是深度学习(DeepLearning)深度学习(Deep Learning)是机器学习的一个子集,而机器学习是人工智能的一个分支,它使计算机能够从数据中学习并执行通常需要人类智能才能完成的任务。深度学习使用人工神经网络,一种受人脑结构和功能启发的算法,可以从大量数据中学习并进行预测或分类。 深度学习的工作原理 https://www.tuidog.com/8481.html
21.DeepLearningDataSynthesisfor5GChannelEstimationsimParameters = hDeepLearningChanEstSimParameters(); carrier = simParameters.Carrier; pdsch = simParameters.PDSCH; Create a TDL channel model and set channel parameters. To compare different channel responses of the estimators, you can change these parameters later. channel = nrTDLChannel; channelhttps://www.mathworks.com/help/5g/ug/deep-learning-data-synthesis-for-5g-channel-estimation.html
22.15个顶级的开源人工智能工具聚合数据gpu的多台机器上它都有优异的表现.微软主要用它做语音识别的研究,但是它在机器翻译,图像识别,图像字幕,文本处理,语言理解和语言建模方面都有着良好的应用. 3. deeplearning4j deeplearning4j 是一个 java虚拟机(jvm)的开源深度学习库.它运行在分布式环境并且集成在 hadoop和 apache spark中.这使它可以配置深度神经https://www.juhe.cn/news/index/id/516
23.吴恩达人工智能布局三板斧第一斧:真要培养这么多AI专家?科学湃以下是吴恩达发布最新项目的博客全文翻译 : 亲爱的朋友们: 我一直在进行三个 AI 项目的相关工作。现在,我非常激动的宣布我的第一个项目:deeplearning.ai,一个旨在传播 AI 知识的项目。目前已经在 Coursera 上开放了一系列的深度学习课程。这些课程将能帮你掌握深度学习知识,并助你在该领域成就自己的一番事业。 https://www.thepaper.cn/newsDetail_forward_1757423
24.人机交互系统——深度学习分布式计算框架? 机器翻译 ? 个性化推荐 ? 词向量 ? 语义角色标注 ? 案例: ? 高尔夫球场的遥感检测:http://ai.baidu.com/support/news?action=detail&id=976 ? Github地址:https://github.com/PaddlePaddle/Paddle 2.2 Deeplearning4j Deeplearninghttps://maimai.cn/article/detail?fid=1390980126&efid=wrcrBSvTljJpbglEWm71iw