随着医疗技术的发展,将机器学习技术深度融合至新一代的医疗诊断手段中,也无疑会使人工智能技术成为新的医疗诊断领域宠儿。
作者:李波毛远丽
机器学习(MachineLearning,ML)是一门多领域交叉学科技术,通过算法使得机器从大量数据中学习和发现规律,从而对新的样本或数据进行分析和研究的方法。从1949年的赫布理论诞生,机器学习技术经过数十年的蓬勃发展,在大数据时代的背景下,以深度学习为代表的新技术不断涌现,机器学习技术不断从理论走向了实践和应用。目前,机器学习技术在肿瘤学、病理学和部分罕见病的诊断中发挥着越来越重要的作用。
数据获取及机器学习的实现
(1)TCGA是由美国国立癌症研究所(NCI)和国家人类基因组研究所资助成立的肿瘤基因数据库。该数据库包含3万多份各类恶性肿瘤患者病例资料,所提供的数据包括患者的基本病例信息、预后情况、病理图谱、突变位点、表观遗传、基因表达谱及miRNA等;
获得可用于分析的数据后,即可采用数据分析软件进行后续的分析和建模。目前机器学习建模的主要工具是编程性的机器学习库,如R、Python以及深度学习库caffe、tensorflow等。本文以R语言平台为例描述机器学习的基本步骤及方法。进行机器学习主要包含数据分割、预处理、特征选择、重抽样进行模型调参、变量重要性估计、建立模型、验证及预测等步骤:
(1)数据处理是进行建模和分析的第一步,数据文件在R语言中通过缺失值处理、数据归一化后形成完整标准的数据表;
(3)数据分割的目的是按照比例将所有样本分为训练组和验证组;
(4)数据处理完成后,可以选择相应的机器学习算法建模,R语言中提供了众多的算法包,如Caret、RandomForest、Kernlab等。模型建立完成后,程序将自动进行训练和验证,并计算准确度、敏感度、特异度等数据对模型进行评价。建模步骤思维导图,以及机器学习的类型及算法,大家可以点击阅读原文,进专题查看。
机器学习算法在恶性肿瘤诊断中的应用
机器学习未来发展
从技术层面而言,机器学习存在最大的问题是过拟合现象,也就是建立的模型过度依赖对训练数据的拟合,而在新数据的推广使用中会出现准确率降低的情况,所以在测试模型中保持数据集的独立性非常重要,且在模型建立中尽可能获得更多的数据并保持数据集的更新。随着医疗技术的发展,将机器学习技术深度融合至新一代的医疗诊断手段中,也无疑会使人工智能技术成为新的医疗诊断领域宠儿。尽管目前看来人工智能技术在医疗诊断领域前景广阔,但作为一种相对超前和新颖的技术方法,临床的认可度仍需要得到加强,如何将传统医学诊断技术和人工智能技术有效地整合至临床实践中仍有不小的挑战。
参考文献
[1]IbrahimIM,AbdulazeezAM.Theroleofmachinelearningaalgorithmsfordiagnosingdiseases.Japaneseviralencephalitis[J].JAppliedSciTechnolTrends,2021:10-19.[2]MehrbakhshNA,NedaAB,SarminahS,etal.Diseasediagnosisusingmachinelearningtechniques:areviewandclassification[J].JSoftComputingandDecisionSupportSystems.2020:19-30.
[3]GokalpC,BulentGE.Classificationofbraintumorsbymachinelearningalgorithms,IEEE,2019.
[4]NareshK,NidhiM.Breastcancerdiagnosisusingadaptivevotingensemblemachinelearningalgorithm.IEEE,2018.
[5]NashatA.Ensemblemachinelearningforleukemiacancerdiagnosisbasedonmicroarraydatasets.IntJAppEngRes.2019,14(21):4077-4084.
[6]OyewoOA,BoyinbodeOK.Predictionofprostatecancerusingensembleofmachinelearningtechniques.IntJAdCompSciApplicat.2020,11(3).[7]NikitaBanerjeeSubhalaxmiDas.Predictionlungcancer–inmachinelearningperspective.IEEE,2020.
[8]VidyaM,MayaVK.Skincancerdetectionusingmachinelearningtechniques.IEEE,2020.
[9]EiryoK,JunyaT,NozomuY,etal.Applicationofartificialintelligenceforpreoperativediagnosticandprognosticpredictioninepithelialovariancancerbasedonbloodbiomarkers.ClinCancerRes.2019,15;25(10):3006-3015.
[10]HuiL,JianmeiL,YanhongX,etal.Colorectalcancerdetectedbymachinelearningmodelsusingconventionallaboratorytestdata.TechnolCancerResTreat.2021,20:15,330.
[11]XiaoliL,JilinL,GuanxiongZ,etal.Machinelearningapproachyieldsamultiparameterprognosticmarkerinlivercancer.CancerImmunolRes.2021Mar;9(3):337-347.
[12]SherryB,HarpreetK,RishemjitK,etal.Mexpressionbasedbiomarkersandmodelstoclassifyearlyandlate-stagesamplesofpapillarythyroidcarcinoma.PLoSOne.2020Apr23;15(4):e0231629.
-End-
题图|veer.com
排版|张宁
审校|方研
原文以《机器学习技术及其在恶性肿瘤诊断中的应用价值》为题发表在《临床实验室》杂志2022年8月刊专题“实验室自动化、数字化、智能化”-「专家论坛」版块
不感兴趣
看过了
取消
人点赞
人收藏
打赏
我有话说
0/500
同步到新浪微博
您的申请提交成功
您已认证成功,可享专属会员优惠,买1年送3个月!开通会员,资料、课程、直播、报告等海量内容免费看!