AI啊,我这里有些羞羞的东西,你要不要看一眼?

郭一璞发自凹非寺量子位报道|公众号QbitAI

自从AI火了之后,它的各种神奇应用就层出不穷。

现在,有人已经把AI用在男科♂诊断上,研究“小蝌蚪”。

没错,这是个正经研究,出自挪威奥斯陆城市大学,甚至还发了一篇NatureScienceReports。

解决的核心问题是,如何让AI来观察“小蝌蚪”,进而判断男性的生育能力。

研究者们对着一群“小蝌蚪”的视频研究了很久之后发现:

你们熟悉的卷积神经网络(CNN)简直是自动观察小蝌蚪的神器。

相比传统机器学习,CNN可以更有效的对男性小蝌蚪的运动能力进行分析,错误率低至9%左右,也就是准确率已经超过九成了。

因此,将来如果有准备当爸爸的盆友,去医院做检查的时候,盯着你的“儿子”看的,可能就不是医生,而是AI了。

小蝌蚪动不动,影响当爸爸的能力

在这项研究中,AI主要看的指标是小蝌蚪的运动状态。

先来科普一下,一个正常育龄男性能不能当爸爸,和他生殖系统的很多因素有关,单就基因的传递者小蝌蚪来说,它们的总数、形态、浓度等等因素都会影响男性的生育能力。

小蝌蚪的运动状态,也是其中一个重要指标。

比如,有高速运动(progressive)的小蝌蚪,跑起来飞快,可以直线跑,也可以绕大圆圈跑,非常健壮;

还有低速运动(non-progressive)的小蝌蚪,跑的不快,或者在原地兜圈子,不太健壮;

也有一动不动(immotile)的小蝌蚪,太不活跃,很难找到另一半来合成受精卵。

而一个小蝌蚪想把自己的基因传承下去,需要至少25微米/秒的运动能力,如果一位男士的小蝌蚪里能跑到这个速度的不到32%,那他可能就没那么容易当爸爸了。

因此,如果要诊断一位男士的生育能力,那就要去医院里检测他的精液样本。

而这项研究,就是用传统机器学习和深度学习的方法区分高速运动、低速运动和一动不动的小蝌蚪。

来自85个人的数据

那么,研究的第一步,要找个小蝌蚪数据集,于是……

他们找到了一个名叫VISEM的数据集。

这个数据集的作者找了85个人,这些人去实验室附近的小黑屋或者自己家里收集了一些精液样本,然后研究人员把这些样本放到显微镜下,录2~7分钟的视频,视频的帧率是每秒50帧。

除了视频,数据集里还有这85个人的年龄、体重指数(BMI)和禁欲天数三个指标。

先用机器学习算法

既然要比较传统机器学习算法和CNN哪个辨别小蝌蚪运动状态的能力强,那就先上传统机器学习。

第一步,要提取特征。

这里,研究者们用到了一个名叫LIRE(LuceneImageRetrieval)开源库,然后用超过40个不同的算法测试了超过30个不同的特征。

最终选定了Tamura特征,这组特征里包括小蝌蚪的粗细程度、对照、方向性、线条形状、规则度和粗糙度,并且分别用Tamura特征、数据集里85个人的数据和两者兼顾做了三组辨别三种不同活力小蝌蚪的实验。

综合三组实验的结果,有六个算法表现是最好的,他们是:简单线性回归,随机森林,高斯过程,序列最小优化(SMOreg),弹性网和随机树,识别的错误率大概在11%左右。

再用深度学习方法

试完了传统机器学习方法,再来试试深度学习,用CNN来辨别。

然后在用CNN来在这些处理后的数据上,再做一下那三组实验,分辨三种不同活力小蝌蚪的数量,这下要方便地多,可以一下子辨别出三个值,不用跑三遍算法了。

△处理过程

最后运行出来的结果,错误率大约在9%左右。

相比前面的11%,错误率明显降低,效果要好得多了。

所以,用深度学习辨别精子活力,不仅比传统机器学习的方法要好,而且可以只跑一遍算法,更快速便捷。

或许未来,深度学习可以应用到医疗实践中,成为诊断男性不育的利器。

传送门

论文:MachineLearning-BasedAnalysisofSpermVideosandParticipantDataforMaleFertilityPrediction作者:StevenA.Hicks,JorunnM.Andersen,OliwiaWitczak,VajiraThambawita,PllHalvorsen,HugoL.Hammer,TrineB.Haugen,MichaelA.Rieglerarxiv.org号码1910.13327

THE END
1.17个机器学习的常用算法通过这种方式来寻找最佳的匹配。因此,基于实例的算法常常也被称为“赢家通吃”学习或者“基于记忆的学习”。常见的算法包括 k-Nearest Neighbor(KNN), 学习矢量量化(Learning Vector Quantization, LVQ),以及自组织映射算法(Self-Organizing Map , SOM)。 8.正则化方法https://zhuanlan.zhihu.com/p/552445012
2.超级干货:到底该如何学习算法?但是对大多数本科同学,尤其是第一次接触算法的同学,《算法导论》实在不是一个好的教材。但很可惜,很多同学在学习中有上面的两个毛病,既过度路径依赖,别人说《算法导论》好,学习算法要走学《算法导论》这个路径,自己就不探索其他更适合自己的学习路径了,一头扎进《算法导论》里;同时还“完美主义”的倾向,对于《https://baijiahao.baidu.com/s?id=1629846079532222044&wfr=spider&for=pc
3.如何有效学习算法?算法学习学习算法需要系统性的方法和实践,以下是一些有效的学习步骤和资源建议 基础知识学习: 数学基础:掌握离散数学、概率论、统计学等基础知识 编程基础:熟练掌握至少一种编程语言,如Python、C++、Java等 数据结构与算法基础: 数据结构:学习数组、链表、栈、队列、树、图等数据结构 https://blog.csdn.net/qq_49548132/article/details/140109291
4.机器学习常见算法类型都有哪些算法是程序员在学习软件编程开发技术的时候需要重点掌握的一个编程开发技术知识,而今天我们就通过案例分析来了解一下,机器学习常见算法类型都有哪些。 1.分类算法 这是一种监督学习方法。有很多算法帮助我们解决分类问题,比如K近邻、决策树、朴素贝叶斯、贝叶斯网络、逻辑回归、SVM等算法。人工神经网络和深度学习也往往用https://www.douban.com/note/782408490/
5.机器学习中的特征提取方法特征提取算法有哪些机器学习中的特征提取方法 特征提取算法有哪些 说明:此处暂时简单介绍下各种特征提取算法,后续完善。 前言:模式识别中进行匹配识别或者分类器分类识别时,判断的依据就是图像特征。用提取的特征表示整幅图像内容,根据特征匹配或者分类图像目标。常见的特征提取算法主要分为以下3类:https://blog.51cto.com/u_16099263/8634144
6.BAT机器学习面试1000题系列(二)109.准备机器学习面试应该了解哪些理论知识? 知乎解答 110.标准化与归一化的区别? 简单来说,标准化是依照特征矩阵的列处理数据,其通过求z-score的方法,将样本的特征值转换到同一量纲下。归一化是依照特征矩阵的行处理数据,其目的在于样本向量在点乘运算或其他核函数计算相似性时,拥有统一的标准,也就是说都转化为“https://www.jianshu.com/p/4a7f7127eef1
7.17个机器学习的常用算法通过这种方式来寻找最佳的匹配。因此,基于实例的算法常常也被称为“赢家通吃”学习或者“基于记忆的学习”。常见的算法包括k-Nearest Neighbor(KNN),学习矢量量化(Learning Vector Quantization,LVQ),以及自组织映射算法(Self-Organizing Map,SOM) 8.正则化方法https://aidc.shisu.edu.cn/78/aa/c13626a161962/page.htm
8.下列属于监督学习的算法/方法有()。A决策树B回归分析C层次聚下列属于监督学习的算法/方法有( )。 A、决策树 B、回归分析 C、层次聚类 D、中心向量分类法 点击查看答案http://www.ppkao.com/wangke/daan/9fe1b64128614ad1b6aa71f5cb213fbd
9.基于Q学习算法的有状态网络协议模糊测试方法研究AET这种测试方法提高了测试用例有效性,但前置引导序列和回归序列这些辅助报文在测试过程中的重复交互降低了测试效率,且因是根据协议实体所处的协议状态输入报文类型相对应的测试用例,导致无法发现由报文异常输入顺序所引出的协议缺陷。 因此,本文针对有状态网络协议提出了一种基于Q-学习算法的模糊测试方法,不需要引导状态的http://www.chinaaet.com/article/3000117697
10.年薪50万!北航合肥创新研究院招募研究员!澎湃号·政务4、了解CV、机器学习、深度学习或强化学习、大数据分析等常用算法及模型,具备较强的编程能力,熟悉Tensorflow等机器学习平台; 5、有重大基础研究和应用研究经验者以及具备产学研合作和科技成果转化经验者优先; 6、能紧跟自身科研领域的发展方向,具有较强的团结协作、拼搏奉献精神,能够协助团队负责人开展科研管理工作。 https://www.thepaper.cn/newsDetail_forward_4985535
11.什么是机器学习?概要了解无监督机器学习,也就是在数据集中寻找没有标注响应的模式。这种方法可以让您探索不确定包含什么信息的数据。 如何决定使用哪种机器学习算法? 选择正确的算法看似相当困难 - 有监督和无监督机器学习算法有几十种,每种算法都使用了不同的学习方法。 机器学习算法的选择没有最佳方法或万全之策。找到正确的算法在https://ww2.mathworks.cn/discovery/machine-learning.html
12.TensorFlow机器学习常用算法解析和入门集成学习就是将很多分类器集成在一起,每个分类器有不同的权重,将这些分类器的分类结果合并在一起,作为最终的分类结果。最初集成方法为贝叶斯决策。 集成算法用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。集成算法的主要难点在于究竟集成哪些独立的较弱的学习模型以及如何把学习https://www.w3cschool.cn/tensorflow/tensorflow-s8uq24ti.html
13.精神病学研究中如何进行中小型数据的深度学习鉴于机器学习(尤其是深度学习)的现代算法和方法在其他学科中的出色预测性能,它们为解决这些问题提供了新希望。深度学习算法的优势在于它们可以实现非常复杂的算法,并且原则上可以高效地执行任意预测结果的映射。但是,这种实现是有代价的,需要大量的训练(和测试)样本来推断(有时超过数百万个)模型参数。这似乎与迄今为止在https://www.360doc.cn/mip/955038026.html