语音识别医生诊断语录,并对信息进行结构化处理,得到可分类的病历信息
影像诊断
机器视觉
图像预处理,抓取特征等
辅助治疗
语音识别/合成、自然语言处理、机器视觉、机器学习
通过语言、图像识别技术以及电子病历信息进行机器学习,为主治医生提供参考意见
医疗机器人
机器人
手术机器人/导诊机器人
个人健康大数据分析
自然语言处理
日常健康数据分析/病情监控
精准医疗
语音识别、机器学习
DNA序列分析,疾病预防
表2-2具有重要影响的神经网络
神经网络名称
特定
局限性
典型应用领域
感知器
有学习能力,只能进行线性分类
不能识别复杂字符与输入模式的大小、平移和旋转敏感
文字识别、声音识别和学习记忆等
自适应线性单元
学习能力较强,较早开始商业应用
要求输入、输出之间是线性关系
雷达天线控制、自适应回波抵消等
小脑自动机
能调和各种指令系列,按需要缓慢地插入动作
需要复杂的控制输入
控制机器人的手臂运动
误差反传网络
多层前馈网络,采用最小均方误差学习方式,是目前应用最广泛的网络
语音识别、过程控制、模式识别等
自适应共振理论
可以对任意多个和任意复杂的二维模式进行自组织学习
受平移,旋转和尺度的影响,系统较复杂
模式识别、擅长识别复杂、未知模式
盒中脑BSB网络
具有最小均方误差的单层自联想网络,类似于双向联想记忆,可对片段输入补全
只能作一次性决策,无重复性共振
解释概念形成、分类和知识处理
新认知机
多层结构化字符识别网络与输入模式的大小、平移和旋转无关,能识别复杂字型
需要大量加工单元和联系
手写字母识别
自组织特征映射网络
对输入样本自组织聚类,可映射样本空间的分布
模式类型数需要事先知道
语言识别、机器人控制,图像处理等
Hopfield网络
单层自联想网络,可从缺损或有噪声输入中恢复完整信息
无学习能力,权值要预先设定
求解TSP问题,优化计算及联想记忆等
玻尔兹曼机、柯西机
采用随机学习算法的网络,可训练实现全局最优
图像、声呐和雷达等的模式识别
双向联想记忆网
双向联想式单层网络,有学习功能,简单易学
存储的密度低,数据必须能编码
内容寻址的联想记忆
双向传播网
一种在功能上作为统计最优化和概率密度函数分析的网络
需要大量处理单元和连接要高度准确
神经网络计算机图像处理和统计分析
表2-32006年以后的深度学习模型
模型中文名称
模型英文名称
受限玻尔兹曼机
RBM
深层自编码器
deepAE
深层信念网络
deepbeliefnet
深层玻尔兹曼机
DBM
积网络
SPN
深层堆叠网络
DSN
卷积神经网络
CNN
循环神经网络
RNN
长短期记忆网络
LSTMnetwork
强化学习网络
RLN
生成对抗网络
GAN
第三章探索机器学习和神经网络内部结构数学运算原理实现过程
3.1softmax函数
表3-1softmax函数说明
函数名称
函数表达式
函数理解
softmax
这是深度学习中最为常见的函数,其中,是长度为j的数列V中的一个数,带入softmax的结果其实就是先对每个取e为底的指数计算变成非负数,然后除以所有项之和进行归一化,之后每个就可以理解成观察到的数据属于某个类别的概率,或者称作似然(Likelihood)。Softmax用以解决概率计算中概率结果大占绝对优势的问题。例如,函数计算结果中有两个值A和B,且A>B。如果简单地以值的大小为单位衡量,那么在后续的使用过程中A永远被选用,而B由于数值较小则不会被选择。但是有时也需要数值小的B被使用,此时softmax就可以解决这个问题。
3.2深度学习的理论基础——机器学习
3.2.1机器学习的算法流程
表3-2一个完整的机器学习项目包含以下内容:
步骤
说明
输入数据
这是算法最开始就要进行的步骤,通过输入原始的数据集,其中数据集可以包括标签和不包括标签两种情况。这些数据要有一定的格式,只有把数据处理成算法能够读取的格式,算法才能进行后续的数据学习进一步和处理。这一部分也是作为最基础的一部分。
特征提取
当数据正常输入到算法之后,算法将会数据集的每一条记录进行特定流程的处理,并且会保存一些从原来数据集提出来的新的数据,并且这部分新的数据在后续的数据输入的时候可能会进一步地修改或者是影响着后面数据的处理。这部分算法中间过程从原数据提出来的新的数据作为原始数据记录的电脑能够知道和识别的特征。当原始数据特征量很多的时候,处理起来需要消耗的计算资源会很大,所有当出现数据集特征过多的时候,一般要使用其它类似PCA这样的降维技术处理。
模型设计
模型设计是算法用来模拟或者处理数据的的一个抽象的模式,输入到算法里面的数据主要就是按照这个模式来进行数据处理、特征提取的。训练模型一般是依靠大量可靠的数据和对应数据特征的提取。
数据预测
通过使用大量数据训练过了的模型,一般就具备了回答某些特定问题抽象的知识和规律,当需要被回答的问题输入到算法模型的时候,这个模型就会根据之前学习到的知识和规律,给出特定问题的回答,从而完成算法预测这样的一个过程。我们可以使用这个训练好的模型来进行模拟和拓展一些人的行为,从而能够开发出具备一定智商处理特定问题的人工智能产品。
3.2.2基本算法的分类
表3-3基本算法的训练模式算法分类:
算法模式种类名称
无监督学习
数据集没有特定的分类标签,只要明确的一些特征,而怎么把这些无标签的数据怎么处理进行分类的过程,完全由机器运行特定的算法来决定,所有这样的分析结果往往也是不可控的,在算法运行结束前,原始的数据具体会被划分为多少类没有办法提前预知。
有监督学习
算法最开始输入的数据记录是有特定的分类标签的,算法根据数据的特征和它对应的标签来进行学习,通过这样的数据不断地输入,算法不断地修正和改进模型,使得算法能够在很大程度上能够对这类的数据进行正确的预测和分类,从而达到算法分类的标准。
半监督学习
通过混合有标识数据和无标识数据,创建同一模型对数据进行分析和识别,算法的运行介于有监督和无监督之间,最终使得全部输入数据能够被分区。如果数据集有特征值缺失的话,那么使用半监督学习这种数据处理方式会在一定程度上减少缺失值给模型处理数据带来的影响。
强化学习
通过输入不同的标识数据,使用已有的机器学习数据模型,进行学习、反馈修正现有模型,从而建立一个新的能够识别输入数据的模型算法。
3.3机器学习基本算法
1、关联:Apriri算法
2、聚类:k-means、k-medoids、聚焦、分裂算法、视觉聚类算法
3、预测(分类、回归):决策树、支持向量机、正则化方法
3.4回归算法
表3-4回归算法说明
算法名称
回归分析(regressionanalysis)
回归分析是数学上将特征量化后,确定两种或两种以上变量之间的相互关系的一种数理统计分析方法。按照自变量和因变量相互之间的关系,一般可以分为线性回归分析和非线性回归分析。如果只有一个自变量和因变量,并且二者可以用一条直线表示近似拟合表示的话,这种便是一元线性回归分析。如果回归分析中包含两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
3.7BP神经网络算法
表3-10BP算法说明
BP算法(反向传播算法)
6.2.4K-NN、决策树以及神经网络算法对比
当K-NN、决策树、神经网络设计模式不一样时的准确率对比饼图分布显示如下: