什么是深度学习？深度学习的工作原理|非结构化数据处理的难点有哪些_在线学习

深度学习是一种人工智能（AI）方法，用于教计算机以受人脑启发的方式处理数据。深度学习模型可以识别图片、文本、声音和其他数据中的复杂模式，从而生成准确的见解和预测。您可以使用深度学习方法自动执行通常需要人工智能完成的任务，例如描述图像或将声音文件转录为文本。

为什么深度学习很重要？

人工智能（AI）试图训练计算机像人类一样思考和学习。深度学习技术推动了日常产品中使用的许多AI应用程序的发展，例如：

数字助理

声控电视遥控器

欺诈检测

自动面部识别

它也是自动驾驶汽车、虚拟现实等新兴技术的重要组成部分。

深度学习模型是一些计算机文件，数据科学家训练这些文件，以使用算法或一组预定义步骤来执行任务。企业使用深度学习模型在各种应用程序中分析数据并做出预测。

深度学习的作用

深度学习在汽车、航空航天、制造、电子、医学研究和其他领域有很多使用场景。以下是深度学习的一些示例：

自动驾驶汽车使用深度学习模型自动检测路标和行人。

国防系统使用深度学习在卫星图像中自动标记感兴趣的区域。

医学图像分析使用深度学习自动检测癌细胞以进行医学诊断。

工厂使用深度学习应用程序自动检测人员或物体何时位于机器的不安全距离内。

您可以将这些不同的深度学习使用场景分为四大类：计算机视觉、语音识别、自然语言处理（NLP）和推荐引擎。

计算机视觉

计算机视觉是指计算机从图像和视频中提取信息及见解的能力。计算机可以使用深度学习技术来理解图像，就像人类一样。计算机视觉具有多种应用，如下所示：

内容审核，用于从图像和视频归档中自动删除不安全或不适当的内容

面部识别，用于识别面部和多项属性，如睁开的眼睛、眼镜以及面部毛发

图像分类，用于识别品牌徽标、服装、安全装备和其他图像细节

语音识别

深度学习模型可以分析人类语音，尽管说话模式、音调、语气、语言和口音不尽相同。虚拟助手（如AmazonAlexa）和自动转录软件使用语音识别执行以下任务：

帮助呼叫中心座席并对呼叫进行自动分类。

将临床对话实时转换为文档。

为视频和会议记录添加准确的字幕以实现更广泛的内容覆盖范围。

自然语言处理

计算机使用深度学习算法从文本数据和文档中收集见解和意义。这种处理自然的、人工创建的文本的能力有几个使用场景，包括在以下功能中：

自动虚拟座席和聊天机器人

长格式文档（如电子邮件和表格）的业务情报分析

推荐引擎

应用程序可以使用深度学习方法来跟踪用户活动并开发个性化推荐。它们可以分析各种用户的行为，并帮助他们发现新产品或服务。例如，许多媒体和娱乐公司，例如Netflix、Fox和Peacock，都使用深度学习来提供个性化的视频推荐。

深度学习的工作原理

深度学习算法是仿照人脑建模的神经网络。例如，人脑包含数百万个相互关联的神经元，它们协同工作以学习和处理信息。同样，深度学习神经网络（或人工神经网络）是由在计算机内部协同工作的多层人工神经元组成的。

人工神经元是称为节点的软件模块，它使用数学计算来处理数据。人工神经网络是使用这些节点来解决复杂问题的深度学习算法。

深度学习网络有哪些组成部分？

深度神经网络的组成部分如下：

输入层

人工神经网络有几个向其输入数据的节点。这些节点构成了系统的输入层。

隐藏层

输入层处理数据并将其传递到神经网络中更远的层。这些隐藏层在不同层级处理信息，在接收新信息时调整其行为。深度学习网络有数百个隐藏层，可用于从多个不同角度分析问题。

例如，如果您得到了一张必须分类的未知动物的图像，则可以将其与您已经认识的动物进行比较。例如，您可以查看其眼睛和耳朵的形状、大小、腿的数量和毛皮花色。您可以尝试识别图样，如下所示：

动物有蹄，所以它可能是牛或鹿。

动物有猫眼，所以它可能是某种类型的野猫。

深度神经网络中的隐藏层以相同的方式工作。如果深度学习算法试图对动物图像进行分类，则其每个隐藏层都会处理动物的不同特征并尝试对其进行准确的分类。

输出层

输出层由输出数据的节点组成。输出“是”或“否”答案的深度学习模型在输出层中只有两个节点。那些输出更广泛答案的模型则有更多的节点。

机器学习背景下的深度学习是什么？

深度学习是机器学习的子集。深度学习算法的出现是为了提高传统的机器学习技术的效率。传统的机器学习方法需要大量的人力来训练软件。例如，在动物图像识别中，您需要执行以下操作：

手动标记数十万张动物图像。

让机器学习算法处理这些图像。

在一组未知图像上测试这些算法。

找出某些结果不准确的原因。

通过标注新图像来改进数据集，以提高结果准确性。

这个过程称为有监督学习。在监督学习中，只有当您拥有广泛且充分多样化的数据集时，结果准确性才会提高。例如，该算法可能可以准确识别黑猫，但不能准确识别白猫，因为训练数据集包含更多黑猫图像。在这种情况下，您需要标记更多的白猫图像并再次训练机器学习模型。

深度学习相对于机器学习有什么好处？

与传统的机器学习相比，深度学习网络具有以下优势：

高效处理非结构化数据

机器学习方法发现非结构化数据（如文本文档）难以处理，因为训练数据集可能有无限种变化。另一方面，深度学习模型可以理解非结构化数据并进行一般观察，而无需手动提取特征。例如，神经网络可以识别出这两个不同的输入句子具有相同的含义：

您能否告诉我如何付款？

我如何转账？

隐藏的关系和模式发现

深度学习应用程序可以更深入地分析大量数据，并揭示可能尚未对其进行过训练的新见解。例如，考虑一个经过训练以分析消费者购买的深度学习模型。该模型仅包含您已购买的商品的数据。但是，通过将您的购买模式与其他类似客户的购买模式进行比较，人工神经网络可以向您推荐您尚未购买的新物品。

无监督学习

易失性数据处理

易失性数据集具有各种不同的版本。银行的贷款还款额就是其中的一个例子。深度学习神经网络也可以对这些数据进行分类和排序，例如通过分析金融交易并标记其中一些交易以进行欺诈检测。

深度学习面临哪些挑战？

由于深度学习是一项相对较新的技术，因此其实际实施会带来某些挑战。

大量高质量的数据

在大量高质量数据上训练深度学习算法时，可以获得更好的效果。输入数据集中的异常值或错误会显著影响深度学习过程。例如，在我们的动物图像示例中，如果数据集中意外引入了非动物图像，深度学习模型可能会将飞机归类为海龟。

为避免此类错误，必须先清理和处理大量数据，然后再训练深度学习模型。输入数据预处理需要大量的数据存储容量。

处理能力强

云端深度学习有哪些好处？

在云基础架构上运行深度学习算法可以克服其中的许多挑战。您可以使用云中的深度学习更快地设计、开发和训练深度学习应用程序。

速度

可扩展性

使用通过云提供的广泛的按需资源，您可以访问几乎无限的硬件资源来处理任何规模的深度学习模型。您的神经网络可以利用多个处理器，在不同类型和数量的处理器之间无缝、高效地分配工作负载。

THE END

什么是深度学习？深度学习的工作原理

数据分析入门到底难在哪？新手最常踩的3大“坑”曝光！

揭秘！8步让你成为数据分析高手！数据源大模型神经网络

保险业海量非结构化数据的存储选型迁移备份等难点解读

中国移动5G+探索大数据和人工智能答案

零氪科技创始人张天泽：医疗大数据难点重重，高质量数据就是壁垒指导凯文撰写李喆摘要：医疗行业信息化程度高，但存在大量非结构化数据，如何以低成本方式获得高质量临床数据是关键...

非结构化数据管理难，爱数AnyShareFamily革新企业内容管理爱分析调研

研究员成果张宁等企业非结构化文档数据治理探究

大数据处理论文

某银行非结构化数据存储痛点及对象存储需求分析

大数据时代企业须打好信息资源整合攻坚战大数,时代,信息资源,资源整合,攻坚战

架构算法方法论齐备，智能风控峰会完整日程！

大数据时代带来的影响(精选5篇)

什么是深度学习？深度学习的工作原理

非结构化数据资产分类分级建设实践与思考

人工智能快速发展趋势下，中国该如何应对？之一

浅谈非结构化数据的特点都有哪些

打造可持续的个人工作流02：系统篇