资源初学者指南:神经网络在自然语言处理中的应用

原标题:资源|初学者指南:神经网络在自然语言处理中的应用选自machinelearning

原标题:资源|初学者指南:神经网络在自然语言处理中的应用

选自machinelearningmastery

机器之心编译

参与:刘晓坤、蒋思源

深度学习正在给自然语言处理带来巨大的变革。但是,作为一个初学者,要从哪里起步才好呢?深度学习和自然语言处理都是很宽泛的领域。哪些方面才是最重要的,还有,深度学习又是从哪个层面深刻影响了NLP呢?

让我们开始吧。

1.介绍;

2.神经网络结构;

3.特征表示;

4.前馈神经网络;

5.词嵌入;

6.神经网络训练;

7.串联和多任务学习;

8.结构化输出预测;

9.卷积层;

10.循环神经网络;

11.具体的RNN结构;

12.模型树。

这篇论文的标题是「基于神经网络模型的自然语言处理入门」(APrimeronNeuralNetworkModelsforNaturalLanguageProcessing)。

对应的论文2015年发表在ArXiv上。与其说是论文,不如说是一篇技术报告或者说是教程,面向研究员和学生,对基于深度学习方法的自然语言处理(NLP)作了综合性的介绍。

这篇教程审视了针对自然语言处理的研究的几个深度学习模型,以求自然语言的研究能加快神经网络技术的发展。

这对于初学者来说是很理想的教材,因为:

在这篇教程中,我希望能为NLP开发者和新手介绍一些基础背景知识,术语,实用工具以及方法论,从而明白其背后的神经网络模型的理论,应用到他们自己的工作中...面向的是那些有志于利用已有的,有价值的技术,并创造新方法去解决他们最感兴趣的NLP的人。

通常情况下,在语言学和自然语言处理中,关键的深度学习方法需要翻模(重命名)以建立有用的沟通桥梁。

这一小节将介绍神经网络结构的不同类型,作为后面章节的参照。

全连接前馈神经网络是非线性学习器,因此在极大程度上可以随意取代线性学习器。

这里介绍4种类型的神经网络结构,这里着重介绍其应用案例和参考文献:

这一节着重介绍深度学习模型训练稀疏或者密集型表示的各种方法。

也许,从稀疏输入(sparse-input)线性模型到神经网络模型最大的飞跃,就是放弃将每一个特征作为一个维度的表示方式(所谓的one-hot表示),而使用密集型向量的表示方式。

NLP分类系统的一般结构总结如下:

这个结构的关键在于使用密集型特征向量而不是稀疏特征向量,使用核心特征而不是特征组合。

需要注意在特征提取阶段中,神经网络只有提取核心特征。这和传统的基于线性模型的NLP不同,传统的NLP的特征设计必须手动设置以明确规定核心特征和其中的相互作用。

这一节将提供前馈人工神经网络的速成课程。

以「APrimeronNeuralNetworkModelsforNaturalLanguageProcessing」中含两个隐藏层的前馈神经网络为例。这些神经网络都是使用数学概念和脑启发的形式而表示出来的。通常神经网络的研究论题包括如下几个:

对于自然语言处理的神经网络方法来说,词嵌入表征是很重要的论题。这一节将展开这一论题并举几个关键方法的例子。神经网络在NLP中的流行一个重要原因是嵌入方法的使用,在低维空间中将每一个特征表征为一个向量。我们将回顾以下几个关于嵌入的论题:

神经词嵌入方法源于语言模型化方法,即训练网络以通过上文序列预测下一个词。

这一节篇幅较大,着重介绍神经网络的训练方式,面向对神经网络范式不熟悉的读者。神经网络的训练是通过梯度方法,尝试在一个训练数据集内最小化损失函数的过程。

有趣的是,神经网络的计算图观点的提出为一些实现深度学习模型的符号化数值程序库(symbolicnumericallibraries),如Theano和TensorFlow提供了很好的入门方法。

只要图被建立起来,就能很直观的理解前向计算(计算输出结果)或者方向计算(计算梯度)。

这一节将在前一节的基础上,我们将总结级联NLP模型和多语言任务的学习模型。

级联模型:利用神经网络模型的计算图定义加入中间表征(编码)以建立更加复杂的模型。例如,我们可以通过近邻词汇,以及/或者其组成特征建立一个前馈网络来预测词汇。

预测命名实体的边界,以及语句的下一个词汇,都依赖于一些潜在的句法-语义表征上。这些高级概念都是在神经网络语境中描述的,以在模型之间建立关联的理解,或者在训练过程(误差反向传播)和预测过程中,共享信息。

典型例子有序列标注(e.g.词性标注)的序列分割(分组,NER(命名实体识别)),以及句法分析。本节内容包括基于贪婪算法的和以搜索为核心的结构化预测,而主要集中讨论后者。

以搜索为核心是自然语言结构化预测的一般方法。

这一节提供了卷积神经网络的速成课程,以及讨论卷积网络对自然语言处理研究带来的变革。CNN被证明在自然语言处理的分类任务上表现出色,比如情绪分析,e.g.在文中寻找特定的子序列或者结构进行预测。

卷积神经网络一般被设计成在大型结构中用以识别indicativelocalpredictors,并将其组合以生成结构的固定大小的向量表征,捕捉这些localaspects对于预测任务来说是很有用的。

正如前一节一样,这一节也将介绍一种特定的网络和其在NLP中的应用。比如,应用RNN的序列建模。

循环神经网络允许在一个固定大小的向量中表示任意大小的结构化输入,而只关心输入的结构化性质。

由于RNNs在NLP中很受欢迎,尤其是LSTM,这一节将讨论如下几个关于循环的论题和模型:

我们将集中讨论RNN模型结构或者结构元素中,特别是:

这一节将在上一节的基础上讨论特定的RNN算法。比如:

12.模型建模

最后一节着重讨论一种更加复杂的网络,学习树型建模的递归神经网络。所谓的树包括了句法树,话语树,甚至是表示(由一句话的几个部分表达的)情绪的树。我们希望在特定的树节点上预测价值,价值预测以根节点为基础,或者为整棵树或者部分树指定一个预测值。

正如循环神经网络保持输入序列的状态,递归神经网络保持树节点的状态。

这里有一个递归神经网络的例子,取自「APrimeronNeuralNetworkModelsforNaturalLanguageProcessing.」

THE END
1.对话语言理解MicrosoftAzureTelefónica 提供一个由 AI 支持的自然言语理解 (NLU) 数字助手 一家电信巨头打造了一款基于自然语言机器人的数字助手,可与客户进行更深层次的互动。 返回到选项卡 文档和资源 开始使用 CLU 文档 LUIS 文档 LUIS 定价 Microsoft Learn 课程 代码示例 代码示例 https://azure.microsoft.com/zh-cn/services/cognitive-services/conversational-language-understanding/
2.自然语言处理学习笔记(一)———概论自然语言处理笔记自然语言处理是计算机科学、人工智能和语言学的交叉领域,涉及词汇量、结构化、歧义性等方面的对比。与编程语言不同,NLP需处理丰富词汇、非结构化信息和歧义。主要任务包括词法分析、信息抽取、文本分类等,常用方法有基于规则的专家系统和统计学习。 摘要由CSDN通过智能技术生成 https://blog.csdn.net/laosao_66/article/details/132017369
3.自然语言处理(NLP)详解准确的关系抽取可以帮助提取出文本中的重要信息,丰富知识图谱和知识库的内容,以及支持各种自然语言处理任务。 技术实现原理说明: 实体识别:首先,对文本进行实体识别,识别出文本中的实体,例如人物、组织、地点等。 关系提取:接下来,根据实体的上下文信息和语义关联,通过模式匹配、特征提取等方法,从文本中提取实体之间的https://zhuanlan.zhihu.com/p/641502778
4.如何成为一名成功的自然语言处理工程师科学人工智能技术如何成为一名成功的自然语言处理工程师:十个步骤 自然语言处理(Natural Language Processing,NLP)是人工智能(AI)领域的一个重要分支,它涉及计算机与人类语言之间的交互和理解。随着人工智能技术的快速发展,NLP工程师成为了炙手可热的职业。本文将介绍成为一名自然语言处理工程师的十个步骤,帮助你在这个领域取得成功。 https://www.163.com/dy/article/IJUS1IRO0556471K.html
5.如何入门自然语言处理回复关键字自然语言处理入门,便可以领取资源 经典书籍我推荐《python自然语言处理》以及《数学之美》这两本书 《python自然语言处理》这本书很适合我们小白来读,作者感觉就是以我们小白的角度来写的。里面主要是处理英文数据的,你可以试着用书里的方法来操作中文数据,这样你会更好的落实和理解书中的代码。 https://www.jianshu.com/p/d0d610fd4b3b
6.自然语言处理入门本书作为入门读物,不会讨论这些高级任务,但了解自然语言处理的整个宏观图景有助于我们开拓视野,找准定位与方向。 1.3 自然语言处理的流派 上一节比较了自然语言与人工语言的异同,展示了自然语言处理的困难所在,介绍了一些常见的 NLP 任务。这一节简要介绍进行自然语言处理的几种不同手法。 https://www.ituring.com.cn/book/tupubarticle/28291
7.如何入门自然语言处理–我爱自然语言处理自然语言处理 如何学习自然语言处理:NLP领域经典《自然语言处理综论》英文版第三版更新 2018年10月17号 52nlp 如何学习NLP? 我觉得先要学好英语、数学和编程,因为英文世…关注我们的微信公众号AINLP 近期文章 探索3D打印与增材制造课程:转变创意为现实的艺术之旅 课程推荐:会计数据分析课程回顾 如何利用https://www.52nlp.cn/tag/%E5%A6%82%E4%BD%95%E5%85%A5%E9%97%A8%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86
8.2深度学习入门自然语言处理v.pdf2深度学习入门自然语言处理v.pdf,深度学习入门(自然语言处理) 科学院大学 目录 1 深度学习概述 发展历程、领域应用 2 为什么使用深度学习 从图像识别说起: 为什么使用深度学习 全连接神经网络 3 如何使用深度学习 卷积神经网络 4 课程实践 实践:手写数字识别 目录 1 深https://max.book118.com/html/2021/1123/8107047065004043.shtm
9.自然语言处理入门(豆瓣)"自然语言处理入门"试读· ··· 自然语言处理(NLP)的目标是使计算机能够像人类一样理解语言。人类语言是一个复杂的符号系统,人们可以通过不同方式传达信息,比如文字、语音、手势、信号等,而所传达的信息也可能因为用词或语调的微妙不同而大相径庭。完全通过机器来理解人类语言目前还是一个很困难的任务。所幸的是https://book.douban.com/subject/34856701/
10.自然语言处理入门完整版PDF电子书下载自然语言处理入门 投诉报错 书籍大小:4.81MB 书籍语言:简体中文 书籍类型:国产软件 书籍授权:免费软件 书籍类别:编程其它 应用平台:PDF 更新时间:2023-05-22 购买链接:京东异步社区 网友评分: 360通过腾讯通过金山通过 4.81MB 详情介绍 自然语言处理(NLP)是一种研究人类语言和计算机交互的技术,涵盖了语音识别、机器翻https://www.jb51.net/books/881251.html
11.自然语言处理入门自然语言处理入门 作者:李洋 ISBN:9787302644484 出版社:清华大学出版社 出版年:2024 Python自然语言处理入门 作者:(日)赤石雅典,(日)江泽美保著 ISBN:9787517098294 出版社:中国水利水电出版社 出版年:2022 PyTorch自然语言处理入门与实战 作者:孙小文 ISBN:9787115595256 出版社:人民邮电出版社 出版年:2022 赠https://www.las.ac.cn/front/book/detail?id=ba7a5b0d3b49bf85a6d2a61466016929
12.HanLP《自然语言处理入门》笔记雷达信号处理、生物医学信号处理等领域的一维信息算法处理。 在计算机音视频和图形图像技术等二维信息算法处理方面目前比较先进的视频处理算法:机器视觉成为此类算法研究的核心;另外还有2D转3D算法(2D-to-3D conversion),去隔行算法(de-interlacing),运动估计运动补偿算法(Motion estimation/Motion Compensation),去噪算法(Nohttps://cloud.tencent.com/developer/article/1588465
13.《自然语言处理入门》(何晗)简介书评在线阅读当当网图书频道在线销售正版《自然语言处理入门》,作者:何晗,出版社:人民邮电出版社。最新《自然语言处理入门》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《自然语言处理入门》,就上当当网。http://product.dangdang.com/28469821.html
14.入门自然语言处理必看:图解词向量入门自然语言处理必看:图解词向量 词嵌入(embedding)是机器学习中最惊人的创造, 如果你有输入法打字预测的经历,那么你很有可能是词嵌入(自然语言处理的核心模型)技术的受益者。 在过去的几十年中,基于神经网络模型的词嵌入技术发展迅猛。尤其是最近,包括使用BERT和GPT2等最先进的模型进行语义化词嵌入。https://blog.itpub.net/69946223/viewspace-2655248/
15.自然语言处理(NLP)入门与实践简介:随着人工智能的快速发展,自然语言处理应用愈加广泛。本课首先对其发展历程、现状、技术体系、开发环境等概述。然后从数据准备、可视化、KNN算法模型、实际应用、sklearn算法改进等方面进行实战,旨在帮助大家轻松入门。 第1章 自然语言处理课程概述 介绍什么是自然语言处理,以及发展历程,技术体系,工作原理。 https://www.imooc.com/learn/1069
16.堪称自然语言处理(NLP)的入门经典,也许被你擦肩而过了今天给大家推荐一本自然语言处理的经典入门书,几天前小编就想到这本书《Python自然语言处理》,自然语言处理入门或自学都很合适,堪称NLP的入门经典书。豆瓣评分:8.2。 堪称自然语言处理(NLP)的入门经典,也许被你擦肩而过了 本书基于Python编程语言及名为自然语言工具包(Natural Language Toolkit, NLTK)的开源库。NLTKhttps://labs.epubit.com/articleDetails?id=e004ef7443b44912ad1bb563960c72e2
17.DSGE理论与应用:如何从入门到精通宏观经济学很多人可能学到高级宏微观经济学就已经非常吃力,然后就放弃了。殊不知,他们离DSGE入门只差一步之遥—https://bbs.pinggu.org/thread-7169374-1-1.html