手把手教你看懂NLP自然语言处理(4个典型应用+5个难点+6个实现步骤)

手把手教你看懂NLP自然语言处理(4个典型应用+5个难点+6个实现步骤)

NLP为什么重要?“语言理解是人工智能领域皇冠上的明珠”——比尔·盖茨

在非结构数据中,文本的数量是最多的,他虽然没有图片和视频占用的空间大,但是他的信息量是最大的。

为了能够分析和利用这些文本信息,我们就需要利用NLP技术,让机器理解这些文本信息,并加以利用。

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。

不同的语言之间是无法沟通的,比如说人类就无法听懂狗叫,甚至不同语言的人类之间都无法直接交流,需要翻译才能交流。

而计算机更是如此,为了让计算机之间互相交流,人们让所有计算机都遵守一些规则,计算机的这些规则就是计算机之间的语言。

既然不同人类语言之间可以有翻译,那么人类和机器之间是否可以通过“翻译”的方式来直接交流呢?

NLP就是人类和机器之间沟通的桥梁!

1.自然语言理解–NLU|NLI

2.自然语言生成–NLG

自然语言理解–NLU|NLI

自然语言理解就是希望机器像人一样,具备正常人的语言理解能力,由于自然语言在理解上有很多难点(下面详细说明),所以NLU是至今还远不如人类的表现。

自然语言理解的5个难点:

1.语言的多样性

2.语言的歧义性

3.语言的鲁棒性

4.语言的知识依赖

5.语言的上下文

自然语言生成–NLG

NLG的6个步骤:

1.内容确定–ContentDetermination

2.文本结构–TextStructuring

3.句子聚合–SentenceAggregation

4.语法化–Lexicalisation

5.参考表达式生成–ReferringExpressionGeneration|REG

6.语言实现–LinguisticRealisation

1.语言是没有规律的,或者说规律是错综复杂的。

2.语言是可以自由组合的,可以组合复杂的语言表达。

3.语言是一个开放集合,我们可以任意的发明创造一些新的表达方式。

4.语言需要联系到实践知识,有一定的知识依赖。

5.语言的使用要基于环境和上下文。

情感分析

互联网上有大量的文本信息,这些信息想要表达的内容是五花八门的,但是他们抒发的情感是一致的:正面/积极的–负面/消极的。

通过情感分析,可以快速了解用户的舆情情况。

聊天机器人

过去只有Siri、小冰这些机器人,大家使用的动力并不强,只是当做一个娱乐的方式。但是最近几年智能音箱的快速发展让大家感受到了聊天机器人的价值。

而且未来随着智能家居,智能汽车的发展,聊天机器人会有更大的使用价值。

语音识别

机器翻译

NLP可以使用传统的机器学习方法来处理,也可以使用深度学习的方法来处理。2种不同的途径也对应着不同的处理步骤。详情如下:

方式1:传统机器学习的NLP流程

1.语料预处理

2.中文语料预处理4个步骤(下文详解)

3.英文语料预处理的6个步骤(下文详解)

4.设计模型

5.模型训练

英文NLP语料预处理的6个步骤

中文NLP语料预处理的4个步骤

1.中文分词–ChineseWordSegmentation

2.词性标注–PartsofSpeech

3.命名实体识别–NER

4.去除停用词

需要论文指导发刊的【AI交叉学科、SCI、CCF-ABC、期刊、会议、本硕博论文、在职论文指导、Kaggle比赛指导、润色发刊等】

白嫖60G入门到进阶AI资源包+kaggle竞赛+就业指导+技术问题答疑

1、超详细的人工智能学习路

2、OpenCV、Pytorch、YOLO等教程

3、人工智能快速入门教程(Python基础、数学基础、NLP)附源码课件数据

THE END
1.一文了解什么是NLP(自然语言处理)图解自然语言处理是如何工作的自然语言处理(NLP)是一种专业分析人类语言的人工智能。(下文皆简称为“NLP”),它的工作原理: 接收自然语言,这种语言是通过人类的自然使用演变而来的,我们每天都用它来交流 转译自然语言,通常是通过基于概率的算法 分析自然语言并输出结果 简而言之,这就是一个创建算法的过程。 https://blog.csdn.net/footless_bird/article/details/143424154
2.重磅!!“NLP系列教程01”之自然语言处理概要自然语言理解的终极目标就是实现AI-Complete[1],它的意思就是能够完全理解和语言代表符号的含义。但是不管以什么标准进行衡量这都是很难达到的,即使拥有最强大脑的人类也很难能达到这一点。 当前自然语言处理的基本流程图如下所示,自然语言理解主要分析的两块分别是句法分析和语义理解。 https://cloud.tencent.com/developer/article/1483235
3.人工智能算法小白入门系列上图(图1)充分展示了自然语言处理工程化中的各个流程模块,依次包括:1. 业务场景分析2. 数据获取 3.数据预处理 4. 特征工程 建模与训练 6. 模型评估 7. 模型部署与管理 8.模型性能与监控等。文章将从这几个维度依次展开解析。 三、细节描述 1、业务场景分析 https://blog.itpub.net/70001864/viewspace-2781679/
4.自然语言处理入门学习<一>本教程英文处理使用的是NLTK这个Python库,中文处理使用的是jieba这个Python库,主要是看July7月学习NLP视频学习而来,如有侵权,立即删除。Natural Language Processing(NLP)自然语言处理主要是处理以及理解自然语言的计算过程。整个自然语言处理的大致流程入下图所示:https://zhuanlan.zhihu.com/p/24219196
5.「自然语言处理(NLP)」入门系列(一)初识NLP自然语言处理流程图 1、语音或文本的输入和初始处理过程,并将其分解成小块进行处理。对于语音来说,这一步叫做语音分析,它包括把语音分解成单个的声音,叫做音素。对于文本输入,这包括光学字符识别(OCR)和标记化。OCR是用来识别文本中的单个字符的,如果它是作为图像而不是字符组成的单词输入的。标记化https://www.jianshu.com/p/f32417329fdf
6.NLP自然语言处理完整流程自然语言处理 完整流程 第一步:获取语料 1、已有语料 2、网上下载、抓取语料 第二步:语料预处理 1、语料清洗 2、分词 3、词性标注 4、去停用词 三、特征工程 1、词袋模型(BoW) 2、词向量 第四步:特征选择 第五步:模型训练 1、模型 2、注意事项 (1)过拟合 (2)欠拟合 (3)对于神经网络,注意梯度消失和https://www.pianshen.com/article/15001392201/
7.自然语言处理示意图自然语言处理基本方法自然语言处理 示意图 自然语言处理基本方法 基本的分词方法包括最大匹配法、最大概率法(最短加权路径法)、最少分词法、基于HMM的分词法、基于互现信息的分词方法、基于字符标注的方法和基于实例的汉语分词方法等。 1.最大匹配法 最大匹配法需要一个词表,分词的过程中用文本的候选词去跟词表中的词匹配,如果匹配https://blog.51cto.com/u_16099320/10554504
8.自然语言处理模型流程包含六个步骤自然语言处理(NLP)模型的一般处理流程可以归纳为以下六个步骤: 一、数据收集与预处理 数据收集:从各种来源收集大规模的文本数据,这些数据将用于训练和优化NLP模型。 预处理:对收集到的文本数据进行清洗和整理,包括去除无关字符、纠正拼写错误、统一格式等。 https://www.ai-indeed.com/encyclopedia/10660.html
9.自然语言处理的流程特征提取是自然语言处理中的另一个关键环节。在这一阶段,研究人员利用各种技术从预处理后的文本中提取有意义的特征。这些特征可能包括词频统计、n-gram特征、TF-IDF值等。此外,深度学习模型如词嵌入技术也可以自动学习文本中的语义特征。最后,模型训练和评估是自然语言处理流程的核心部分。在这一阶段,https://zhidao.baidu.com/question/1778446270156155020.html