手把手教你看懂NLP自然语言处理(4个典型应用+5个难点+6个实现步骤)
NLP为什么重要?“语言理解是人工智能领域皇冠上的明珠”——比尔·盖茨
在非结构数据中,文本的数量是最多的,他虽然没有图片和视频占用的空间大,但是他的信息量是最大的。
为了能够分析和利用这些文本信息,我们就需要利用NLP技术,让机器理解这些文本信息,并加以利用。
自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。
不同的语言之间是无法沟通的,比如说人类就无法听懂狗叫,甚至不同语言的人类之间都无法直接交流,需要翻译才能交流。
而计算机更是如此,为了让计算机之间互相交流,人们让所有计算机都遵守一些规则,计算机的这些规则就是计算机之间的语言。
既然不同人类语言之间可以有翻译,那么人类和机器之间是否可以通过“翻译”的方式来直接交流呢?
NLP就是人类和机器之间沟通的桥梁!
1.自然语言理解–NLU|NLI
2.自然语言生成–NLG
自然语言理解–NLU|NLI
自然语言理解就是希望机器像人一样,具备正常人的语言理解能力,由于自然语言在理解上有很多难点(下面详细说明),所以NLU是至今还远不如人类的表现。
自然语言理解的5个难点:
1.语言的多样性
2.语言的歧义性
3.语言的鲁棒性
4.语言的知识依赖
5.语言的上下文
自然语言生成–NLG
NLG的6个步骤:
1.内容确定–ContentDetermination
2.文本结构–TextStructuring
3.句子聚合–SentenceAggregation
4.语法化–Lexicalisation
5.参考表达式生成–ReferringExpressionGeneration|REG
6.语言实现–LinguisticRealisation
1.语言是没有规律的,或者说规律是错综复杂的。
2.语言是可以自由组合的,可以组合复杂的语言表达。
3.语言是一个开放集合,我们可以任意的发明创造一些新的表达方式。
4.语言需要联系到实践知识,有一定的知识依赖。
5.语言的使用要基于环境和上下文。
情感分析
互联网上有大量的文本信息,这些信息想要表达的内容是五花八门的,但是他们抒发的情感是一致的:正面/积极的–负面/消极的。
通过情感分析,可以快速了解用户的舆情情况。
聊天机器人
过去只有Siri、小冰这些机器人,大家使用的动力并不强,只是当做一个娱乐的方式。但是最近几年智能音箱的快速发展让大家感受到了聊天机器人的价值。
而且未来随着智能家居,智能汽车的发展,聊天机器人会有更大的使用价值。
语音识别
机器翻译
NLP可以使用传统的机器学习方法来处理,也可以使用深度学习的方法来处理。2种不同的途径也对应着不同的处理步骤。详情如下:
方式1:传统机器学习的NLP流程
1.语料预处理
2.中文语料预处理4个步骤(下文详解)
3.英文语料预处理的6个步骤(下文详解)
4.设计模型
5.模型训练
英文NLP语料预处理的6个步骤
中文NLP语料预处理的4个步骤
1.中文分词–ChineseWordSegmentation
2.词性标注–PartsofSpeech
3.命名实体识别–NER
4.去除停用词
需要论文指导发刊的【AI交叉学科、SCI、CCF-ABC、期刊、会议、本硕博论文、在职论文指导、Kaggle比赛指导、润色发刊等】
白嫖60G入门到进阶AI资源包+kaggle竞赛+就业指导+技术问题答疑
1、超详细的人工智能学习路
2、OpenCV、Pytorch、YOLO等教程
3、人工智能快速入门教程(Python基础、数学基础、NLP)附源码课件数据