人工智能应用:自然语言处理简述下篇广东工业大学信息物理融合系统

自然语言处理的困难可以罗列出来很多,不过关键在于消除歧义问题,如词法分析、句法分析、语义分析等过程中存在的歧义问题,简称为消歧。而正确的消歧需要大量的知识,包括语言学知识(如词法、句法、语义、上下文等)和世界知识(与语言无关)。这带来自然语言处理的两个主要困难。

首先,语言中充满了大量的歧义,这主要体现在词法、句法及语义三个层次上。歧义的产生是由于自然语言所描述的对象――人类活动非常复杂,而语言的词汇和句法规则又是有限的,这就造成同一种语言形式可能具有多种含义。

例如单词定界问题是属于词法层面的消歧任务。在口语中,词与词之间通常是连贯说出来的。在书面语中,中文等语言也没有词与词之间的边界。由于单词是承载语义的最小单元,要解决自然语言处理,单词的边界界定问题首当其冲。特别是中文文本通常由连续的字序列组成,词与词之间缺少天然的分隔符,因此中文信息处理比英文等西方语言多一步工序,即确定词的边界,我们称为“中文自动分词”任务。通俗的说就是要由计算机在词与词之间自动加上分隔符,从而将中文文本切分为独立的单词。例如一个句子“今天天气晴朗”的带有分隔符的切分文本是“今天|天气|晴朗”。中文自动分词处于中文自然语言处理的底层,是公认的中文信息处理的第一道工序,扮演着重要的角色,主要存在新词发现和歧义切分等问题。我们注意到:正确的单词切分取决于对文本语义的正确理解,而单词切分又是理解语言的最初的一道工序。这样的一个“鸡生蛋、蛋生鸡”的问题自然成了(中文)自然语言处理的第一条拦路虎。

其他级别的语言单位也存在着各种歧义问题。例如在短语级别上,“进口彩电”可以理解为动宾关系(从国外进口了一批彩电),也可以理解为偏正关系(从国外进口的彩电)。又如在句子级别上,“做手术的是她的父亲”可以理解为她父亲生病了需要做手术,也可以理解为她父亲是医生,帮别人做手术。总之,同样一个单词、短语或者句子有多种可能的理解,表示多种可能的语义。如果不能解决好各级语言单位的歧义问题,我们就无法正确理解语言要表达的意思。

另外一个方面,消除歧义所需要的知识在获取、表达以及运用上存在困难。由于语言处理的复杂性,合适的语言处理方法和模型难以设计。

例如上下文知识的获取问题。在试图理解一句话的时候,即使不存在歧义问题,我们也往往需要考虑上下文的影响。所谓的“上下文”指的是当前所说这句话所处的语言环境,例如说话人所处的环境,或者是这句话的前几句话或者后几句话,等等。假如当前这句话中存在指代词的时候,我们需要通过这句话前面的句子来推断这个指代词是指的什么。我们以“小明欺负小亮,因此我批评了他”为例。在其中的第二句话中的“他”是指代“小明”还是“小亮”呢?要正确理解这句话,我们就要理解上句话“小明欺负小亮”意味着“小明”做得不对,因此第二句中的“他”应当指代的是“小明”。由于上下文对于当前句子的暗示形式是多种多样的,因此如何考虑上下文影响问题是自然语言处理中的主要困难之一。

再如背景知识问题。正确理解人类语言还要有足够的背景知识。举一个简单的例子,在机器翻译研究的初期,人们经常举一个例子来说明机器翻译任务的艰巨性。在英语中“Thespiritiswillingbutthefleshisweak.”,意思是“心有余而力不足”。但是当时的某个机器翻译系统将这句英文翻译到俄语,然后再翻译回英语的时候,却变成了“TheVoltkaisstrongbutthemeatisrotten.”,意思是“伏特加酒是浓的,但肉却腐烂了”。从字面意义上看,“spirit”(烈性酒)与“Voltka”(伏特加)对译似无问题,而“flesh”和“meat”也都有肉的意思。那么这两句话在意义上为什么会南辕北辙呢?关键的问题就在于在翻译的过程中,机器翻译系统对于英语成语并无了解,仅仅是从字面上进行翻译,结果自然失之毫厘,差之千里。

从上面的两个方面的主要困难,我们看到自然语言处理这个难题的根源就是人类语言的复杂性和语言描述的外部世界的复杂性。人类语言承担着人类表达情感、交流思想、传播知识等重要功能,因此需要具备强大的灵活性和表达能力,而理解语言所需要的知识又是无止境的。相信经过不断的实践努力,自然语言处理能够让机器更加的善解人意。

THE END
1.自然语言处理与Transformer模型:革新语言理解的新时代计算效率:通过并行处理整个输入序列,Transformer模型大幅提高了训练和推理的速度。灵活性和通用性:Transformer模型不仅在NLP任务中表现优异,还被广泛应用于计算机视觉、推荐系统等其他领域。第一部分:自然语言处理概述 自然语言处理(Natural Language Processing, NLP)是人工智能和计算机科学的一个重要分支,致力于使https://baijiahao.baidu.com/s?id=1803524205567050232&wfr=spider&for=pc
2.人工智能的研究热点:自然语言处理人工智能(Artificial Intelligence,简称AI)作为新一轮科技革命和产业变革的重要驱动力量,正在深刻地影响世界、改变世界。而自然语言处理(Natural Language Processing,简称NLP)已成为AI领域的研究热点,它推动着语言智能的持续发展和突破,并越来越多地应用于各个行业。 https://www.51cto.com/article/626970.html
3.为什么说自然语言处理是人工智能的核心腾讯云开发者社区机器能跟我们人类交流吗,能像我们人类一样理解文本吗,这是大家对人工智能最初的幻想。如今,它已成为人工智能的核心领域——自然语言处理(简称:NLP)。自然语言处理是一门融语言学、计算机科学、人工智能于一体的科学,解决的是“让机器可以理解自然语言”——这一到目前为止都还只是人类独有的特权,因此,被誉为人工https://cloud.tencent.com/developer/article/1087194
4.自然语言处理NLP文本分析及挖掘舆情识别人工智能智能搜索算法 产品能力 基础文本服务 NLP自然语言处理基础原子能力,提供词法、句法、篇章分析等API中的通用能力,包含分词、命名实体识别、词性标注、文本纠错等。 多语言分词:将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列,常应用于文本搜索、自动问答等领域。 https://ai.aliyun.com/nlp
5.人工智能自然语言处理技术原理介绍自然语言处理(Natural Language Processing,NLP)是人工智能领域中的一个重要分支,致力于让计算机能够理解、解释、处理和生成人类语言。NLP技术的应用范围涵盖了机器翻译、情感分析、语音识别、问答系统等多个领域,对于推动人机交互、信息检索和智能决策等方面发挥着关键作用。在本文中,我们将介绍自然语言处理技术的基本原理,https://zhuanlan.zhihu.com/p/669605397
6.人工智能编程的自然语言处理技术应用案例自然语言处理(Natural Language Processing,NLP)是人工智能领域的一个重要分支,其目的是使计算机能够理解、解释、操纵和处理人类语言。近年来,随着人工智能技术的快速发展,NLP技术在各个领域得到了广泛的应用。 二、智能客服系统 智能客服系统是NLP在商业领域中的一个典型应用。通过语音识别和自然语言理解技术,智能客服系统https://www.jianshu.com/p/81ae84e8db72
7.自然语言处理人工智能自然语言处理(Natural Language Processing,NLP )是人工智能涉及到的非常重要的技术之一,其目的是用自然语言实现人机交互,涉及到计算机科学、人工智能、语言学等众多学科。 实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,即自然语言理解,也能以自然语言文本来表达给定的意图、思想等,即自然语言生成。https://www.zhiding.cn/wiki-NLP
8.自然语言处理(普通高等教育人工智能专业系列教材)(豆瓣)自然语言处理是人工智能的重要分支,本书是一本自然语言处理的入门教材,主要面向高年级本科生和低年级研究生。本着理论结合实践的基本原则,本书共分为 11 章,其中第 1 章概述了自然语言处理的研究内容、发展历程、技术特色和当前现状,是概述性的一章。第 2 章是自然语言处理的编程基础,对 Python 语言及其相关模块https://book.douban.com/subject/35889856/
9.《自然语言处理(普通高等教育人工智能专业系列教材)》(冯建周著当当网图书频道在线销售正版《自然语言处理(普通高等教育人工智能专业系列教材)》,作者:冯建周 著,出版社:水利水电出版社。最新《自然语言处理(普通高等教育人工智能专业系列教材)》简介、书评、试读、价格、图片等相关信息,尽在DangDang.com,网购《自然语言处理http://product.dangdang.com/29394748.html
10.自然语言处理(NLP)解决方案IBM自然语言处理 (NLP) 是人工智能和计算机科学的一个子领域,专注于数据的标记化,即将人类语言分解为其基本组成部分。NLP 通过将计算语言学与统计机器学习技术和深度学习模型相结合,让计算机能够处理文本或语音数据形式的人类语言。词形还原和部分语音标记有助于深入理解语言,包括语境、说话者或作者的意图和情感。 https://www.ibm.com/cn-zh/natural-language-processing
11.自然语言处理(NLP)的工作原理语言模型与计算机科学和人工智能(AI)密切相关,是人工智能的一个重要分支学科——自然语言处理(NLP)的基础。人工智能的主要目标是模拟人类智能。语言是人类认知的决定性特征,对这一努力来说是必不可少的。 好的语言模型旨在理解和生成类似人类的文本,实现机器学习,其中机器理解单词之间的上下文、情感和语义关系,包括语法https://www.skycaiji.com/aigc/ai15335.html
12.人工智能如何过“语言关”?专家前瞻人工智能发展新华社北京7月23日电(记者董瑞丰)丢一块石头到水里会发生什么?人工智能可以战胜围棋大师,却会被这样的简单问题难倒——对自然语言的处理仍是一个待解难题。 23日在北京召开的第二届语言与智能高峰论坛上,业界专家就人工智能如何突破自然语言处理展开研讨,同时向公众展示了语言智能领域的创新成果。 https://news.cctv.com/m/a/index.shtml?id=ARTIMCMpys5TmawkSHp9YArK170723
13.自然语言处理入门自然语言处理?(Natural Language Processing,NLP)是一门融合了计算机科学、人工智能以及语言学的交叉学科,它们的关系如图 1-1 所示。这门学科研究的是如何通过机器学习等技术,让计算机学会处理人类语言,乃至实现终极目标——理解人类语言或人工智能①。 事实上,自然语言处理这个术语并没有被广泛接受的定义②。注重语言https://www.ituring.com.cn/book/tupubarticle/28291
14.冯洋中国科学院大学冯洋,中国科学院计算技术研究所 研究员、博士生导师、自然语言处理团队负责人、“新百星人才引进计划”入选者,计算机学会杰出会员、人工智能学会首批杰出会员。在中科院计算所获得博士学位后,先后前往谢菲尔德大学和南加州大学信息科学研究所(USC/ISI)开展研究工作。(曾)担任中文信息学会青年工作委员会副主任、计算语言学专https://teacher.ucas.ac.cn/~yangfeng
15.人工智能和自然语言处理的区别是什么人工智能(Artificial Intelligence,AI)和自然语言处理(Natural Language Processing,NLP)是两个相关但不同的概念。 以下是它们之间的主要区别: 定义和范围: 人工智能:这是一个更广泛的概念,指的是使机器能够模拟人类智能的理论、设计、开发和应用技术,包括机器学习、深度学习、计算机视觉、自然语言处理等多个子领域。 https://www.ai-indeed.com/encyclopedia/9233.html
16.自然语言处理的8个常用工具nlp自然语言处理(Natural Language Processing,简称NLP)是人工智能领域的一个重要分支,用于处理和分析人类语言。在NLP的研究和应用中,有许多强大的工具和库可供使用。本文将介绍8个常用的NLP工具,并提供相关的源代码示例。 NLTK(Natural Language Toolkit) NLTK是Python中最常用的NLP工具之一,提供了丰富的文本处理功能和算法https://download.csdn.net/blog/column/12442398/133333967