人工智能进入翻译领域:让计算机听懂人类语言

国内生产的智能翻译机器人“飞飞”。

在国际会议上,翻译人员是人们熟悉的,但翻译机器人就鲜见了?日前,在国际计算语言学联合会2015年年会(ACL-2015)的终身成就奖颁奖互动环节上,来自百度公司的机器人“小度”,就担任起了这样的角色。

中文自有“特殊性”信息处理“特别难”

1947年,美国数学家、工程师沃伦·韦弗提出了以计算机进行翻译的设想,机器翻译从此步入历史舞台。上世纪50年代,机器翻译研究持续走俏,美、苏等国家均出现了研究热潮。

与此同时,机器翻译的研究工作在中国也逐步展开。据李生介绍,1959年中国演示了第一部机器翻译系统,可将9种俄文句型译成中文。1985年,李生团队研制出汉英机器翻译系统CEMT-I,成为我国第一个通过技术鉴定的汉英机器翻译系统。

自然语言相对于形式语言而言,后者是人类设计出来的、可为数学和计算机处理的标准化语言,而自然语言即人类所说的话语。机器翻译作为自然语言处理的重要领域,涉及数学、语言学、计算机科学等多个学科。“对自然语言的处理包括分析、理解及转换生成等任务。”李生介绍,“比如对语言词法、语法、语义、情感、主题的研究就属于分析和理解;而翻译、文摘等则属于语言的转换生成。”

让原本只认识“0”和“1”的计算机去理解和处理人类的语言有多难,作为中国中文信息学会理事长的李生对此深有体会,他举了两个例子:“别人对你说‘你可真行’,那么他是在夸奖你,还是在责怪你?这需要基于特定的语境才能分析出来;反过来,一种意思也会有多种表达方式,比如说‘我饿了’和‘我的肚子咕咕叫了’字面表达虽不同,意思却是一致的。”

“中文的传统文化积淀很深厚,使得话语往往有更深层的含义。如果不联系语境,很易产生歧义。”百度公司自然语言处理部高级研究员赵世奇对此表示认同。他表示,“英文是偏结构化的语言,而中文是自由的线性语言”,因此中文在信息处理上有一些“特有”的难题,比如自动分词、句法分析、歧义消解等。

词是表达语义的基本单元,分词就是将一句话或短语切分成一个一个单独的词语。李生以英文作比较,“英文中,单词以空格分开,而中文词语却没有形式上的分界符,也没有形态变化,这都增加了处理的难度。”此外,在语音层面,汉语中存在大量同音字词,又包含复杂的声调系统和变音变调现象,这都给语音识别带来了困难。

中国学人在努力发展驶入“快车道”

近年来,自然语言处理研究持续走热。统计数据显示,本次年会收到的论文数量比上一届增长了17%,为史上之最。其中,来自中国的论文数量超过总量的20%,仅次于美国。

值得一提的是,在本届年会上,李生被授予“ACL终身成就奖”。而在此之前,百度技术副总裁王海峰于2013年1月正式出任ACL主席,成为该组织50年历史上第一位华人主席。

“自然语言处理每个方向上都有很多优秀的学者在努力,这也是该领域可以愈发繁荣的原因。”李生表示,这些年中国的自然语言处理发展很快,在中文处理上已经走在了世界前列。

据赵世奇介绍,10年前能在ACL这类顶级国际会议上发表论文的中国学者还屈指可数。“10年间,中国在自然语言处理的各个方向上都取得了非常显著的发展,无论是研究水平,还是研究人员和学生的能力,都是今非昔比。”

在此次年会上,记者就看到了很多中国年轻学人的成果:来自百度的研究员,将深度学习技术应用于机器翻译,使得译文质量得到了明显改善;清华大学的团队,通过统计词语出现的上下文环境,利用联合矩阵分解,实现跨语言的词向量学习;“中央研究院”和台湾大学的学生们,利用对新闻语料语言模式的自动学习,可预测读者情绪,辅助写作。

“近年来,随着深度学习技术的发展,研究者们基于深度学习模型来进行语义表示,同时也将深度学习模型用于提升信息检索、机器翻译等应用方向的效果,这些都取得了明显的收益。”李生介绍,“像自动问答、知识挖掘、情感分析等方向研究的人也很多,尤其是随着互联网大数据时代的到来,人们意识到这些技术对于提升用户获取信息的效率将发挥重要作用。”

深度学习成主流人工智能大可为

20世纪60年代,美国语言学家乔姆斯基提出转换生成语法,此后基于规则的理性主义和基于统计的经验主义就成为自然语言处理方法论上的两大“阵营”。

“我在60、70年代做机器翻译是基于规则的,然后是基于实例的翻译方法。后来基于统计的机器翻译取代前两者,成为目前的主流。”李生表示,自然语言处理是与时俱进的,互联网大数据时代,人们的新需求、新理想都被从中挖掘出来,成为新的研究问题。

对于未来研究走向何方?李生有自己的见解。“基于深度学习的、基于多层神经网络的机器翻译有可能会成为主流。但是各种方法都有利弊,我希望年轻学人博采众长,将基于深度学习的方法和基于规则、基于实例、基于统计的方法结合起来,发挥各自的长处。

美国发明家、作家、未来学家雷·科兹威尔曾预测,到2029年,机器翻译的译文质量将达到人工翻译的水准。“技术发展没有极限,如果说有,那也许就是人类想象力的上限。”李生相信,未来自然语言处理将是人工智能中非常重要的研究领域。(记者蒋波)

THE END
1.信息化时代的翻译是:Theinformationage中文翻译英文意思,翻译a信息化时代 Informationization time[translate]http://eyu.zaixian-fanyi.com/fan_yi_7061266
2.翻译让中国发出最强音中国访谈在经济全球化和时代信息化的今天,翻译的工作不是减少了,而是加重了。翻译事业是否被赋予了新的内容和使命呢?今天我们非常高兴地邀请到了国际译联副主席、中国翻译协会副会长兼秘书长黄友义先生做客我们的演播间,他将就中国翻译事业的成就和发展做一个回顾和展望。欢迎您,黄秘书长。http://fangtan.china.com.cn/2009-11/10/content_18861830.htm
3.传神翻译教学实训系统信息化时代的“翻译”不仅仅是翻译!信息化时代的翻译是一项由“语言互译”、“管理艺术”、“IT技术”结合而成的复杂组合体!翻译服务供应商对从业人员提出了更高的要求,职业译员不仅需要具备双语/多语的转换能力,同时还特别强调团队合作能力、CAT辅助工具操作技能等专业化的职业技能。 https://sfl.swjtu.edu.cn/info/1137/4480.htm
4.信息化背景下,大学英语翻译教学有效方法当前,信息化时代越来越发达,信息化教学也伴随着信息化时代的到来而出现。信息化教学方式的重点突出对象是学生而非教师,结合多种教学方法,提高学生的学习能力,如情景再现,教师可以播放一段视频,让学生模仿视频中内容,或者教师与学生进行互动,从而提高学生的口语能力。 同时,也可以让学生用英语描述一件事,从而提高学生的https://baijiahao.baidu.com/s?id=1733513499612272545&wfr=spider&for=pc
5.数字科普什么是信息化数字化智能化智慧化与数智化?智能化是在数字化和信息化的基础上,通过应用人工智能技术,实现系统的自动化和智能化决策。智能化的发展使得机器能够模拟人类的思维和行为,从而提高生产效率和服务质量。在智能化时代,我们可利用人工智能技术实现语音识别、图像识别、自然语言处理等功能,为人们的生活和工作带来极大的便利。数字化主要聚焦于数据的收集、处https://www.thepaper.cn/newsDetail_forward_27878218
6.作为身处于信息化时代下的翻译工作者,我们不仅要充分发挥语言能力充作为身处于信息化时代下的翻译工作者,我们不仅要充分发挥语言能力、充实和丰富翻译能力,还要学会最大化利用机器来进行辅助翻译。网络为我们提供了很多便利。我们既可以搜索非专业领域的术语,也可以查找、翻译外来词汇和相关信息,确认用词的准确性,检验译文是否准确。学会合理有效的利用各种网络资源来加快翻译速度,成为一名https://zhuanlan.zhihu.com/p/578751036
7.信息化时代的挑战与机遇:探究其深远影响一、信息化引领时代变革 随着科技的飞速发展,信息化已经成为当今社会不可或缺的一部分。从互联网、大数据到云计算,信息技术的革新正在深刻改变人们的生活方式。信息化的普及,使得信息的获取、处理和分享变得极为便捷,推动了社会生产力的极大提升。 首先,信息化在教育领域的应用,使得在线教育成为可能。无论是城市还是乡https://blog.csdn.net/JiYan_cyan/article/details/144390047
8.信息化智能化:重塑未来社会的力量在当今快速发展的科技时代,信息化与智能化已成为推动社会进步的重要力量。从企业的数字化转型到智慧城市的建设,从人工智能的广泛应用到5G技术的普及,信息化与智能化正深刻改变着我们的生活和工作方式。本文将深入探讨信息化与智能化的内涵、发展历程、应用场景以及对未来社会的影响。 https://pbids.com/aboutUs/pbidsNews/1861295757862211584
9.信息化时代的到来不知大家是否意识到,我们已经从工业化时代进入到信息化时代。这种转变,会对我们每一个人的生活产生很大的影响。现在是二十一世纪,我们已经处在一个无固定职业的社会。也就是说,今天在座的诸位,不管你现在是老板,还是工薪族,如果你还自认为你现有的职业或事业,是可以终身不变的,那将是非常危险和不现实的想法。https://www.meipian.cn/58pvdcfj