关键词:矢量化编码;缺陷跟踪;语音;数据采集
0引言
1数据采集的基本原则
对于老挝留学生来说,汉语语音数据采集起来较为困难,它不同于其它领域中的数据采集。首先,老挝留学生汉语发音偏误类型繁多,偏误产生过程中带有较多的母语“负迁移”现象,难以数字化;其次,老挝留学生汉语发音动作,语声特性以及听感都各具特点。基于以上原因,本文认为老挝留学生的汉语语音数据采集应当遵循以下原则:
1.1科学性原则
1.2数据性原则
1.3实用性原则
实用性原则是指语音数据采集方法、过程应具可行性、可操作性和稳定性。即采集方法要客观明确,采集过程尽可能细化,语音数据易于采集且准确可靠,整体操作有规程约束。
1.4可比性原则
可比性原则是指采集到的语音数据值要保持有效可比,通过将其与参照值(或标准值)对比,清查“可疑数据”,再根据不同的情况,综合评价采集到的语音数据。从语言学角度,可比性原则既指老挝留学生与其他国家留学生在习得汉语语音的层面上可比,也指老挝留学生在老挝留学生之间习得汉语的层面上可比。
2VQF技术与缺陷跟踪机制
2.1VQF技术简介
2.2缺陷跟踪机制
缺陷跟踪主要是完成对缺陷报告的记录、分析和状态更新等管理。一个完善的缺陷跟踪机制对于测试的成功实施是非常重要的。汉语语音数据采集是一个错综复杂、数据吞吐量大、环环相扣的软件过程,除了要对采集数据本身的质量进行控制外,同时也可以对检查、评估、保存和理解数据进行控制,以保证采集过程迭代的顺利进行,这种缺陷跟踪可通过最简单的EXCEL表格和Access数据库来完成(项目研究中使用Excel2007版本)。在老挝留学生汉语语音数据采集过程中引入缺陷跟踪机制,有利于确保采集过程和系统设计的一致性;有利于在早期发现问题所在,降低维护成本,降低重复劳动;有利于反馈每一个采集环节的异常情况,及时做出相应调整。
3数据采集的过程
汉语语音数据采集的主要任务是量化各类发音指标,为采集和保存语音数据而制定的规程需要并入语音评价的整个过程,且使其具有操作性。这就意味着把参与采集的老挝留学生(或者实验员),采集方法以及实践定位到语音采集过程中的适当位置,为随后的分析和比对工作采集和保存语音数据。以下是数据采集的基本过程:
3.1规范化语音数据、记录表格以及存储数据的方式
长期以来,没有形成一套规范的语音数据集,没有规范的记录表格。在对汉语语音采集研究中,每个科研团队采集到的语音数据在格式,取值范围、存储方式上不尽相同,例如,有项目组将语音数据定义为小数,有的定义为整数、指数等等;有的项目组使用数据库技术存储语音数据,而有的则使用纸质版的语图来存储语音数据。这样一来,采集到的数据不但在数值上不准确,不具可比性、操作性,在存储方式上也不一致,更不用说用规范的表格来记录了。鉴于基于老挝留学生发音的汉语语音评价系统是一种信息化的工具,明智的做法是:在采集语音数据之前,针对于每一个语音值,由微格实验室中的计算机专员规定统一的数据类型、数据格式、有效值范围以及规范的记录表格,并规定使用统一的数据库来存储采集到的数据,最后将这些规定形成文字说明。这样做的好处是:便于使用计算机操作和处理语音数据、避免大量重复劳动、提高采集及评价的效率。
3.2采集数据
3.3存储采集到的语音数据
当采集工作结束后,我们需要对已采集到的语音数据进行保存。一般说来,个人计算机数据系统和Excel电子表格对数据保存和分析就足够了。然而,若干指标量化后形成的语音数据是非常庞大的,而且这些数据是多目的的,一个语音数据可能对应着对应一个或者多个测试结果;其次,数据之间的关系复杂、不容易理顺,因此需要建立一个或者多个数据库来存储它们供以后使用。为管理好存储语音数据信息的数据库还应该确认以下内容:①谁负责录入和维护数据;②谁可以访问数据;③数据存储在硬盘上什么位置;④基于建立好的数据库,基于基于老挝留学生发音特征的汉语语音评价系统要具有编辑和检索各类语音数据的机制。
4结束语
参考文献:
[1]袁毅,吴晨.柔性可扩展体系结构非特定人语音识别系统[J].计算机应用研究,2006(12):203-206.
[2]施伟,谢湘.一种基于语音识别的汉语发音评价系统[C].第七届中文信息处理国际会议[C].2007:032-036.
[3]施剑,何成林,杜利民.基于USB2.0的麦克风阵列语音数据采集系统设计[J].计算机工程,2006:216-218.
[4]邓瑶.老挝汉语初学者语音偏误分析及教学策略-基于昆明学院老挝学生普通话语音学习的调查[J].西南学刊第五辑,2013:267-274.
[5]陈展.基于老挝留学生发音特征的汉语语音评价体系研究[J].现代语文(语言研究)西南学刊,2015(3):81-82.
关键词:标示语翻译错误天津商业大学
一、研究背景
标示语是应用于社会公共场合的一种特殊语言现象,涵盖范围广。旨在为一般公众或特殊群体提供宣传和服务的语言标牌或标语均可归于标识语范畴,包括地标、标语、警告标志等。标示语被广泛应用于日常生活各个方面,如公共设施、旅游景点和服务机构。[1]作为最主要的沟通方式之一,标识语为不同文化背景下的人们传递必要的信息,其翻译也越来越吸引公众的眼球。
二、文献综述
标示语翻译研究在国外有很长的历史,而中国有关中英标示语翻译的研究正式开始于20世纪末21世纪初。[1]目前为止对于标示语翻译未成系统,且关于标示语的翻译研究侧重于公共场所,尤其是旅游景点。
三、汉语公共标示语音译错误―以天津商业大学为例
(一)语法错误
公共标示语翻译中出现的语法错误令人震惊。以学生宿舍区标示语为例。在宿舍盥洗室我们可以清楚地看到这样的标示语:Pleasesavingonwater――“请节约用水”,它旨在提醒同学们梳洗时节约用水。根据基本语法规则,正确的翻译形式应为Pleasesavingwater――“请节约用水”。
(二)拼写错误
拼写错误在汉译英标示语中极少见,可能由于译者没有意识到而导致。“公园”Garden被误拼写为Gaden,“厕所”Toilet被误写为Toliet。[2]笔者在学校图书馆发现类似标示语误译:InformationCenterofTourismManament“旅游信息管理中心”。略微用心会发现management被误拼为Manament。如能避免这一错误,该标识语将会更为完美。
(三)拼音式翻译
(四)与英语表达形式不一致
英文在表达方式和结构方面与汉语存在巨大差异,然而部分译者养成了汉语式思维及汉语式翻译的习惯。例如:在公众场合,“小心碰头”被翻译成payattentiontoyourhead。正确翻译应为Watchout或者Becareful。一些警示性标识语如:“禁止吸烟,禁止喧哗”中的“禁止”被翻译成pleasedon’t,因此“禁止吸烟”被译为pleasedon’tsmokehere。尽管公众可以通过此类翻译获得其所要表达的信息,但是翻译本身给人一种粗糙的感觉。如果考虑表达习惯、文化因素,“禁止吸烟”应译为Nosmoking。这样的翻译简洁明了又给公众耳目一新的感觉,且容易让大家理解并接受。
四、标示语翻译的建议
通过分析天津商业大学标识语翻译的错误类型,笔者认为要改善标示语翻译的质量,至少应该注意如下三个方面:
(一)选用合适的词
标示语最基本的功能是向公众传递某种特殊的信息或消息。然而公众对于标示语的理解能力却有所不同,这就意味着标示语翻译应该尽量避免术语化。相反,应该运用一些简单的、易懂的词汇,简洁意达。举例来说,汉语中有“小心碰头”这一标识语,但是翻译中的“小心”,M量避免payattentionto或者becautious等,而一般使用mind。
(二)避免基本的错误
正如在文献综述中指出,标示语翻译中会出现语法错误、拼写错误、拼音翻译等问题。尽管标示语翻译中所产生的拼写错误及语法错误不一定会影响人们对标示语自身的理解,但是会给来访我国的人造成不好的印象。拼音翻译本身不能被看作错误,比如一些具有中国文化特色的事物翻译需要英语与拼音的结合,比如“欣欣蛋糕房”被翻译为Xinxinbakery,比单独的拼音XinxinDangaofang更容易被接受。
(三)培养文化意识
五、结语
注释:
[1]王维民等:《从目的论看公共场所标示语汉英翻译的语用失误―以成都市公共场所标示语英文翻译为例》,译苑新谭,2009年,第1期,第341-352页。
[2]冯亚娜:《浅析标识语英译失误及翻译策略》,海外英语,2013年,第2期,第145-149页。
[1]戴宗显,吕和发.公示语汉英翻译研究[J].中国翻译,2005,(6):38.
[4]栗长江.公安标示语和警示语的英译口译[J].中国翻译,2003,(5):81.
[7]王银泉.公共场所英语翻译错误拾零[J].上海科技翻译,2000,(3):55.
[8]杨芳.北京公示语汉英翻译错误研究[J].东莞理工学院学报,2006,(5):65.
【关键词】负迁移;声调语调;音段音位
一、汉语声调语调的负迁移
语调的定义有狭义与广义之分。狭义的语调是指句子中的音高变化,而广义的语调是指句子中的一切语音特征,包括音高、音长、音强等。
英语被称为“语调语言”(intonationlanguage),英美语音学家一直强调英语语调的重要性,他们形象地把元音辅音比作英语的身体,把语调比作英语的灵魂。与英语不同的是,汉语被称为“声调语言”(tonelanguage)。在汉语中,每个字或音节除了声母韵母两部分外,还有一个绝对固定的声调(又称为字调)。它与声母韵母一样,有着区别词义的重要作用。汉语中也有语调,可以表示语法作用。但汉语语调只是以四种单字调为基本单元建立起来的语调,语调本身升降变化不大,只带有略高或略低的趋势。汉语对语调的要求不如英语对语调的要求那么明显。
1.声调
汉语有阴平、阳平、上声和去声四种区别意义的声调类型以及轻声。例如,“妈m┓麻mᔓ马mǎ”“骂mà”这四个字的声母和韵母完全一样,但是声调不同,就成了四个意义完全不同的字。汉语的声调语调是一种叠加关系。声调会因语调的抑扬而稍有抑扬,但是语调不可能改变声调,因为汉语普通话的四声有区别字义的作用。
2.重音
何善芬[1]对英语和汉语的轻重音进行了对比研究,指出英语的重音有区别词义或词性的功能,是语调和话语节奏结构的基础。汉语的重音在词语中无辨义作用,而汉语的轻音与语义、语法有关,是汉语的一种重要的语音表达手段。语音学中的重音分为词重音和句重音两种。根据何善芬的研究,英语与汉语的词重音主要有以下不同:其一,从二至四音节词的轻重音模式上考虑,英语的词重音模式比汉语的词重音模式要复杂得多。其二,英语的多音节词有主重音、次重音和轻音,并且每个英语单词的重音位置是固定的,有区别词语意义的作用。例如:'overall(罩衣,名词),over'all(全部的,形容词;大体上,副词)。汉语中各音节的轻重音差别不明显,重音的位置也不如英语的严格。除了少数用于区别词义的带轻音的上音节词外,如大意(主要意思)、大·意(疏忽,形容词)。
3.语调
虽然汉语既有声调又有语调,但汉语的语调模式与英语的语调模式不同。汉语语句中的每个字都有声调,语调一般是在句的字调基础上稍作调整,字的声调只根据说话人的语调稍加抑扬。赵元任指出:“(汉语的)任一词可用任一语调来说而不会丧失其词义,语调只表达情感、语气、用途等等。”[2]汉语的语调通常体现在句末的音节上,升调是在句末词语字调的基础上稍扬,句末有语气词或轻音节词时,升调放在倒数第二或第三个音节上,但是由于受末尾汉字声调的影响,语调上扬幅度只有26%;而英语单词没有声调,词的音调受整个句子语调的制约,“在英语音高变化及基频模式结构中起决定作用的是语调,其次是重音”。因而英语单词的音调升降起伏比较自由,升调的幅度最大可达80%。中国学生受汉语声调语调负迁移的影响,讲英语时语调升降起伏较小,没有体现梯级下降的英语语调。英语中的升调通常在最后一个重读音节(调核)上。后面若有非重读音节,则语调继续上升,但是非重读音节的响度不能超过调核音节。中国学生受母语语调影响,总是直到最后一个音节才开始将语调上升,不管它是调核音节还是非重读音节,结果把英语的非重读音节当做调核使用。
二、音段音位对语音的影响
音段音位包括元音,辅音,元音辅音之间的相互组合(这个概念对英汉两种语言均适用)。当人们把听到的语音分解成最小的单位时,这些单位从语音学角度就叫做音素;音节是一个言语单位,最少由一个元音组成,最多由一个辅音或辅音簇加一个元音,再加一个辅音或辅音簇组成。
1.音素
语音的最小单位是音素。英语的音素就是我们在语言交流中所听到或发出的声音。比如当我们听到单词glass时,可以例举的音素有[g][l][a:][s]。汉语的音素就是拼音,包括声母和韵母。英语中有许多因素的发音与汉语的发音是相似的,有些是汉语中根本没有的。值得注意的是,在英汉两种语言中,并没有两个发音完全相同的音素。比如,英语中的元音有长短之分,而长短音在汉语中并不存在,汉语拼音i的音长介于[i:]和[i]之间,同时,发音部位也有细微差别;英语中的双元音由一个音向另一个音滑动而形成,滑动较慢,发音比较圆润。而汉语复韵母中这种滑动并不明显,舌位滑动过程较快,两成分听起来浑然一体,类似于一个音。
1.2音节
英语中多为多音节单词,因此在读音方面大多是音素组合成节,音节构成单词(单音节单词除外,如I,其音素为双音节[ai],单词含义是“我”)。汉语的一个汉字就是一个音节。在两种语言的比较中可以发现,英语以开音节结尾的单词和以闭音节结尾的单词在数量上几乎相等,而汉字的音节结构是以开音节占多数,闭音节较少,只有以n,ang等结尾的少数几种。所以中国学生发辅音时习惯在辅音后加上一个元音,如把please[pli﹕z]念成[pli﹕z]。此外,由于英语音节结构的复杂性,在两个单词作为短语出现时有时可以连读,如getup;汉语与之相反,每一个音节(汉字)都有一个特定的含义,内部的各音素具有强烈的凝聚性,而音节外的语素又具有强烈的排他性。
语音是语言的外壳,任何一种有声语言都离不开语音。打好坚实的语音基础,是拥有优美地道口语的先决条件。在了解了汉语语音在以上方面对英语口语的影响以及英汉两种语言的语音差异后,可以针对性地纠正一些不地道的英语发音,多加练习,不断提高发音的准确性。
[1]何善芬.实用英语语音学[M].北京:北京师范大学出版社.1999
[2]赵元任.英语语调(附美语变体)与汉语对应语调初探[c]ll赵元任语言学论文集.北京:商务印书馆,2002:7.19.
【关键词】汉语语音误区对策
在外文学习的起始阶段是否能把语音问题弄清楚,对学习者而言至关重要。而如果在初始阶段学生没有在语音方面得到正确的指引,那么这些语音的错误将会继续延续到词汇和文法的学习阶段。在对外汉语教学中,教师们对语音方面的教学有着不同的方法,但不可否认的是,同时也存在着一些误区,这不仅导致了教学效率低下的问题,同时也给汉语学习者留下了难以纠正的语音“化石”。为了提高汉语语音教学的质量,减少学生的语音偏误,我们应该尽量走出这些误区,使语音教学得到更大收获。本文主要对目前对外汉语教学中的语音教学里面存在的几个误区作出一些探讨与分析。
一、汉语语音教学误区浅析及应对策略
2.误区二:将汉语语音与汉字完全分开教学。在目前国内的汉语教学中,部分教师在完成前期阶段的语音教学后,学习重心就马上转到了汉字,词汇或文法的教学。而汉语语音的教学就逐渐被淡忘了,这样一来,学生的语音学习就无法加以巩固。
3.误区三:过度强调单音练习且脱离语境教语音。汉语的词大部分是双音节词,掌握了双音节词的声调,就等于掌握了大部分汉语词的声调。因此,在声母和韵母方面已有充分练习的基础上,做一些词汇声调对比练习。这样的练习即便是对汉语初学者而言也并没有增加难度,反而会让他们对汉语有更深刻的感知。在语音教学的深度中,基本上所有的教材都忽略了汉语音节内组合和音节间组合的难点。在音节间的联音变化和如何区分音节界限都会影响说话的自然程度,如果这方面没有被重视,就会出现不是句中音节间隔相差太大,听上去断断续续,就是在句子各音节发音相互不关联,听上去就像一个个独立的音节往外奔,要不就是把“西安”念成“先”,或是“棉袄”念成“棉脑”。所以在教学中应该把汉语语音内与音节间的语音规则也作为教学的内容之一。因此,在语音学习阶段,也可以适当安排词汇音节,音变的难点训练。
二、结语
有缺陷的发音可能暂时能达到交际的目的,但从长远来看,语音的缺陷会成为日后的隐患,而且一旦缺陷成为习惯,就很难纠正了。因此,基础汉语语音知识是初级阶段教学的重点,但是语音学习的过程相对比较枯燥和容易引起学生畏惧,为了保护学生学习的积极性,教师在初期阶段不应过分强调语音语调的正确性。把纠正语音语调尽量放在教生字的时候进行,那时可以反复教,反复练。尽量让学生经过自己思考,知道哪儿错了,为什么错,怎么说才对。对初学者,不要过多重复学生的错音错调,这样会让学生以误为正,造成混乱,同样这种课堂上反复纠正的紧张气氛不仅不能使学生放松,而且还会伤害他们的自尊心,削弱他们的自信心。总之,汉语教学要使语音学习贯穿整个语言教学,而尽量避免走入误区,巧用教师的声音技巧,教师多示范,学生多模仿,并进行多次循环复习,从而提高教学效率。
[1]王红.浅谈海外中文教学的几个误区[N].人民日报海外版.2007.
关键词:MELP;基频;共振峰
耳语是人们的语言交流方式之一,在会场、音乐厅、图书馆等禁止大声喧哗的场所被广泛应用。以前对耳语音的研究主要停留在语音基础研究和医学工作的需要,但是随着科学技术的发展,耳语音的研究逐渐走向实际应用,主要是耳语音的识别、耳语音转换为正常音、耳语音的情感分析等等。
近些年来对耳语的研究逐渐受到世界各国研究人员的重视。由于耳语音没有基频,而进行耳语音向正常音的转换则是从无基频到有基频的转换,显然对需要基频存在的条件下进行的不同话者的语音转换不适用于耳语音。目前,关于耳语音转换为正常音的研究还处于起步阶段,主要有Morris、Sharifzadeh及Ahmadi进行了这方面的研究。Morris提出谱修正法来进行英语耳语音的转换【1】。Sharifzadeh【2】和Ahmadi【3】分别提出用CELP模型去实现耳语音转换为正常音。
本文的模型是基于MELP模型。利用MELP声码器的语音编码和解码,对所编码模型部分进行修改已达到适合汉语耳语音转化为正常的目的。转换的目的就是保留语义的条件下,使转换后的语音逼近正常语音。由于耳语音相比于正常音发声时声带不震动、声道拉长,而且语音的能量较弱,这就导致耳语音的基频、声道参数、增益等存在着差别。通过MELP解码器把修改后的参数进行合成语音。对于这些差别,通过一些处理得到所需要的参数。基频只存在汉语正常音的韵母中,所以在添加基频的时候就要对语音进行声韵分割。对于声道参数使用一种在线性频谱域修改共振峰的方法。故提出了图1所示的转换语音的MELP模型。
本文第二部分,我们说明如何进行端点检测和声韵分割。第三部分,如何添加基频。第四部分,修改声道的共振峰参数。第五部分说明模型其余参数的设定。第六部分为实验结果。第七部分为本文的结论。
2添加基频
对于耳语音声调与耳语音的幅值包络、音长存在着关系【7】。以包络最大值出现的位置不同及变化趋势不同,将包络曲线分为:平台型、前峰型、中峰型、后峰型和双峰型。一声包络主要有平台型和前峰型,二声主要是前峰型和中峰型,三声主要是双峰型,四声主要是前峰型。一般情况下,音长与声调也存在复杂的对应关系。
3共振峰参数
b)共振峰带宽的改变
傅氏级数幅度值的计算是以语音的基音周期为基础,而耳语音没有基频,因此很难算出其值。但将其设置为1得到的合成语音波形及音质没有太大区别。因此在这转换过程中,傅氏级数幅度值设置为1。
5实验结果
6结论
本文使用基于MELP的方法来实现汉语耳语音转换为正常音。修改的MELP模型很有效的实现了转换语音,并且修改后得到的语音有很好的可懂度。
[1]RobertW.Morris,MarkA.Clements.Reconstructionofspeechfromwhispers[J].MedicalEngineering&Physics.2002;24:515-520
[2]HamidRezaSharifzadeh,etc.ReconstructionofNormalSoundingSpeechforLaryngectomyPatientsThroughaModifiedCELPCodec[J].IEEETransactionsonBiomedicalEngineering.2010;57:2448-2458
[3]FarzenehAhmadi,etc.Analysis–by-SynthesisMethodforWhisper-SpeechReconstruction[J].IEEEConference.2008;9:1280-1283
[4]栗学丽,丁慧,徐柏龄.基于熵函数的耳语音声韵分割法[J].声学学报.2005,30:69-75.
[5]杨顺安.五度字调模型在合成汉语语音中的应用[J].方言.1987,2:142-147.
[6]A.V.OppenheimandR.W.Schafer,Discrete-TimeSignalProcessing[M].EnglewoodCliffs,NJ:Prentice-Hall,1989.
[7]徐敏.基于MELP模型的汉语耳语音转换为正常音的实现[D].苏州:苏州大学,2007.
中山大学国际汉语教材研发与培训基地;中山大学中国语言文学系