本人上一次正式英语考试大约是五年前大学四级考试,得分442,大学每学期考试基本是60多分过线就好,纯属英语渣底子很差。但是由于一些特殊需求,雅思需要考到6.5分及以上,所以自2018年6月份开始一直在学习英语。在学习过程中,对语言学习从陌生到熟悉,从毫无头绪到了解一些实用的训练方法,从乱看经验经常换方法到总结出自己的学习方法。
经过四个月断续学习+接近两个月的全职突击备考,考了PTE考试(类似雅思的英语水平测试)并拿到63分,对应雅思6.5中上,满足大部分学校留学要求以及出国技术移民的要求。备考过程十分艰苦,个人感觉远超高考。虽然离十分流畅的跟NativeSpeaker交流还有一段距离,但是相比四级442的水平有了几倍的提升。故此编写教程进行阶段性总结,一来方便自己制定下一步训练计划,二来希望可以对同等水平有需求的朋友有所帮助。
需要补充的是,由于本人的水平有限而且也在持续学习,后续会经常完善、升级、更新本指南,强烈建议Watch并时而回来看看。因此如果转载本指南,请保留出处避免信息过时。如有异议或者建议,也十分欢迎在Issue中讨论。还需要注意的是,由于本文是文本形式,不好播放声音,所以用中文来描述一些单词的错误发音,在日常英语学习中应该使用音标而不能使用中文标注发音。
语言学习的本质浅析
语言的本质功能是人与人或物体之间的意识、知识的交换,它是几种方法中最高效和具备扩展性的方法,但并不是唯一方法。举几个例子:
1.在国外旅行,当地语言可能不会,但不会饿死。点餐的时候可以用this大法或者手指指菜,当然也可以打开大众点评之类的,给服务员展示图片下单。2.看一本俄语、韩语、日本语的JavaScript书籍时,你可能不懂上下文是什么意思,但你看到中间的JavaScript示例代码,就明白上面可能讲的是什么东西。3.一个外国人表情愤怒、语速飞快、声音大声,即便你听不懂他在说什么,但你可以明白他现在很愤怒,可能在骂人。
从上面的案例你可以看到,即便你不懂语言,也可以交换意见,只是掌握语言之后,你可以更精准、更快、更容易的交流、交换、表达。
通过语言的本质,我们可以知道:
基于上面我们可以进一步推导出:
如何构建一个识别英语的程序
现在我们不讨论你如何学英语,而是让你构建一个可以识别、交流英语的程序,你会如何设计?
简单的需求分析
以中文为例,当你听到一个女人对一个男人说:「你是一个男人吗?」时,你会收集到哪些信息?你需要哪些信息来明确这个女人想表达的确切意思?
首先是听力输入,你需要确保麦克风录入了音频,然后拿到的声波内容是U*#@&!&&*。之后我们需要将声波内容输入到一大堆分析器中进行分析,并得到比较精准的意图。
第一个可能是性别分析器,通过一定的规则识别出这是一个男性的声音还是女性的声音。因为这句话是男的说出来还是女的说出来表达的意思是不一样的。
第二个就是内容识别器,先是加载粤语匹配引擎和粤语语料库发现声波无法匹配解析,那么换成普通话引擎和语料库。此时如果你的语料库里有「你」、「是」、「一个」、「男人」、「吗」这些声音素材,那么就可以匹配解析出这句话:「你是一个男人吗?」。换言之,如果你没有粤语语料库和解析引擎,即便是给你一段粤语录音你也听不懂。如果这句话有一个生僻单词你语料库里没有,那么也是无法识别出来。
之后还有更多识别器,比如年龄、情绪识别器、重音和疑问语气识别句等,这些因素共同决定了这句话究竟想要传达什么意思。如果是一个女性的激动等感叹语气「你是一个男人吗!」,那么可以推测出这个女的跟男的有一定的关系,这个男的做出了一些伤天害理的事情导致这个女性在质问。如果是一个轻声细语的疑问句「你是一个男人吗?」,可能是一名女性想确认对方的性别。当然更准确表达这个意图的句子应该是「你是男性吗?」。
比较基础的方案设计
上面需求分析只是简单的介绍了声音->听力识别器->意图的过程,实际上语言交流是听说读写,其中包含两个识别器(听力识别器和视力识别器),一个核心理解器,两个表达器(口语表达器和书写表达器)。通过对应的实际场景,我们可以简单的梳理出对应需要的功能。
#听力识别器
#视力识别器
#理解器
理解器可以说是最重要的部分了,也是最难的部分
#口语表达器
当理解器思考运算并得到想要表达的意图之后,就需要开始表达传递出去。
#书写表达器
从上面可以看出,口语听力相对于阅读写作更加困难,主要因为实时性的要求。你必须迅速反馈不经过思考,这要求你要无意识的去用英语表达,所以语言学习没有技巧,只有大量训练。
我的训练方法
受限于篇幅,这里我只提供部分我觉得比较重要、有效的方法,并在QA部分会对常见能力的误区做一些解答。
在训练之前
#做好Benchmark并设置目标
无论是做性能优化还是做什么事情,第一件事肯定是先做当前状态的记录,并设置一个目标和期限。
对于英语,你可以测试当前词汇量,并对词汇量有一个目标;也可以设置目标为流畅的看技术大会视频,能听懂90%的内容。我更建议通过雅思、托福或者PTE这种专业英语水平考试来做目标。一方面这种专业考试是听说读写全方位测试你的英语能力,相比其他测试更加客观一些而且能体现你的短板。另一方面就是如果出国留学或者工作,也可以作为你英语能力的证明。当然缺点就是要备考,然后考一次差不多2000块钱。我本人选择了PTE考试,可以点击这里查看详细介绍。
#抱着怀疑、认真严谨的态度
这并不只是学习英语需要的态度,但是在学习英语的过程中,我感受颇深。看到一个老师说的或者网上的知识,第一反应要去质疑跟自己的知识进行对比,确定无误后再吸收。
曾经上过沪江网校的单词课,授课老师是专业英语培训又留过学考试成绩也好,但还是有个别单词读错了,比如resident的s读了s的音,但其实是z的音,所以就反馈给助教了。通常来说国外英语老师犯错的概率肯定比国内英语老师的低,但也不能保证全对,比如之前我发现了Magoosh一个卡片的奇怪单词,反馈之后的确是拼错了。还有Youtube上一个高赞的音标发音示范教程,又是美女还有嘴形视频非常好了,但是到了清辅音这里,在p、t和的发音明显听到了有个呃的声音,喉咙明显震动了。。。果断弃之。
扩充语料库的训练方法
经过上面分析,可以得出英语学习最关键的内容就是语料库,其次就是语法(识别引擎)。
语料库并不只是词汇,训练学习方法也并非简单的背单词。
如果通过听力识别器输入语料,首先我们要能区分口音,比如当前语料的英式发音、美式发音、澳洲发音、印度发音是什么样。之后就是一些连读、弱读和重音变化规则。通过口音、连读和重音等规则正确解析得到词句短语之后,开始进入解析器流程。我们需要知道其中每个单词的多重含义,将其含义一个个的匹配放入上下文语境结合重音等得到最准确的含义。这时还可能遇到一些词典里没有的新词或者老词新意,比如「给力」、「呵呵」或者各种歪曲解释的「不可描述」的成语等,这些都是人们新造或者赋予了新意思的词,这些词意词典并不一定会收录但广泛在一个圈子里使用和交流,这就涉及到文化、俚语、流行语等。此外还需要用语法进行下一步解析,比如时态、标点、语气、句型句式等。
经过上面流程才可以解析出比较准确的意思,做出回应还要逆向再来一遍。
首先你要按照一定逻辑和结构梳理好你想表达的意图。这一步其实跟语言无关,中文阅读理解能力好的人,英文只要看懂了阅读理解能力也会很强,有条理的人不只是说话有条理,做事情也会很有条理和逻辑性。想好表达之后你就要开始从语料库抽取最符合你意图的词句,并按照合适的语法进行组装,这时候就可以看出一个人语料库大小和水平。比如:表达我喜欢一个梳妆台,只有最基础语料库的我只能说出:我喜欢这个桌子上有镜子的东西。这时,看到这句话的人可能知道你想表达喜爱一张桌子和镜子的东西,但不知道具体是什么。如果语料库里有更庞大的名词库和程度形容词,就可以说出:这就是我梦寐以求的带有地中海风格雕刻、椭圆梳妆镜的梳妆台。看到这句话你脑子里应该可以出现这个梳妆台大体的样子吧。之后,你还需要发音说出来,先从语料库里抽取对应的词句声音,再结合略读、弱读、重读等规则控制舌头、喉咙肌肉发出来对应的声音,至此算是完成一次对话。
上面只是听力识别器,视力识别器大同小异,无非是识别各种字体、大小写、标点符号等,不再赘述。
通过上面分析可以得知,语料库里的每个语料通常需要以下信息:
#扩充语料库的训练方法实战
例如看到一个clump单词想要学习,可以这样做:
1.第一遍开始认识单词:
3.第三遍重复第二步。
4.第N遍,已经基本掌握。
值得注意的是,上面步骤是相对完整的学习步骤,在实际学习过程中针对不同类别的单词应该可繁可简。比如我在Anki建立了7个语料库,分别是:
上面步骤好像很多,而且需要记忆的内容量好大,有什么技巧来快速稳定的记忆吗?
#记忆单词、语料库唯一的银弹:重复训练
正是如此,这类英语学习速记技巧也成了各种网上学习平台割韭菜的视频教程,还卖价不菲。通过几个单词联想让试看的观众觉得神奇,从而脑热买下教程,大部分人买了不看,即使看了练了也没啥用。
作为过来人回头来看,这完全是弯路,这些速记方法大多是表演性质的,根本没法固化成自己的能力。请你回忆一下,你为什么认识commit这个单词?是因为通过什么其他单词联想出来的吗?是因为通过某个图片关联想起来的吗?并不是,当你用git提交时,你几乎天天都遇到这个单词,同事天天交流用这个单词,正是一遍遍的在你面前出现、听到才让你非常熟练的掌握这个单词。如果你不认识commit这个单词,那么说说你是怎么记住你的那么长的身份证号码的?是通过对数字图像化、故事化编排的?还是大量重复见到和用到?
你越早明白语言学习没有技巧,就会走越少的弯路、花越少的冤枉钱。——这是我走过13年的弯路近期得出的结论。
发音和听力训练方法
发音和听力是相辅相成的,都是需要使用语料库的声音素材。所以练发音的时候,能发出某种特殊的声音,也能让你听力能分辨出来;反之,先能分辨出某种声音,你才能模仿发出来。
#音标要反复刷,刷到熟练、准确为止
【音标是语音识别的最小识别单位,用于建立最基础的语音语料库】
我在这里踩了坑。在我学会打字之前一直不会拼音,但也正常掌握中文发音。所以在上英语课时不懂音标就算了觉得跟中文一样肯定没问题,但其实这走了一个很大的弯路。
郭杰瑞的《美国人学英语竟然不学音标!为啥中国人要学?》很好的解释了这个问题。简单的说NativeSpeaker生活在这个语言环境下,模仿别人的声音,也不断的被纠正这个声音,又有大量的输入自然会很准。但对于中国人来说显然有问题,你模仿的这个人的发音可能就是错的,也没有人给你纠正,甚至你的错误发音会误导其他人。
即便是在阿里巴巴工作的时候,也时常遇到这种情况。比如Button这个高频简单的词汇,一直念「巴特嗯」,但是一同事念「波特嗯」好奇怪,搜了下发音不知道搜了哪国口音,声音听起来的确像是「波特嗯」,之后我也一直念「波特恩」。直到我学会了音标才能十分确定这个单词的真正发音就是类似「巴特嗯」。举这个例子是想说,只有音标才是一个单词最精确的发音,涉及到口音以及发音者水平等等因素,你不确定听到的发音是绝对正确的,只有看到音标你才能确定。
之前在阿里工作时用到Fusion(现已开源),这个单词我在阿里听到了至少十个版本的发音,印象中没有一个是对的。原因很简单,这个单词里有个比较「难发」的音。之所以难发,是因为在汉语中没有这种声音,我们从来没练过发出这种声音,所以不经过训练,口腔肌肉和气息很难发出这个声音导致单词发错音。可以在forvo上面听听多位老外录的发音,可以看到下面仍然有两个奇怪的声音,如果不知道音标模仿这俩声音那就非常悲剧了。当然最准确的还是CambridgeDictionary上面的发音,权威、专业且准确。所以训练音标最重要的目的是补充你之前发不出的声音,并且可以辨音。
#通过Google翻译识别纠音
【正确的发音是正常、准确交流的前提,语料库里的素材必须保证正确,纠音是积累正确语料中非常关键的一步】
当我觉得准备差不多了的时候,进行了一次PTE模考,结果超出我的想象。发音和口语流利度居然是0分,这意味着我PTE测评程序认为我说的不是英语,有超过一半的语音无法识别对。所以我到底说的是什么?
所以我在淘宝上找到了1v1的纠音课,才发现有大量很基础的单词都读错了。比如school直接读四顾,漏了l的音,实际发音类似四顾奥;同样的idea读成了爱第也饿,其实没有卷舌音。
人肉纠音显然不适合大量训练,一是贵,二是反馈慢不能实时反馈,三是有些问题可能还是发现不了。由于PTE是语音识别,机器打分。我很快就想到了用Siri来识别我说的东西准不准,但其实Siri是偏日常化的口语模型,面对复杂单词等会强行转换成日常对话并不合适。Google翻译便成了最佳选择。
Google翻译有足够的技术和训练素材来做语音识别引擎,由于是翻译,会尽可能原汁原味的解析。如果质疑它的准确度,你可以读一段中文让它识别,或者播放一段清晰的英文语音试试看。
刚开始特别艰难,我发现连these这种最常见最简单的单词我都读错了识别不出来,本质问题首先是和z这俩音标本身发音不准,其次是这俩连起来在一个单词中快速读的时候,舌头肌肉转不过来。所以纠音第一天上午练了一个半小时的these直到基本可以识别出来。当时挺绝望的,感觉这种纠音方式得纠到什么时候。其实后面越来越快,因为表面上你只纠音了these这一个单词,其实你把所有带和z的单词都练过了。
纠音经验总结:
#通过Youtube学习
【Youtube的海量高质量学习资源,是建立语料库的非常好的素材】
Youtube简直是学习利器。上面有无数的英语讲师录制视频教外国人学英语,同时视频本身用的是比较简单比较慢速的英语,可以顺便练习听力。
比如连读H省略的教程HowtoLink:wordsthatbeginwithH-AmericanEnglishPronunciation,关于英语重音的教程WordStressinEnglish|HowtoPronounce...,-ed结尾的发音规则Howtosay-edendingsinEnglish、s结尾的发音规则HowtopronouncewordsendinginS和ex前缀的发音规则3waystopronouncetheEXsoundinEnglish。太多太多优质教程,你可以用英文关键词搜索一下。
除了专项技巧,还有很多单词发音对比视频。当我发音Google无法识别的时候,我会搜下xxxpronunciation关键词。比如非常常见的value这个单词,之前一直读作类似歪溜,其实看完HowtoPronounceValue,Valuation,Evaluation才发现美式读法是类似歪奥油两个音节,纠正之后识别率就是100%了。还有million、billion这些单词,也一直没法识别,看完HowtopronounceMILLION,BILLION,TRILLION-AmericanEnglishPronunciation就容易发一些。还有数不尽的类似音单词对比,比如最近看的HowtosayONEandRUN-AmericanEnglishPronunciationLesson,看完对部分音标的分辨能力会提升。
此外还有一些很有意思的视频,比如英语的洗脑绕口令BettyBotterBoughtSomeButter-NurseryRhymes。总之,要善用Youtube来寻找学习资料,个人比较推荐的将放在下面资料推荐部分。
#影子跟读
【影子跟读将扩展你的语料库,并打磨你的发声肌肉提升你的口语表达器能力】
影子跟读就是像影子一样跟读一段听力。做法很简单,就是播放一段英语听力,错开几秒或者同时照着文本、模仿声音进行跟读。
分析可得:
所以大量重复训练是有效的关键。通常使用专业广播素材例如科学60s或者经济学人这样的播客来训练,几句话大概时长控制在40s左右。老师给出的要求是跟读至少50遍,直到可以流畅一致的跟读,最好不看文本进行跟读。然后要录下音频进行对比,找自己读的不一致的地方。
实践过程中,刚开始最为痛苦,你会发现老外说话速度很快,自己的嘴很笨老是打结。没错,影子跟读就是要训练使其不打结。发音的本质还是肌肉、气息和声带的控制,你可以无视单词无视意思,就像唱歌一样模仿。前期可以一句一句跟读,然后串起来刷遍数,通常到了30遍的时候,你会觉得可以基本跟上节奏。50遍的时候基本能读的差不多了。
推荐的资源和工具请见下方资料推荐部分。
#精听和泛听
【精听和泛听是扩展听力语料库的重要方法】
精听的训练方法:
再听一遍,默写下来,最好再跟读几遍
从这个训练方法不难看出,精听是扩展音频语料库非常关键的训练方法,它既补充了语料库的素材,也训练了对声音的敏感度,同时还让你可以分辨连读细节,更重要的是纠正了你的语料库素材。因为当你听写完了之后,通常错误会有以下几种:
关于第4点,推荐视频HowtoPronounceContractions:AmericanEnglishPronunciation看完你就知道老外发音有多懒,不关键的单词能省就省,全靠你自己脑补。
由此可以看出精听是训练听力最关键最有效的方法。训练过程建议使用Excel来记录自己练过的句子并做标记用于回顾,可以点击这里看下我的笔记。
泛听的训练方法:
通常可以在走路、健身、吃饭的时候随便播点材料,最好是自己感兴趣的,当然也不限制。其实看美剧如果不看字母也基本相当于泛听。这种训练方法看起来非常简单,当然效果也十分有限,它仅可以扩充音频语料库。
总之,听力训练最重要的还是去找到你听不出来的东西并将其练到能听出来,精听是一个好方法,如果有精力,泛听也可以部分辅助。
英语思维训练
理解器和组装语料表达也是非常关键非常难的一个部分。首先你要熟悉英语思维,其次还要用英语的思维从自己语料库中抽取语料组装表达。
训练这一能力的方法就是转述,具体训练方法如下:
你可以选择听力->转述->说或者阅读->转述->写这样的训练路径,他们只是训练了不同的接收器和表达器。
从转述的训练方式可以得出它锻炼了什么:
这里也强烈推荐恶魔奶爸的英语写作训练方法,对转述训练有更详细的细节描述。
受限于篇幅,这里不再过多介绍其他方法。当你搜到一个训练方法,可以按照上面方法进行推导,查看可以训练到哪些部分,再决定是否要使用这个方法进行训练。