我们家娃的英语习得实践之一就是在三岁起到现在以动画片作为主要的英语输入方式之一。
在这个实践中,我一直在寻找两个问题的答案:
- 当前或是下一部适合孩子看的动画片是什么?
- 通过看动画片来习得英语的路线是如何的?其终极水平在哪里?
毫无疑问, 如果动画片能像阅读那样有分级的话 ,动画片分级就能够帮助回答上述两个问题。但是,遗憾的是动画片尚没有针对语言难度的分级。
既然没有现成的,那就自己动手、丰衣足食吧!
最近一段时间,我分析了几十部英文动画片的语言难度,并基于分析结果,对动画片的难度进行了划分。
本文会对动画片的难度因素进行讨论,下一篇文章《英语动画片的分级》会给出动画片的分级。
难度的因素
一部动画片的难度主要由以下三个因素决定:词汇量,难词占比以及语速。
词汇量
不难想到,一部动画片里出现的词汇量越多,该动画片可能越难。比如,《小猪佩奇》(Peppa Pig)的词汇量是2190个,而 《小鼠波波》(Maisy) 的词汇量是1039个。注:在我的分析中,同样的lemma*被计为一个单词,这样得到的词汇量的估算会更紧实些。
[*]什么是lemma?可以通过去除词汇的屈折变化(inflection,英语中的屈折变化:对于动词来说,plays/played/playing是play的屈折变化;对于名词来说,cars是car的屈折变化 ;对于形容词来说,bigger/biggest是big的曲折变化),而只计入原形的方式来精简词汇量。这种原形单词(play、car及big)被称为lemma。英语的词汇(已除去专有名词)在进行这种方式的精简之后会减少到原来数目的60%左右。
难词占比
虽然词汇量是衡量动画片的重要因素,但是,词汇量不是唯一的因素。比如, 有两部动画片A和B。A的片长是100分钟,词汇量是100个;B的片长是2000分钟,而词汇量是200个。虽然动画片B的词汇量多,但很难说动画片B比动画片A难。动画片B的词汇多的原因很有可能是由于其片长长,所以,动画片B中出现更多的故事,更多的场景,导致了更多的词汇。 因此,更科学的衡量动画片难度的方法是难词占比,即各种难度的词在单词总量中出现的比例。
显然,难词占比大的动画片比难词占比小的要难。具体的分析方法,详见附录。
语速
显然,语速越快,动画片可能越难。
不妨以娃现在看的动画片《小猪佩奇》为例来分析英语动画片的难度。
- 词汇量:
《小猪佩奇》里的词汇量是2190个, 词汇在前10000个词汇里的分布如下,
图中有100行、100列,即10000个方格。每个方格代表一个单词,若动画片中有此方格对应的单词,则该单元格的颜色为彩色;否则,为灰度色。
2. 难词占比:
《小猪佩奇》里出现的2190个词汇,
前2000个高频词在其总的词汇量中的占比是46.35%。
前2001位到前4000位的高频词在其总的词汇量中的占比是18.22%。
3. 语速:
语速的度量是很简单的,就是每分钟的单词数(Words Per Minute) = 单词总数/讲话的总时间。但是,这里需要注意的是讲话的总时间并不是动画片的时长,而应该是去掉片中音乐、无声音、哭笑声及长时间的感叹词部分之后的时长。《小猪佩奇》的平均每分钟的单词量为162个。
未完待续。下一篇 《 英语动画片的分级》中会给出英语动画片的分级标准和各个级别的代表动画片。
更多儿童的外语习得知识,请关注微信公众号 宝宝的外语习得
附录
本文中使用的难词占比的分析方法:
1 使用词频来衡量词的难度
使用美国当代语料库的词频顺序 ,认为高频词比低频词简单。
2 难词占比的计算
前2000个高频词占比=前2000个高频词的个数/单词的总数目
第2001位高频词到第4000位高频词占比=第2001位高频词到第4000位高频词的个数/单词的总数目
类似的计算第4001位到6000位高频词占比。
上述计算中,单词的数目为不重复出现的单词的数量。
显然,高频词比低频词简单。高频词占比越大,动画片越简单。