普通话水平测试始于1994年。当时,测试的内容为五个部分,即:1.读单音节字词100个;2.读双音节词语50个;3.朗读;4、判断测试;5.说话。后来,第4部分的判断题取消。现在的格局是余下的四部分。
从五部分到四部分,说明普通话测试中的实事求是的态度。读单音节字词和双音节词语意在检测应试者的声母、韵母、声调的发音及变调、儿化、轻声的读音;朗读和说话分别考查应试者在有文字凭借情况下的语音面貌、连读音变、语调语气和在无文字凭借的情况下口语表达普通话的能力及规范程度。比较起来,判断测试显得必要性不大,取消这部分是恰当的,将其分数归到说话中也是完全必要的。
现行的单音节字词、双音节词语、朗读、说话这四部分格局又怎样呢?在经过较长时间的测试实践后,我们觉得有必要对现行测试内容及形式作进一步审视和思考。这里主要谈谈单音节字词和双音节词语两部分存在的问题及对策。
首先,从内容上看:科学性尚嫌不足。“普通话水平测试不是普通话系统知识的考试,不是文化水平的考试,也不是口才的评估,是应试人运用普通话所达到的标准程度的检测的评定。”①现行的测试内容似乎与此标准有些出入,这突出表现在读单音节字词(以下简称第一部分)和读双音节词语(以下简称第二部分)两部分上。 这两部分是以二百个音节的汉字的形式出现的,而为保证声韵的覆盖面,必然要用到一些相对生僻的字词,这样常常会出现应试者因不认识某字词而读错音的情况。因此,从某种程度上说,第一二部分似乎成了识字程度的测试。某次测试中第一部分有一“蛆”字,应试者读准这个字的不到百分之十。在200个音节中遇到五六个因不认识而错读的汉字的现象并不少见。这与测试的初衷相去甚远,读错了这些字词显然并不能说明应试者普通话的标准程度差。目前的应试者大多是大学生或中小学教师,可以想见日后对公务员及其他社会成员的测试中这个问题会更加突出。
另外,汉语中声调作为一个超音段音位具有非常重要的地位。《大纲》中说第一部分的目的是“考查应试人普通话声母、韵母和声调的发音”③,而具体拟题要求中强调每个声母出现一般不少于3次、韵母一般不少于2次,但并未提及声调问题。于是便有一些试题没有很好重视声调的均匀分布的问题,导致出现某类声调偏多或偏少的情况,而这点对于特定声调读音有缺陷甚至读错的应试者来论显然有失公平。同时,由于第一部分所用单字较多,多音字便在所难免,而对待多音字的标准是只要读对其中一个读音即可,这实际上便会引起声韵调的覆盖状况发生某种程度的偏差。这与第一部分强调声韵调的分布是有抵牾的。
其次,从形式上来看:可操作性较差。由于受测试经验、辨音能力等因素的影响,不同的测试员对于缺陷的把握难以统一,而这两题对“缺陷”的界定非常细致且又非常模糊:“声母发音部分不准确,但还不是把普通话里的某一类声母读成另一类声母”,“合口呼撮口呼韵母圆唇度不够,语感差”,“声调调形、调势基本正确,但调值明显偏低或偏高” ④等等,若加上错误与缺陷之间的区别有时难以分清,于是不同测试者对同一应试者语音面貌的评定便会有较大的差异。读单音节及双音节两部分的二百个音节,测试中应试者读,测试员听,口耳相传,在很短的时间内判断正误或缺陷,并标记出来,会产生较多的问题。连续听应试人念毫无意义联系的二百个音节会使测试员产生一种厌倦情绪,尤其是测试了十几个人之后,尺度的把握难免会有所偏差。我们知道,第一部分失1分(占百分之十)或第二部分失2分(占百分之十)均不能上一级乙等,可以想象,在经过较长时间测试的紧张和疲劳之后,若某一个测试员两次测试同一个应试者,完全可能有两个不同的分数,而这对于分数在两个档次交界处的应试者来说,可能意味着档次的变化。从效率上讲,每测一个人需15分钟之久,这严重地阻碍着测试的进度。每组疲于奔命一天,也不过测试30人左右。
其三,从标准上看:标准的依据难以把握。客观标准的不统一也使测试尺度难以把握,这既涉及到应试者的读音,也涉及到测试员的评判。一般说来,测试的语音标准来自《普通话水平测试大纲》,而“大纲”的根据之一是《普通话异读词审音表》,“审音表”是国家语委、教委、广电部联合发布的,应该具有权威性,但许多人包括相当多的教师并不知道“审音表”为何物。而实际操作中,另一颇具权威性的依据是商务印书馆出版的中科院语言研究所编写的《现代汉语词典》,这部词典的一些字词注音突破了“审音表”的限制,相对而言更符合语言实际。所以从实际影响来看,似乎后者更大些。有些字词二者的注音存在着差异,如“凹”字,某套题的标准答案中的注音为 āo或wā,“审音表”中无wā音,《现代汉语词典》有wā音②,孰是孰非,令人莫衷一是。
综上所述,普通话测试的第一二部分存在一些实际问题。这种状况影响着测试的准确度和权威性及工作效率。如何解决这个问题?现将我们的看法略陈于此,以就教于同道。
对于广大的社会成员而言,他们使用普通话以整段文章的朗读和口语表达为主,我们测试中的分数倾斜也正是基于这样一个事实。我们认为,对于一般的应试者,可以取消一二部分而只用朗读和说话来进行测试。把第一部分的10分归入朗读,第二部分的20分归入说话,(朗读和说话的评分标准可进一步具体化——另文论述),事实证明这也是行得通的。除教师播音员等少数从业者外,一般应试者多不可能进入一级,可以忽略其不明显的缺陷,通过第三第四两部分来定档次,一个人读上一段文章,再说一段话,测试员据此来判定其普通话水平档次应是不会出现大的误差的。因为二级的分差是在5 和7分,三级分差更大,是10分,对于一般应试者以小数点后两位的精确度来打分定级是没有意义的,确定档次比打出具体分数似乎更接近实际,即使偶尔有一点误差,也可通过与同组的其他测试员对比协商,据实际情况作出结论。测试员集中精力在朗读、说话部分中,更认真地注意到语音失误、语音面貌、方音语调等等,更能看出应试者普通话的真实水平。这样8分钟可测试一个人,比现在的15分钟几乎提高了一倍的效率。如果把这个效果放在全国的大范围背景下考察,这绝对是了不起的效率。当然强调效果并非等于忽视质量,对于有可能进入一级者,则应加试单音节字词100个与双音节词语50个。这样区别对待,对一般应试者的测试,用朗读和说法的方法,切合实际,可操作性强,能大大提高效率;对普通话程度较高的,加试两题,维护权威、坚持标准。以广州为例,1998年10月开始测试工作,至2000 年 3 月仅测试了9200 人,测试内容的可操作性不强是其中的一个重要原因。如果不提高效率,凭广州市的 79 名测试员,在以十数万计的等待测试的人员面前难免会有力不从心之感。尤其是《国家通用语言文字法》施行之后,形势更加紧迫。因而就现实情况看,在保证质量的前提下提高效率是唯一途径,广州如此,全国也如此。讲求效率是当今社会的大趋势。
至于要求进入一级的应试者加试单音节字和双音节词语,虽然也有可操作性差的问题,但由于是少数人有进入一级的可能(广州市从1989年10月至2000 年3月测试的9200 人中,仅有一甲 1 人,一乙 1150 人,一级占总数的12.5 %),测试员完全可以用节省下来的时间对这部分人的测试“精雕细刻”,评头品足,做出准确的判定。有可能进入一级的大多是文化程度较高的人士,因不识其字而读错的情况会大大减少,因而更能真实地反映出其实际水平。拟题时注意声调的覆盖率,第一部分应尽量避免多音字,实在不能避免则标以一个特定的词语以限定其读音。判断标准应严格以审音表为准,这样才能有统一的依据,当然对审音表的宣传是必不可少的。一些较生僻的单音节字词(尤其是非语素的字)则应由拟题人在出题时尽量避免或减少。
对一般应试者取消一二部分并非意味着不重视常用词语,常用词语还是朗读和说话的基础,可以通过常用词语的学习来提高普通话朗读和说话的准确程度。
当然,改变测试方式、内容及标准是个大问题,牵一发而动全身,需进行认真的全面的论证。在此,我们只是陈述我们对这个问题的思考,以期引起更多人的思考,从而促进普通话水平测试工作的健康快速发展。