专题
分会场发言人摘要(二)
日本英语教育改革和语言测试扮演的角色
仲村圭太先生,日本英语测试协会研究员。现于美国天普大学攻读教育学博士。主要研究领域是使用计量方法和定性方法进行测试验证。作为日本英语测试协会考试开发处工作人员,他参与了许多研究项目,诸如少年儿童英语能力测试工具的开发、英语访谈测试时大脑活动的研究。
盐崎修建先生,日本英语测试协会国际事务处处长。主管雅思考试在日本的推广和日本英语测试作为国际性认证资格的推广。与日本国内外许多知名大学和教育机构合作共事。
相较于其他亚洲国家,日本长期陷于经济泥沼,老龄化速度世界之最也使日本的未来有时看上去黯淡无光。事实上,培养全球化人力资源的需求目前在日本达到了有史以来的最高程度。为了满足这个需求,日本正在进行重大的英语教育改革。
本文记录了日本英语测试协会如何通过和当地教育工作者结合帮助促进改革,如何分享其50年来在评估日本不同年龄和语言水平学生方面的专业知识,以及如何与全球主要机构建立合作关系。
中国英语语言测试行业标准的制定:环境、问题与挑战
范劲松博士,复旦大学外文学院讲师,主要从事语言测试与评估方面的研究。曾先后在上海交通大学和英国华威大学求学,分别师从金艳教授与Helen Spencer-Oatey教授,并于2011年获得上海交通大学应用语言学博士学位。到目前为止,已在国内外学术期刊上发表论文约10 篇,并参与了一些重要的科研项目。
近些年来,随着语言考试在社会生活中所发挥的作用越来越重要,语言测试的专业化进程也在不断加深。世界各地的语言测试开发与研究机构已经制定了大量的语言测试标准,以期进一步提高语言测试的质量与专业化水平(参见如AERA, APA, & NCME, 1999; ETS,2002; ILTA, 2000, 2007 等)。由于我国的英语考试往往规模大、风险高,基于考试结果所做出的决定往往会对考生产生重要的影响,因此这些考试的开发、实施和使用必须遵循严格的标准,以确保考试的质量以及考试对所有考生的公平性。本文探讨了在我国环境下制定语言测试标准所需要考虑的因素以及标准在制定与实施过程中可能面临的挑战。所需要考虑的因素包括对现有的语言测试标准的收集、整理与回顾、标准的制定方法以及如何使标准契合我国语言测试的特点与需求;面临的挑战包括标准的后期效度研究、标准的可执行性以及标准在语言测试实践中的实施等。最后,本文也指出未来我国语言测试标准研究的方向。
中国英语教师对英语写作测试的评分倾向及评分结果的探究
陈慧媛教授,云南财经大学教授。1982年获云南大学英语语言文学学士学位,1994年获美国罗切斯特大学硕士学位,2000年获广州外语外贸大学应用语言学博士学位。1999年出任云南大学教授,2001年当选为《中国英语教学研究会》常务理事并任《中国应用语言学》 (英文期刊) 编审委员。2004年至今任职云南财经大学。
本文旨在探讨在对中国学生的英语写作评分中,对写作的量化测定是否以及如何能应用于探察教师或评分人员的个人倾向;为了达到较好的评分综合结果,评分倾向和评分成绩应该如何相互比对糅合。文章通过多元线性回归法分析了三名评分者对三百份英语写作的评分结果。结果表明,评分人之间既有差异性也有共同性。所有评分人的评分模型中至少有两项准确性测量指标进入模型,这表明中国教师的作文评分多以语言为主导,评分侧重语言准确性。评分人之间的某些不同之处有:两名评分人关注的是复杂名词性短语,另一位则重视作文技术性细节,如标点。研究同时发现,加权平均是集合三位评分者分数的最好方式,因为此法提供了最佳预测分数。预测分数和实际分数的匹配度超过50%。本研究对于英语教师和英语写作评分员的培训以及对英语写作的评估都具有一定参考价值。
提高英语教师评估能力:试题库建立经历谈
刘建达教授,广东外语外贸大学副校长,全国人文社科重点研究基地、外国语言学及应用语言学研究中心主任,获得香港城市大学语言学与应用语言学哲学博士学位。其工作涉及英语试题的设计、开发和验证,研究领域包括语言测试、语用学和第二语言习得。在不同学术期刊上发表大量论文。最近著作Measuring Interlanguage Pragmatic Knowledge of EFL Learners,由Peter Lang国际学术出版社出版。
为了降低高考风险,现在高考英语推行“一年多考”。实施“一年多考”需建立科学的试题库,试题库需要大量试题。来自多所高校的英语老师受邀加入了这个项目。但是,参与的教师普遍缺乏语言测试和评估的相关知识。为保证试题质量,参与的老师接受了不同的培训,以掌握最基本的选择题出题技巧。教师的语言评估能力也得到了较好的提升。培训之初,教师们的语言评估能力知识相当缺乏。通过特意准备的训练,包括语言测试和评估知识、出题技巧、试题质量优劣的讨论,受训教师逐渐意识到语言测试和评估知识的重要性。之后,他们将所学到的语言测试知识应用于平时的教学和出卷中。本文记录了通过建立试题库提升大学英语教师评估能力的经历。
职前英文教师的评分行为:语言能力的角色
刘力,中国人民大学外国语学院讲师,研究领域包括语言测试和评估、语料库语言学,工作涉及测验的开发和验证。现为国际语言测试协会成员。
本研究旨在分析不同写作水平的中国大陆职前英文教师的评分行为,探究影响教师评分的内在因素。中国大陆某师范高校英文专业的八十一名职前教师参与了本项研究。
研究数据分析分为两个阶段。第一阶段,研究者使用自行设计的写作测试收集教师写作表现数据,并根据写作水平将教师分为三组。第二阶段,每组各随机选取四名教师,在评定学生写作文本的同时进行有声思维阐述其评分缘由,其后接受半结构式访谈。研究者随即利用多层面Rasch模型和非参数统计检验对教师的评分进行统计分析。基于教师在有声思维时产出的口头报告以及访谈记录,研究者对比了三组教师在其评分分数和评分行为上的异同。研究结果强调了英文教师写作水平在评价学生写作中的特殊地位和作用,以期对改进教师教育培训及促进教师评价素养的发展提供重要实证依据。
重新审视二语课堂形成性评价的概念
罗少茜,北京师范大学外文学院教授,主要研究兴趣为任务型语言教学与测试、语言测试与评价及英语教师教育。
自形成性评价一词在二十一世纪初出现在中国教育政策文件中以来,形成性评价这一话题一直受到研究者和实践者的关注。十多年过去了,形成性评价这一概念如何被不同团体理解、阐释和解读值得我们注意和研究。本文旨在讨论以下议题。(1)2001-2012年中国的形成性评价综合研究; (2)中国学校形成性评价的个案研究。形成性评价的这两个视面表明,在该领域存在一些研究,而且有一些成功的实践案例。但是,从大背景来看不容乐观。事实上,形成性评价在中国的调查研究不充分,理解也出现偏差,而且实施中也出现失误(Huang & Luo, 出版中)。究其原因有许多。主要原因包括相关人员对形成性评价的新发展缺乏知识和认识、二语形成性评价研究的空缺、形成性评价的费时特性、专业训练需求,还有利害攸关的考试压力。本文结尾提议进行更多的形成性评估研究和实践。这样,研究者和实践者会把形成性评价看作是学习和为了学习的途径,而不是仅仅作为又一种测试的手段。
逐猎正当有效的评估机制
叶文泰先生,在美国受教17年,英语教学TESL硕士。在中国教学逾5年,侧重哲学。
本文旨在明确创建正当高效评估工具时的关键因素。本文假想了一场“狩猎比赛”,还假想了相类似的一场“英语能力评测”,两者都具备正当高效的评估所共有的三项重合特点。按某一目的对衡量工具测量的内容做出明确识别是有效性的基本概念(Carmines & Zeller, 1979)。英语能力测试必须以高效性为目标。高等教育和普通用途对英语水平的要求有所不同,所以评估工具也要与各自的目的相一致。此外,提升有效性也需要考虑一系列因素,诸如目标主体的背景知识、资源限制和支持等。由于英文学生来自不同背景,为了使评测更加公平,应该限制文化方面的问题(Educational Testing Service, 2009)。最后,要明确无法预见的问题就需要不断测试和调整评估。评测工具应该从课堂观察和训练中得到知识和目标主体的反馈。如果某个专家在完成某项任务花费了很多时间,那么调整就很有必要了。不管是“狩猎比赛”还是“英语能力评估”,评测工具具备了内容符合目的、考虑到一系列有效因素、获得主体反馈三个特点,就会具有高效性。