学术教研
第五届亚洲语言测试协会年会在沪举办
10月18日-20日,第五届亚洲语言测试协会(AALA)年会在上海召开。会议由AALA主办,上海交通大学承办,外语教学与研究出版社协办。AALA成立于2014年,主要成员为亚洲语言测试领域的研究人员。本届年会的主题为“语言测试中的标准研究”。 AALA前主席、香港理工大学教授David Qian,墨尔本大学博士Ute Knoch,英国文化教育协会教授Barry O’Sullivan,剑桥大学考评院博士Nick Saville,美国教育考试服务中心博士席小明,澳门大学教授Antony Kunnan,北京师范大学教授武尊民,广东外语外贸大学教授刘建达,本次会议承办方主席、上海交通大学教授金艳,上海交通大学外国语学院副院长常辉以及外语教学与研究出版社副总编辑常小玲等境内外专家学者和特邀嘉宾出席了本次年会。来自十九个国家和地区的三百多位专家学者齐聚一堂,围绕“语言测试中的标准研究”展开了深入交流和探讨。开幕式 大会开幕式由金艳教授主持,David Qian教授、常辉副院长和常小玲副总编辑分别致辞。 开幕式后,大会举行了简洁、热烈的颁奖仪式。Antony Kunnan教授分别为博士论文奖、论文展示奖和海报展示奖的获奖人——香港理工大学杨燕锋、早稻田大学Kana Mastumura和邓燕平颁发了获奖证书。主旨发言 颁奖仪式之后,Ute Knoch博士作了题为“从标准到可操作的评分标准:量表设计中的情境问题探析”的主旨发言。Knoch博士指出,语言标准是为语言测试开发者、研究者和使用者提供的一个学业进步指标,以利于测试的设计和试卷评分。而评分标准的设计通常采用两种思路:一是利用主观经验,二是利用数据驱动。相较于前者,后者对测试所处的情境更加敏感。鉴于此,Knoch博士分析了评分标准设定过程中情境各个相关方面所起的具体作用,并指出,具有情境敏感特征的评分标准一方面能够有效提升分数推论的可靠性,另一方面也可能对分数概化推广产生威胁。大会发言 席小明博士以“语言标准:聚焦构念定义”为题进行了大会发言。席小明博士指出,目前语言标准和语言能力量表框架已经受到普遍重视,越来越多的考试项目已经主动与各类量表挂钩。因此,各类标准和框架对语言能力的定义也要与时俱进。席小明博士认为,从多维角度来对测试目标进行定义,应当包含两大要素:从基础到高级的语言技能描述以及语言使用的具体环境,其关键在于既要建立语言交际能力模型,也要建构任务情景框架。在描述学生的学业进步时,既要反映出考生语言使用情景的不断扩张,也要反映出他们在情景中语言使用技能从低向高的发展过程。 Barry O’Sullivan教授的报告题为“本地化”。报告从电子游戏近五十年的发展变化谈起,指出测试开发者也应当将考生放在测试开发和效度验证的中心来考虑,这就意味着测试项目需要切实反映出人的需求。相应地,想要证明测试有效,就必须说明测试在各个层面上对考生个体都是合适的。报告为语言测试本地化这一概念提供了理论基础,并结合游戏开发者和语言测试开发者两方面的经验,提出了一套测试本地化的实操性术语。报告最后指出,各种测试都应当为实现测试本地化目标而进行大幅度改进。 Nick Saville博士作了题为“多语视角下的语言学习和测评标准设定”的发言。Saville博士认为,标准和标准化具有多种含义,并因此探讨了标准语言、语言能力标准及语言教学标准三者的概念和内涵。Saville博士指出,在思考三者关系时,我们需要充分考虑语言学习行为所处的具体语境以及目标语的预期用途。因此,教育者所面临的是一个多语的挑战:家庭使用的语言、学校教学使用的语言以及需要学习的语言。Saville博士最后列举了全球语境下教育者在标准使用中所面临的一些困难,并指出,标准的应用需充分尊重多样性,尊重对本地化、情景化教育政策和实践的需求。 金艳教授的报告题为“亚洲语言测试行为准则的开发:原则和方法”。金艳教授指出,近些年来,语言测试领域的专业化建设开始受到重视,国际上相继出台了一系列语言测试行为准则。当下亚洲语言测试领域蓬勃发展,标准化工作显得更加必要,因此需要开发出一套适合亚洲语境的行为准则。金艳教授提出了行为准则开发的原理、依据、相关原则方法和建议,以及有待解决的各项挑战。会前工作坊 本次会议举办了四场会前工作坊。 工作坊一聚焦二语学习者口语和写作输出的自动评价反馈,由美国教育考试服务中心的顾琳博士和Keelan Evanini博士主讲。在实际教学中,由于时间限制,教师对学生们的口语和写作输出往往只能做到有限反馈。此工作坊主要介绍了怎样利用ETS研发的自动反馈系统对学生们的口语和写作输出进行及时、个性化的教学反馈。 工作坊二关注如何利用网上资源遴选应用于教学与测评的阅读语篇,由墨尔本大学的范劲松博士和中山大学的金檀博士主讲。一线教师在遴选语篇时往往面临渠道有限、筛选困难、修改无力等情况。此工作坊不仅分享了大量的免费资源,而且提供了评估文章质量以及修改文章内容的方法。 工作坊三的主题为如何开发评分量表,由墨尔本大学的Ute Knoch博士主讲。在评价考生的输出性语言技能时,离不开评分量表或评分标准。但目前关于评分量表设计的文献较少,导致很多测试开发者往往直接借用或改编现成的量表。此工作坊介绍了如何在评分量表中体现测试构念、如何开发评分量表、如何将评分量表和实际教学进行结合,并介绍了怎样评估量表的质量。 工作坊四由剑桥大学考评院的Hanan Khalifa博士主讲,主题为阅读评价的框架、模型、注意事项和建议。目前的测试使用者不仅希望测试可信、有效、公平,还期待考试能够促进学生学业进步。主讲人以阅读测试开发为例,介绍了测试开发过程中怎样解决学习者、任务和反馈三大方面的各类问题,并引领参与者了解阅读能力的相关量表以及怎样设计试题、评价试题质量等。 四场工作坊均着眼于以理论结合实际的方式,帮助一线教师学习测评方法、使用测评工具,贴合实际,实操性强,受到了学员的热烈欢迎。专题研讨、平行报告、海报展示 主题为“基于标准的诊断测评的开发和验证”的专题研讨由武尊民教授主持、刘建达教授点评,受到了与会学者的高度关注。目前,基于标准的评价已成为业界关注的重点,它的一个重要作用就是向师生提供与标准/要求相关的具体反馈。专题研讨中,发言专家和学者介绍了怎样为高中的诊断性测试明确测量目标、怎样将认知诊断分析运用在大学英语听力诊断测试中、怎样分析大学英语阅读诊断测试的效度,以及诊断性测试对一线语言教学产生的影响。刘建达教授在最后环节进行的总结和指出的思考方向,以及武尊民教授与在场学者进行的精彩讨论都给与会者留下了深刻印象。 大会两天议程中安排的五十余场平行报告同样精彩纷呈。此次平行报告的数量之多、质量之高,受到与会者的一致肯定。这些报告涵盖了测试标准应用、测评素养分析、评分量表开发、测试反拨作用、测试效度验证等各个方面。年会还设有海报展示环节。海报所展示的研究成果也涵盖了测试研究的多个角度,如测试开发、量表效度、标准运用、成绩使用、测评素养等,参观者与研究者进行了深入、热烈的研讨。 在会议现场,外研社、美国教育考试服务中心、英国文化教育协会、剑桥大学考评院、中国外语测评中心、外研在线等机构还进行了项目展示,现场介绍的各类考试产品及相应的学习和教学资源也受到了与会学者的普遍关注。闭幕式 大会闭幕式由David Qian教授主持。闭幕式上播放了会议的回顾短片,一幕幕熟悉的画面让参会者或惊喜、或会心一笑、或热泪盈眶。回顾片结束,全场响起热烈、持久的掌声。 此后,大会安排了一个特别环节——致敬并缅怀已故语言测试专家Cyril Weir教授。Barry O’Sullivan教授以同事和挚友的身份对其精彩的一生做了温情的回顾。Cyril Weir教授是亚洲以及中国语言测试领域的老朋友,曾经参与大学英语四六级考试等多个亚洲语言测试项目的开发和效度验证工作,他的离去,无疑是国际语言测试领域的一大损失。 随后,下届年会主办方——越南河内国家大学的代表LAM Quang Dong教授和Quynh Nguyen博士向与会的专家学者们发出了热情邀请。最后,AALA第一副主席泰国朱拉隆功大学的Jirada Wudthayagorn博士致闭幕词,并向参会者以及所有为大会作出贡献的参与者表达了诚挚的感谢。大会在温暖、感动与不舍中圆满落幕。 本次会议展示了现阶段亚洲语言测试领域所取得的最新成果,也分析了仍待解决的问题,为专家学者们构建了交流平台,将促进亚洲语言测试的不断成长和进步。