梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

清风出袖

高级会员
梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成


中国外语教育研究中心梁茂成教授主持的教育部哲学社会科学研究项目“大规模考试英语作文自动评分系统的研制”(编号06JA740007)已初步完成,并于2008年4月6日顺利通过了研究报告鉴定会。研究成果受到了全国大学英语四六级考委会主任、上海交通大学金艳教授、清华大学语言测试专家张文霞教授以及中国外语教育中心刘润清、王克非、陈国华教授的一致肯定,鉴定委员会认为该研究为国内领先水平。
该项目研究英语作文自动评分系统,并对该评分系统的评分信度、最低训练集样本量、适用文体类型、信度影响因素等问题进行探讨。研究发现,由于英语作文自动评分系统中设置了一些对作文质量具有较强预测能力的文本变量,使得系统在接受了足够的训练之后,自动评分的评分信度达到了r = 0.752或更高,可以满足统计学和测试学的要求。在训练集信度可靠的前提下,自动评分系统的评分信度最高达到r = 0.83以上,作文评分系统的评分结果与人工评分的结果之间的吻合率(在0-5的量表上)高于美国ETS的E-rater,表明当训练集样本信度可靠时,该研究中设计的英语作文自动评分系统的评分信度高于E-rater。因此,该系统已经达到了可操作水平。
该研究还发现,人工评分信度从两个方面对自动评分模型的稳定性产生影响。首先,当人工评分信度较低时,机器学习遵循Garbage in, garbage out.的规则,自动评分信度也相应较低;当训练集人工评分信度较高时,自动评分信度也随之升高。其次,不同的人工评分员之间的评分信度差异对自动评分的信度也存在影响。由于训练集数据存在内在的不一致性,致使自动评分系统学习困难,评分信度降低。
梁茂成教授这一研究成果将有力地推动我国大规模英语考试实现作文评分自动化的进程。
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

Really good news for college English teachers.
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

Congratulations!
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

祝贺。作文评分历来都是很繁重的事情,人工评分的信度就是不好掌握。希望外语老师能够早日解脱出来。
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

我觉得必须是机考,这个才能实现。否则作文无法成为computer readable texts。
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

首先,表示祝贺.
再次,不知道用的是什么机器学习模型,同时正如楼上xujiajing所说,不是机考很难实现,就是实现了机考,在目前计算语言学歧义问题丛生的前提下,基本上也是一个toy.不如从英语教学和考试的角度,开发一些机器辅助的英语作文自动评分系统更有价值.
最后,再次表示祝贺.
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

我觉得必须是机考,这个才能实现。否则作文无法成为computer readable texts。

同意啊!现在我校也在着手期末考试机考。正准备对机考如何评分动翻脑筋,梁茂成给我们提供了一个新的思路,新的选择。不过,我认为,在实施机考前,我们也必须考虑机考的效度。
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

机考对打字不好的学生似乎又有点不公平。个人观点。
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

的确,computer literacy 在这中间是个不可或缺的因素。
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

现在学生很多用QQ,盲打速度很快。但是,对于输入英文,反而不是很熟练。但在这个数字化的时代,纸和笔会慢慢的让位于鼠标和键盘的,这只是个时间问题。
 
回复: 梁茂成教授的研究课题“大规模考试英语作文自动评分系统的研制”初步完成

before we put the fates of the students to the machine, we must be nearly 100 percent sure that it is fair and efficient... at least
 
Back
顶部