正确解读A-level分数线
每年8月中旬,英国各考试局GCSE和A-level的成绩陆续放榜。作为英国的高考,其被讨论和热议的程度,丝毫不亚于中国高考。很多老师最热衷做的事情之一就是对比分析不同考试局同一科目的得A*/A率,判断哪个考试局的试卷更简单或更难。但这样简单粗暴地解读,你确认过Grade Boundary的眼神吗?
下面小编带大家了解一下如何正确解读考试局的成绩和Grade Boundary/Threshold(分数线)。
先以三个考试局不同科目AS成绩为例
备注:
1) 剑桥考试局尚未在官网上传2018年不同科目得的数据,暂时使用2017年数据。
2) 剑桥考试局的进阶数学是完全线性的考试形式,没有AS成绩,只有A-Level成绩,所以进阶数学AS成绩为N/A。
3) 每个考试局对不同学科的命名和细分程度各不相同,比如牛津AQA和EDEXCEL都有English Literature,但CAIE的学科命名则是Language and Literature in English和Literature in English,科目之间的差距还需要细心对比研究考试大纲才能确定。
看到上述数据后,如果你掐指一算,若有所思得说“牛津AQA的理科难度要高于EDEXCEL和CAIE,因为理化生的得A率很低,而英语语言和数学则要简单的多,因为得A率很高”,那么恭喜你,你对成绩/分数线的理解还停留在江湖小白初级水平。
一、先看一下影响Grade Boundary的要素有哪些。
1.考生数量
上面截图中,三个考试局每科的考生人数差距甚大。作为刚刚进入中国市场的考试局,牛津AQA很多科目在2018年5/6月是第一次考试,考生人数自然很少。CAIE虽然没有给出每个科目的考生人数,但数量绝不比爱德思逊色。
即使在A-level体系运行了半个多世纪的英国,同一科目不同考试局的人数差距也非常大。以英国2010-2016不同考试局的参加商科考试的学生数据为例。
同一个学科每个考试局每年的考生人数相对稳定,但考试局之间的人数差异却很大,这也会导致考生平均能力的差异。基数越大,学生的能力分布越趋于正态分布,而基数越小,分布越有可能偏向某个极值,这个最终会影响每个分数等级的分数线和人数比例。
2.考生能力
众所周知,英语非母语的学生很难在英语语言这门课上拿高分,但参加牛津AQA今年5/6月考试的21个学生中,得A率竟高达28.6%,远高于爱德思的09.%和剑桥的5.4%,原因不在于试卷难以程度的差别,而是牛津AQA的21个考生大部分是英语为母语的孩子,而另外两个考试局因为人数多,总体得A率反而很低。
有些考试局的授权学校,学生的平均学术能力可能会高于其他考试局,这种学校的数量和学生量会影响考试局分数线的制定。
即使是同一考试局的不同学科,简单地根据得A*/A率的高低来判断学科的难易程度,也是不合适的。比如进阶数学明显难于数学,但得A*/A率普遍高于数学,因为大部分学生不管数学成绩好坏,都会考数学,但只有数学成绩好的学生才会考进阶数学(参加进阶数学的考生人数一般都会远低于数学的考生),所以A*率固然就高
再以经济和商科为例。
从上表可以看出,虽然不同考试局的A*率不同,但经济的A*率都高于商科,这说明经济比商科容易吗?暂且不说答案是否正确,但推断的逻辑是错误的。
经济学主要教授各种经济模型,学生考试时要应用各种经济模型分析不同的趋势和案例;商科在内容上则更为灵活,适合喜欢辩论、积极思考的学生,因为考试更多是开放型问题,学生需要通过应用不同的知识内容,自证其说,对学生的辩证思维和语言表述能力要求较高。因此,从考试答题的层面上来说,商科难度高于经济学,但这并不是造成经济学A*率低于商科的所有原因。另一个原因是,在英国,老师通常会建议成绩比较好的学生选经济学,而成绩相对较弱的学生选择商科。
3.卷子份数
以A-level阶段的科学学科为例,牛津AQA和CAIE每个科学科目都是五张卷子,EDEXCEL则是六张卷子,AS和A2各三张。但即使是五张试卷,牛津AQA的AS阶段是两张卷子,A2三张,CAIE则分别是三张和两张。
4.原始分数或UMS分数:
以牛津AQA和爱德思的物理为例。
牛津AQA 2018年5/6月A-LEVEL物理分数线
爱德思2018年5/6月物理分数线
虽然两个考试局都是模块化考试,单张考试卷的Raw Mark相同(实验卷除外),每个等级也均按UMS的90%(A*),80%(A),70%(B),60%(C),50%(D)和40%(E),40%以下则为不及格划分,但AS和A2阶段的试卷份数不同,每张卷子对应的UMS不同,考试的内容也不同。如果拿牛津AQA和爱德思第一张卷子RAW MARK的高低评判卷子的难易程度,也是根本不具备说服力的。
5.AO占比:
AO(Assessment Objective) 即测评目标。每个考试局对不同科目的AO级别划分不同,每个级别的定义也不同。一般来说AO1考察的都是学生对书本上知识点死记硬背的能力,而AO级别越高,学生对知识的灵活应用能力要越强,也越难得分。
所以即使不同考试局同一学科的卷子数量相同,原始分数和UMS分数以及Grade Boundary对应比例都相同,但如果不同级别的AO比例不同,题目或知识点考察的分值也不同,最终分数线的制定也会有很大差异。
二、什么才是正确的打开方式?
考试局的分数线更适合于纵向比较,而非横向。也就是说,你可以对比单独一个考试局同一学科不同年份的分数线,然后来评判今年的卷子是偏难还是简单,如果参考学生的数量也有较大变化,则需要考虑可能是学生平均能力的变化影响了分数线。
英国的A-level考试2014年开始改革,改革后第一次考试分数线的制定就是参照同一科目之前的分数线,综合考虑现有学生的平均能力和课纲难度,再结合一些数学算法确定的。虽然每届学生能力有所差异,但平均综合能力差距不会很大。
如果真的要横向对比考试局不同科目的难易程度,老师需要认真地研究每个考试局同个科目卷子的每道题,看不同考试局考察能力的差异性,再得出结论,而不是单凭得A*/A率来判断。