追求公平的空军(上架感言中提到)_即将消逝的乡村

关于浙江新高考赋分方案的再思考

——并修订“顺序名次分”

刘典正

摘要：新高考沿用总分录取的办法，总分=必考3科原始分+自选3科等级分。原始分本不可加，因社会认可并操作简单而“好用”；等级分虽易引发博弈而难保障学科均衡，但因保障机制而“能用”。原始分经排名次用等差数列转化，可变为理论可加而有望好用的“顺序名次分”。名次分是中国式等值机制，具有理论公平性；其科学性，因考试区分度而显现；易操作性，因名次的自致性可以依靠电脑；而其可行性出于国情，约定则成。

关键词：新高考，原始分，等级分，名次分，新框架

引言

启于2014年的浙江新高考，统一招生沿用总分录取的办法：必考3科语数外计原始分，自选3科赋等级分，总分=3科原始分+3科等级分。基于改革实践，再结合中国高考计分历程：原始分——标准分——原始分，我们对新高考赋分方案的判断是：原始分不可加但好用，等级分不好用但能用，赋分方案不具备刚性。新高考改革诸目标之实现需要更加科学而适合中国国情的赋分方案，可加、好用、刚性是基本要求。

一、原始分不可加但好用

原始分即卷面分数，是根据考生答卷情况直接给出的分数，没有经过转换处理，可以反映出考生答题的实际水平。但原始分的缺点非常明显，章建石认为“一是分数的意义不明确，不能表明位次方面的信息；二是稳定性欠缺，没有可比性；三是不具备可加性”[1]。温忠麟有类似的表述：“统考科目使用原始分”，“存在两个方面的不足：一是不同科目的原始分没有可比性，无法直接相加；二是直接相加的结果与政策设定的权重可能出入很大”[2]。综上可以归并为原始分不具备定位性、可比性、可加性、稳定性。

1、原始分不具备定位性

原始分不能反映某考生在全体考生中的位次。期中考试小明语文108分(满分150分)，我们以班为单位（全体），只有考虑到全班同学的最高分、最低分、平均分，等等，经过一系列繁杂的统计才可以明确地说明他的成绩怎么样，他在全班同学中处于什么位置。反之，我们只知道小明的原始分是不能判断他的成绩之高下的，因为位次不明确。

2、原始分不具备可比性

位次不明确可以推论出：不同科目或者同一科目的不同次考试之间，原始分不具备可比性，比较是无实质意义的。如，期中考试小明语文108分，英语同样108分，若满分都是150分，是不是语文英语实质成绩相同？我们不知道。因为原始分受试题难度的影响，试题若难原始分就低，试题若易原始分就高。如果期中考试全班语文均110分、英语均105分，那么，小明的语文比班平均分低2分，而英语比班平均分高出3分，同样的108分却代表不同的水平。所以，就原始分所代表的实质成绩而言，语文108分≠英语108分，即不同科目（或同一科目不同次考试）的原始分1分≠1分，所以原始分的“每1分”并不一定等值。实际是因为原始分不具备定性位导致原始分数不具备等值意义上的可比性，所以使用原始分不能对考生水平进行有效的比较。

3、原始分不具备可加性

原始分不能直接相加，因为原始分的“每1分”并不等值，即原始分1分≠1分。高考中，我们习惯于依据考生各科原始分相加得到的总分进行录取，然而，这是不科学的。原始分不可直接相加，强加一起如“语文108分+数学108分+英语108分=324分”，就分值而言“语文1分≠数学1分≠英语1分”，所以324分是难以准确反映三者分值之和的。也就是说，原始分的简单直接相加所得之和是不能反映各科实质分数之和的，因此原始分不具备可加性。

4、原始分不具备稳定性

原始分不稳定，易使权重变形。比如高考中语数外各150分，即政策权重之比为，语文150分：数学150分：英语150分=1：1：1，由于难度等因素，若实际平均分之比为，语文125分：数学108分：英语115分≠1：1：1，即从平均分的角度考量，各科实际权重125：108：115不等于政策权重1：1：1。明显，权重发生了变化。

原始分有如上弊端，要进行各科考试实质分数的相加，就要对原始分进行转化导出，对各科分数进行定位，校正其权重，使各科分数可比可加，如此才能使各科成绩和之总成绩有效。导出分数是在原始分数的基础上，根据确定的规则转化出来的，其目的就是解决原始分所难以解决的定位、可比、可加、权重等问题，就是为了更好、更合理地解释分数的含义，实现分数的等值化，使之意义明确。

原始分需要转化导出才更加有效，实践中我们也引进相关的技术，如高考中使用过标准分，但是，民众不理解，除海南外均退回用原始分。民众的逻辑是：虽然原始分数“语文1分≠数学1分≠英语1分”，但是差不多，一分就是一分，确确实实就是考生自己考试所得，感觉好像是等值的；经过标准分这个引进的办法转化导出之后，民众不理解、不习惯，不信任，以致原始分不能动。标准分的实践未取得预期效果，本来考试标准化改革是为了高考更加公平有效，民众不认可怎么办呢？只能遵从民意。于是，高考统考科目赋分方式坐了一次过山车回到了原点：原始分——标准分——原始分，还需要找到原始分可加的理由：“新高考实施前各科目原始分之所以可以直接相加，是由于对于同一共同竞争群体（如某省参加高考的全体文科生）而言，其考试科目是完全一样的，各科目试卷无论难易，对这一群体的所有考生来说具有相同影响，原始分数直接相加不影响竞争公平性。”[3]?这便是我们需要明白的“治理困境”。因而，原始分简单直接相加，在中国很好用。民众认可就好用，这是一种约定或契约？

无论如何，从表面来看：确实是民众所认可的原始分延续运用，皆备公平与效率的标准分逐步退出高考。换一种导出分数来试行，如等级赋分制，它的境遇估计不会比标准分好多少，考试的文化环境对考试的运行之影响是客观存在的，它们在中国犯了共同的错误：动了原始分，或者说，用我们不习惯的方式动了原始分。任何引进的理念制度文化要融入本土文化都需要一个融合的过程，这个反应是一个化学式反应，不是物理式反应，即使理念得到完全认同，技术操作层面也不一定完全照搬，因此，直接运用等级赋分制就注定不会一帆风顺。

二、等级分不好用但能用

浙江的实践告诉我们：等级赋分制不好用，但现在还能用还要用。

等级赋分制的不好用，是因为不认可、不习惯、不符合中国国情、不能融入中国考试文化，主要体现在以下三点：1、可能诱导考生及家长在选科时的博弈心理?，造成学科失衡现象；2、赋分过程中可能产生分数差距扭曲?，?不利于提高考试的信度；3、造成选考科目分数的区分度和权重降低?，不能合理体现选考科目的价值和重要性[4]。

1、选科博弈属正常，学科失衡则不正常。浙江7选3，从考生个人水平的角度出发，肯定要从7科里边选自己最感兴趣、最特长的3科，以保证拿到最高原始分；但选考科目的等级赋分制是一种相对赋分，任何相对赋分不仅要看原始分的绝对值，更要看和竞争对手相比之后的相对位次；那么，要想提高位次得高分，除自己实力外就需要更多的相对较弱的对手；所以说，相对赋分产生博弈是正常的。物理、化学两科是比较繁难的学科，但又很重要，问题就出现在难而重要。当大量考生趋易避难，选考繁难学科的都是少量优秀者，当某一学科因难学而退出的相对较弱学生过多，这就造成学科失衡：一则因为该学科人数少，二则因为这些繁难学科的重要性。重要的科目学生少，这是不正常的。保障机制的作用在于：当繁难学科最弱档次学生放弃时，虚拟一部分考生，使实际考生的位置不会后移。而顺序名次分的逻辑是：固定每一个名次，有人退出，后边名次前移，而不是被向后挤。在名次分的机制中不因博弈而影响有兴趣、特长学生的位次，博弈只能成为无兴趣爱好、没有特长的无绝对实力者的专利，博弈对上中等学生的影响极其有限。

2、相对赋分因排序而改变原始分数的差距是必然的，但等级赋分制可达到扭曲的程度则是民众难以认可接受的。简单来说，某科满分100分，设有一组原始分：95、90、89、88.5、88，排序：第一、二、三、四、五名，排序后给我们的感觉是：相邻名次之间是等距的，而原始分的实际分距是：一、二名5分，二、三名1分，三、四名与四、五名是0.5分，5分≠1分≠0.5分，并不相等。如果不改变原始分数的差距且每1分一个名次，应该这样排序：假设100分是第一名，则95分第六名、90分第十一名、89分第十二名、88.5分第十二名半、88分第十三名。“第十二名半”，出现了半名，根本不符合我们排序的习惯和排序概念。所以说，排序会改变原始分数的差距。等级分是这样产生的：原始分-排序-比例-等级-等级分，就是说，排序之后还要按照人数百分比例划分等级，问题就出在这里。扭曲的表现分为：缩小、扩大、极端情况三种。按等级赋分制之规定，同一等级之内等级分相同，而同等之内考生的原始分可能会相差较大，同等内原始分有差距变成了没差距，这是缩小了原始分的差距；一分之差，分为两等，相差了三分，这是扩大了差距。有一种极端可能的情况是：同分落入不同的等级，“如果某个学科相同分数的人数比例过高，还会出现同分不同等的极端情况”[5]。这三种情况，都是民众难以认可接受的。

3、区分度下降是因为把不同的原始分落入了同一等级；权重降低一则因区分度下降，二是因分数全距减小。按照人数百分比例赋分，不仅有可能使不同原始分落入同一等级而缩小了分数差距，更因此而使等级赋分制下的选考科目区分度下降，同分现象之人数比例与等级赋分之人数比例相同，区分度的下降实源于此人数百分比例。由于选考科目易同分，那么区分度自然倚重于语数外，语数外的权重自然提高，那么，选考科目的权重则相应下降。选考科目的权重降低，还因为分数全距的缩短。浙江选考科目等级赋分制40分起赋，实际分全距是[40，100]，而语数外的满分各150分，理论上的分全距是[0，150]。为了使选考科目不被边缘化，提升选考科目的区分度和权重迫在眉睫。

等级赋分制的不好用还体现在学生的认可度上。社会的认可，尤其是考生是否认可，我们需要高度重视。考生对于高考改革的基本看法一定程度上左右着家长等相关人士，并共同影响着社会认可度。刘希伟等认为“学生的知识与眼界毕竟相对有限，高考政策调整不可能完全吸收学生的意见与建议”，“他们对于高考政策的认识可能是偏颇的”，我们“必须加强高考政策的解读与宣讲，引导学生形成较为全面、理性的认识，以便尽可能为深化与完善高考改革方案创造有利支持条件”[6]。我们认为学生的知识与眼界相对有限是相对的，它们的认识或许有可能是偏颇的，对他们加强高考政策之解读与宣讲也是必要的，引导其形成较为全面、理性的认识也是需要的，为深化与完善高考改革创造有利支持条件也是可以争取的，但是，高中生的意见必须要得到应有的尊重，毕竟他们已经达到或将要达到高中毕业水平，而且，高考改革的直接服务对象就是高中生。根据调查数据，学生对等级赋分的认可，表示“比较赞成”的比例71.81%，“非常赞成”的比例为7.22%，选择“不赞成”的学生占比20.96%。[7]从选项来看，只有“非常赞成”、“比较赞成”、“不赞成”三项；如变为“非常赞成”、“赞成”、“比较赞成”、“比较不赞成”、“不赞成”、“非常不赞成”六项，考生可以充分自由选择。或者提供“非常赞成”、“比较赞成”、“比较不赞成”、“非常不赞成”四个选项，考生也可以自由表达意志。而赞成方面有两个选项“非常赞成”、“比较赞成”，不赞成方面只有“不赞成”一个选项，在选项设置上这是不对等的，容易影响考生的选择，引导学生赞成。从数据来看，“不赞成”占比高达20.96%，五分之一强，很不低，一定程度上能够说明等级赋分制在学生认可方面的“不好用”。

等级赋分制之所以还能用还要用，是因为：1、原始分不能用，2、有了保障机制，3、无替代品。

1、原始分数不能用：“不同选考科目的原始分显然不能直接相加”[8]。从理论上说，统考科目用原始分直接相加也是说不通的，但是在民众认可的情况下，勉强可以相加，影响不是很大。如果选考科目也用原始分直接相加，有些科目易得高分，有些科目难得高分，造成的结果必然是大家都去选易得分的科目，难得高分的科目之失衡定甚于现在之物理科的状况。我们也不可能有办法把7个自选科目的试题难度拉齐，原始分绝不可用。

2、保障机制打补丁：在物理学科失衡的状况下，经广泛征求意见，2017年11月29日，浙江省正式发布《关于进一步深化高考综合改革试点的若干意见》，建立选考科目保障机制，引导考生选考处于学科失衡状态的物理[9]。据此《意见》，今后将建立选考科目保障机制，并根据选考科目实际，保障机制率先用于物理选考科目，根据实际需要，保障数量为6.5万。当某年物理高考选考人数少于保障数量6.5万时，即启动保障机制，以保障数量6.5万为基数，按规定比例赋等级分，空缺后面等级。按保障数量计算，选考科目6.5万考生，原始分排在前1%的考生，赋等级分为100分，共有650名考生满分。如果考生不少于6.5万，那么就有不少于650名考生满分；若考生少于6.5万，启动保障机制，仍有650名考生满分，使中上等考生选科无后顾之忧，可避免物理选考人数持续下降。章建石认为：这是“使用政策工具进行调整的思路”，“短期内应该会发挥积极作用”[10]。

3、暂时尚无替代品：即使大家对等级赋分制基本都持不很满意的态度，但是暂时还没有找到合适的替代品。刘希伟等认为“我们暂时还难以找到其他更加科学、合理的分数制度，也不可能找到一种没有任何弊端的替代制度”[11]。章建石认为“从长远来看，选考科目的赋分方式还需要改进”，希望“更好、更有针对性、更具体的解决方案能够涌现出来”[12]。于涵等建议“加强实证研究?，探索符合试点省份实际情况的可行方案”[13]。

三、赋分方案不具备刚性

新高考改革要求“全面发展”，要求“确保公平公正”，要求“增加学生选择权”，要求“确保考试招生工作高效、有序实施”；在中国，这就必须要有精细的刚性的赋分方案与这些要求相适应。

全面发展要求刚性赋分。素质教育主张全面发展，应试实践的逻辑却是考什么就备考什么。如果说我们基础教育的课程设置是全面的、科学的，那么，我们考试的实践应该是教什么就考什么。全面施教——全面学习——全面发展——全面考核——全面施教，这是一个程序自动化化的系统，任何一个环节有漏洞都会影响系统的运作。全面发展要求全面学习，全面学习需要全面施教，全面施教要求全面考核，基础教育阶段，越是低年级越是这样。这里的考核，要求是有效考核。所谓有效就是考核评价的影响是有效的，能够实实际际的影响到学习者及施教者。是否高考必考或选考科目，150分还是100分，都直接决定某个科目的被重视程度。高考有考就学，不考就不学；高分高对待，低分低对待；模糊考核就模糊对待，精细考核就精细对待。精细考核就需要精细的刚性的赋分方案，也就是说，基于中国考试文化，要求学生全面地更好地发展，就要求我们全面地精细地考核，因而需要精细地刚性地赋分。

公平公正要求刚性赋分。公平：公是公众，指大家，平是平等；合起来的意思是大家平等。由于人与人之间差异的存在，故没有绝对的平等，而只有相对的平等，所以就需要公平之公，即公正。公正:是公平而正直，正直就是没有偏私。没有偏私，就是依据一定的标准，平等的对待相同的，不平等的对待不同的。就考试而言，在形式上要做到：甲考1分，给甲1份的奖励；乙考10分，给乙10份的奖励。因为：1分/1份=10分/10份，奖励（份）的依据（分）是相同的，比例是平等的，结果是公平的，所以是公正的。丁考100分，因某种理由给丁101份的奖励，多出来的1份奖励，依据了另外的标准，这样的结果是否公正就需要讨论。或者说，丙和丁同时考了100分，二者对某个机会有相同的资格，并且都在力争，如果我们把机会给了丁，而对丙讲不出任何拿得到桌面上的理由，这就是不公正。为了避免这种不公正，就需要精细的刚性的赋分方案。比如说换一种更加精细的赋分方式，丙得了99.98分，同时丁是99.99分，99.99分&amp;gt;99.98分，依据分数高者优先的规则，机会自然属于丁，就不需要再找其他理由。这样，也更容易做到形式的公平公正。

学生选择权要求刚性赋分。学生选择权是学生基于自身的兴趣特长，根据自己的主观自愿，在相关规定的范围之内，所能够享有的自由选择科目或者教育，自主安排科目进度或学习时间，实现其成长权利的一种手段，它由学生的主观自愿权和教育的客观自由权构成。学生选择权作为学生的一项重要成长权利，一定要受到尊重和保护。学生在行使这一成长权利的时候应该坚持“依规行使”和“相对行使”的原则，并遵守一定的限度。鉴于中国学生的选择权尚处于不成熟状态，我们应立足现实，要运用各种手段保护其成长。就从自主选择科目这个角度看，特别需要精细的刚性的赋分方案。比如说等级赋分造成学科失衡，选物理需要再三权衡，赋分方案就影响了学生的选择权——首先影响了学生受教育的客观自由权，选物理就有可能得低分；进而影响到学生的主观自愿权，可能得低分，那学生就可能牺牲兴趣转而选择其他有望得更高分数的科目。学生的这项重要的成长权利就没有受到保护，选择的限度实际上降低了。如果说刚性分数保护的是兴趣的话，那么，精细保护的是特长。赋分刚性，选哪一科都意味着相近的竞争力度，无兴趣不如有兴趣，保护了兴趣；排名次前0.1%和前0.9%赋同样的分，特长就难以得到保护，而赋不同的分，竞争就有必要，特长由此而因奋力竞争铸就。

高效有序要求刚性赋分。如前面我们举例，丙和丁同时得了100分（等级分），二者竞争同一个机会的时候，如果我们要把机会给其中某一个，一定要拿出说得过去的理由。如果我们用精细的刚性的赋分方案，设丙99.98分（名次分），丁是99.99分（名次分），99.99分&amp;gt;99.98分，我们依据分数高者优先的规则，机会自然属于丁，不需要再找其他理由，少了一道工序，效率自然提高。同时，若同等级分竞争同一机会，即使根据某种事先公布的理由，得不到机会者的不公平之感受，可能依然比少了0.01分的感受要强烈得多。这种感受的积累，可能形成某种无序感，反过来说，在我们这个特定的考试文化环境中，精细的刚性的赋分方案更容易做到有序。

而现行的赋分方案不具备刚性。要求赋分方案刚性，就是要求它不易变化，而前面我们已经证明：无论是原始分还是等级分，都是易变的，所以“原始分+等级分”的赋分方案是易变的，不具备刚性。而等级分同时做不到“精细”。

另外，原始分与等级分相加的合理性我们存疑，二者是否可加？必考科目使用原始分计成绩，选考科目使用等级分，王森认为“两种不同类型成绩加总的科学性值得探讨”[14]。我们的答案是明确的，原始分本不可加，与等级分就更不能加在一起。温忠麟认为“有必考科目和选考科目需要合成总分，必考科目用标准分，选考科目要校准分数”[15]也不认同原始分与等级分加总。

我们认为：必考科目和自选科目统一用顺序名次分，可以同时解决“不具备刚性”与“是否可加”以及“认可”的问题。目的就是解决原始分不可加，等级分不好用的难题。

四、中国的等值分名次分

1、什么是名次分

顺序名次分是各科按原始分排名次，按名次赋分，使各科成绩可加的中国式等值机制。笔者在《物理尴尬何时休》一文中，为解决学科失衡的问题，基于排名次的方式为中国民众所熟知认可而提出。把排名次与等差数列相结合，在一定的规则下，经过推导，得到顺序名次分。赋分公式为：名次分=(科目分值÷考生总人数)×(考生总人数+1-顺序名次)，现对其做进一步的修订。[16]

修订后的基本思路是：1、各科按原始分从高到低排名次，以名次赋分；2、分数呈等差数列，第一名为满分，最后一名若不并列，分数等于公差(一个非常小的正数)；3、一科多考，每次以本次实考学生数赋分，自选最高成绩最终赋分；4、相同分值科目，名次相同则分数相等；5、外语不同语种各最终赋分后，参加总赋分；自选科目以最多考生科赋分，其余科目空缺后面名次；6、名次总分=六科名次分之和，最后以名次总分排总名次待录取。

排名遵循以下原则：1、排名次总原则：原始分高者优先；2、外语各语种同分排名原则：考生多者优先；3、不同次考试同分排名原则：考生多者优先；4、自选科目同分排名原则：考生少者优先；5、强化科目平衡原则：各自选科目总分之和相等；6、补充原则：零分排名次优先缺考者。

我们把“名次分=(科目分值÷考生总人数)×(考生总人数+1-顺序名次)”称为顺序名次分的根本公式，简称为根本公式。必考且只考一次科目，可以直接用这个公式计算成绩，如语数两科。

外语科多语种，并考多次。每一语种每次赋分公式为：单次名次分=(科目分值÷单次考生数)×(单次考生数+1-顺序名次)，可称为多次考试科目每一单次赋分公式，简称单次公式。多次考后，再以各人最高名次分排名次，同分排名遵循原则3，考生多的某次优先于考生少的某次。各语种多次考试排出最终名次后赋分，公式为：语种名次分=(科目分值÷语种考生数)×(语种考生数+1-顺序名次)，称为外语科各语种专用赋分公式，简称语种公式。再对各语种名次分排序，遵循原则2，同分时考生多的语种优先。排序后，用根本公式计算出最终分数。

自选科目，考多次。先用单次公式计算单次名次分，再遵循原则3排出各科最终名次后赋分，自选科目的赋分公式是：自选名次分=(科目分值÷最大考生数)×(最大考生数+1-顺序名次)，可称为自选公式，其中的最大考生数，是自选7科中定有选某科人数最大，所有7科皆用此数据计算，。

名次总分=六科名次分之和，最后以名次总分排名次，待录取。