首都医科大学考试命题、成绩统计与试卷分析质量控制要求(试行)
课程考试是学校教学的重要环节,可反馈学生、教学、管理等多方面信息,是进行教育测量与评价必不可少的手段之一。对于考试取得的数据是否进行科学的统计分析,直接影响到教学质量和教育评价结果。为了有效地发挥考试的功能,保证学生成绩考核质量,规范课程考试试题编制和统计方法,对本、专科学生成绩考核的试题编制和成绩统计方法提出要求如下:
一、考试计划的编制原则
考试要目的明确,要符合教学大纲的要求,能较好地覆盖整个教学内容。命题方案要合理,要科学,要符合素质教育的要求,要按照教育目标分类各层次的要求来进行。基础阶段宜偏重知识的掌握,回忆、解释层次的试题比例应适当加大;临床阶段宜偏重临床分析和处理能力的培养,问题解决层次的试题比例应适当增大。
1.为保证考试具有较高的可靠性和足够的覆盖面,试卷必须要有足够的长度。试题题量和时间的确定原则是以中等水平的学生答满整个考试时间为度。各阶段综合考试试题量为200分值,时间为3小时;基础课程的期中、期末考试一般确定为:试题量100或150分值,考试时间2小时;临床阶段各类考试按《首都医科大学关于临床教学阶段考试管理的规定》执行。
2.试题中,教学大纲要求掌握的内容约占50%—60%,熟悉的内容约占30%—40%,了解的内容约占10%~20%左右,要突出重点,照顾全面。
3.命题应符合教育目标分类的原则。在基础教学阶段,回忆(知识记忆)、解释(理解)、问题解决(知识应用)三个层次试题的比例目前大致为50% :30% :20%;临床教学阶段的考试应逐步加大后两个层次的比重。
4.试题的难易程度应视考试的目的而定。多数考试的试题平均难度在0.6左右较为合适。在编制试题时,可保持全部试题中有2/3的试题其难度值在0.4~0.7之间。可以将试题难易程度划分为三等,按 难 : 中 : 易 = 10~20% : 80~60% : 10~20% 的比例组成试卷。
5.考试要求主观题(自由应答题)和客观题(固定应答题)并用,并符合主观题 : 客观题 = 30-50% : 50-70%的比例。
6.考试命题应遵循:试题抽样具有代表性、试题表述的简明性(简单、明确、清晰)、试题彼此间的独立性以及命题与答案同步进行、试题有利于客观评分等原则。
7. 为便于统一要求,规范试卷格式,各院系原则上不要自行设计试卷抬头,该试卷格式可从教务处网页上下载。
二、编制考试“命题计划双向细目表”
考试必须首先从编制考试命题计划,保证试卷的内容有效性入手。必须要以由命题教师编制、经过学系(教研室、中心)主任审核的“考试命题计划细目表”作为编制试题的依据。
“考试命题计划细目表”应该按照教学内容(章节)纵向排列,并按各部分的教学时数和重要程度确定不同的权重;之后再按教学大纲要求、教育目标分类、试题类型和难度等几个方向进行分解,构成细目表的“横向”。按照细目表编制试题,是对保证考试质量的基本要求。(见附件1)
三、学生成绩统计
学生考试成绩,是科学地评价学生和教师的重要依据之一,是反馈教学工作、管理工作中有关信息的重要途径。每次考试之后, 要求必修课须至少按规定进行以下4项学生考试成绩的统计:
1.学生成绩频数、频率分布表、分布曲线或直方图
(1)频数、频率分布表:将考试成绩换算为百分分数,从0分-100分,以 10分为组距,共分11个组段,填写各组段的频数和百分率。
(2)频数、频率分布的分布曲线或直方图
绘制上述频率或频数分布的曲线或直方图,以观察分布情况。
2. 学生成绩分布的正态性检验
(1)D检验法。方法参看人民卫生出版社,高等医药院校教材(供卫生专业用)《卫生统计学》。
(2)矩法。方法参见附件2。
3.平均分(算术均数和中位数)和标准差
方法参看人民卫生出版社,高等医药院校教材(供卫生专业用)《卫生统计学》。
4.最高分、最低分和全距
各类课程成绩考核平均分、标准差、全距正常值(供参考)见附件3。
四、考试效度、信度和试题质量分析
要确定考试结果是否达到预定目标,是否正确,考试之后,要选择部分课程,特别是经成绩统计发现问题较大的试卷进行考试效度和信度的评价。为确定试题的质量,加强题库建设、完善试题的有关数据,获得改进教学和考试质量的更多信息,也要进行每道试题的实测难度和区分度的计算。
1.考试内容效度的估计:考试之后,由学系(教研室、中心)主任或聘请同行专家,根据试卷和考前由任课教师制定的“命题计划细目表”以及考试成绩统计结果和经过测算的试题质量,对本次考试的有效性再次进行检查,作出判断。
2.考试信度的计算 (分半信度):方法是将一次考试的题目分成等质的两半,计算相关系数(方法参看人民卫生出版社,高等医药院校教材(供卫生专业用)《卫生统计学》,直线相关),之后根据斯皮尔曼-布朗公式进行调整。
R = 2r / (1 + r)
( R–整个考试信度, r–两部分之间的相关系数 )
3.试题难度的计算
计算公式: 某题难度P=考生得分的平均数 / 该题满分分数。
4.试题区分度的计算
计算方法:将试卷按成绩排列,分别以高分组(前27%)和低分组(后27%)计算出“高分组P值”和“低分组P值”,区分度为:
某题区分度r = 高分组P值 - 低分组P值
试题质量判断标准见附件4。
五、附件
1. 首都医科大学考试命题计划细目表(样张)
2. 正态性检验“矩法”
3. 各类课程成绩考核平均分、标准差、全距正常值
4. 试题质量判定标准
附件1
首都医科大学课程考试命题计划细目表
课程名称: 年级: 专业: 日期:
考 试 内 容 | 百分比% | 分值 | 题数 | 教学大纲要 求 | 教育目标分 类 | 题 型 分 布 | 试题难度分布 | |||||||||||
了解 | 熟悉 | 掌握 | 回忆 | 解释 | 问题解决 | 客 观 题 | 主观题 | 较易 | 中等 | 较难 | ||||||||
A型 | B型 | X型 |
| 论述 |
|
|
|
| ||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
合计 | 100 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
附件2
正态性检验“矩法”
正态性检验(矩法)使用偏度(skewness)系数g1及其标准误δg1,峰度(kurtosis)系数g2及其标准误δg2。
一.计算 U1= |g1 | / δg1。
若U1<1.96,则总体偏度系数为零,总体分布对称;
若U1≥1.96,则当g1<0时,总体为负偏态(偏向高分端),当g1>0时,总体为正偏态(偏向低分端);
进行学生成绩分布的正态性检验时,若1.96≤U1≤2.58,且g1<0,可认为属于可以接受的“偏向高分数端”。
二. 计算 U2= |g2 | / δg2。
若U2<1.96,则总体峰度系数为零,总体分布为正态峰;
若U2≥1.96,则当g2<0时,总体为平阔峰,当g2>0时,总体为尖峭峰;
进行学生成绩分布的正态性检验时, U2≤2.58 可认为属于可以接受的峰度。
在“SPSS”软件中,选择 Analyze→Descriptive Statistics中Frequency或Descriptive中的复选框skewness和kurtosis,就可以得到g1,δg1和g2,δg2,然后再手工计算U1和U2。
附件3.
各类课程成绩考核平均分、标准差、全距正常值(供参考)
本科层次课程
均分
标准差
全距
成绩分布
综合考试
65-75
7-10
30-40
正态,或
偏向高分数端
普通基础
70-80
外语
马克思理论和思想品德
75-85
5-10
专业基础
7-10
体育课
专业课
生产实习
80-90
5-10
专科层次课程
均分
标准差
全距
成绩分布
普通基础
70-80
7-10
30-40
正态,或
偏向高分数端
外语
马克思理论和思想品德
5-10
专业基础
7-10
体育课
专业课
生产实习
80-90
5-10
附件4.
试题质量判定标准
一、难度的判定
P ≥ 0.90 易
0.75 < P < 0.90 较易
0.55 ≤ P ≤ 0.75 中等
0.40 < P < 0.55 较难
P ≤ 0.40 难
二、区分度的判定
r ≥ 0.3 很好
0.3 > r ≥ 0.15 较好
0.15 > r ≥ 0 一般
r < 0 差
三、综合P、R值衡量试题质量
P值大于0.5,r值大于0.15,试题难度适中,区分度良好,是好试题;
P值小于0.5,r值大于0.15,试题偏难,但区分度良好,依然适用;
P值大于0.5,r值小于0.15,试题容易且区分度较差,必要时少用;
P值小于0.2,r值小于0.15,试题既难又无区分能力,不应参加计分