利用SPSS实现命题质量的定量分析

来源 :考试周刊 | 被引量 : 0次 | 上传用户:yanglsm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 考试是评价教育效果的重要手段,而命制试题则是考试中的重要一环。过去,对试卷命题的质量评价常以主观定性的方式为主。现在可以依靠SPSS(统计产品与服务解决方案)软件,实现对命题质量的定量分析。
  关键词: 命题质量 定量分析 质量评价
  一、命题定量分析的准备工作
  启动SPSS19.0中文版,选择“变量视图”中,在名称下输入学号、题目1—12、总分等命题基本情况项目。在类型标记中,将学号定义为名义,将题目1—12定义为度量,小数根据实际情况设定,其他项保留默认设置。选择“数据视图”标签,在各行内输入学生的各题得分和总分数据(图2)。
  图1 定义变量设定图
  图2 数据输入图
  二、命题的定量分析
  (一)描述性统计量分析
  用以描述考试总体情况的各分数统称为描述性统计量。在SPSS中,点击“分析—描述分析—频率”。将“总分”等变量名称选入待计算变量框中,在“统计”中选择要计算的统计量,选中均值、极值、标准差、中位数等项,最后输出结果(表3)。
  表3 有效数据的得分描述性统计
  (二)试题的正态分布预期
  在學生群体足够大时,学生的能力呈正态分布。处于能力尖端和尾端的学生数量少,处于能力中端的学生数量多。在考试命题适宜,教学状况正常,学生水平相当,试卷评阅严谨的前提下,一份合格的试题,所反映出的学生成绩应呈现正态分布的特点。为研究试题能否体现学生能力的正态分布,可在SPSS软件中点击“分析—描述分析—频率”,在“频率”对话框中选择“图表”,点选绘制“总分”的直方图并标变化曲线(图4)。
  图4 学生总分的直方—变化曲线图
  若学生总分的直方—变化曲线图能呈现正态分布,那么,可进一步探究命制试题的正态分布预期。可利用单个样本K-S校验测查给定数据与正态分布间的显著差异。在SPSS中,点击“分析—非参数检验”,对“总分”进行单个样本K-S检验(表5)。
  表5 试题总分的单样本Kolmogorov-Smirnov检验
  (三)难度
  试题的难度(P)是测验题目难易程度的统计量。试卷难度等于试卷内各题的平均难度。要观测命题试卷难度,应先测量命题试卷内各题难度。试题计分方法不同,难度计算方法不同。
  二分法计分(选择题、判断题)题目的难度统计。对于二分法计分的题目,答案只有对与错两种可能的结果(即答对得分,答错不得分)。此类题目难度通常用通过率(P)表示。其中,P=1—R/N(其中R为答对该题的人数,N为答题总人数)。由此,可在SPSS中,运用“转换—计算变量”方法,在“计算变量”对话框中输入公式,直接算出二分法题目难度(表6)。
  表6 二分法计分题目难度值
  非二分法计分(主观题、论述题)题目的难度统计。对于非二分法计分的题目,难度(P)可以通过公式P=1—X/W(X为该题目均分值,W为该题满分值)计算。可采用“计算变量”方法直接输入公式,算出非二分法题目难度(表7)。
  表7 非二分法题目难度值
  全卷难度值(P)等于卷内各题难度平均值,采用SPSS“计算变量”可得p=0.4。
  (四)区分度
  区分度是反映试题区别学生水平和能力的统计量。在实际统计时,常以考试总分作为考生的实际水平,而把某题的得分与学生总分之间的相关系数作为该题的区分度。
  客观题的区分度统计,可把客观题得分视为等间距测度的连续变量,采用Spearman等级相关分析统计区分度。主观题的区分度统计,可把主观题成绩视为非等间距测度的连续变量,采用Pearson相关分析。在SPSS中,点击“分析—相关—双相关”。先选择客观题各题分数和总分采用Pearson相关分析(1-6),再选择主观题(7-12(2))各题分数和总分采用Spearman相关系数分析,得到结果合成(表8)。
  表8 各题区分度汇总表
  (五)信度
  信度是衡量一次考试可靠性、稳定性的统计量。信度代表着试题的可靠性,其取值在0至1之间。信度越高,可靠性越好,但容易造成成绩标准差过大。一般采用SPSS中克伦巴赫系数(Alpha模型)计算命题试卷一致性信度系数。在SPSS中,点击“分析—度量—可靠性分析”。在可靠性分析对话框中,选择试卷各题得分数据。点击“统计量”,选择“如果项已删除则进行度量”,结果如下(表9-10):
  表9 信度统计值表
  表10 删除变量后项目统计值表
  (六)效度
  效度是指测试结果的准确性与有效性程度的统计量,即一个测验能够测量学生水平的程度[2]。可采用效标效度法测量试题的效度。将学生的平时成绩作为效度分析的校标,利用皮尔森相关系数法计算命题测试分数与校标之间的相关系数,结果即为试题效度(表11)。
  图表11 命制试题得分与平时成绩间皮尔逊相关系数分析
  三、命题质量评价
  第一,描述性统计量分析。由表3可知,命题平均成绩为32.54分(满分49分),最高分45分,最低分12分,标准差为6.94。平均分、标准差数值适当,极值差距较大,体现了学生个体之间对题目的理解差异大。由此可见,试卷命题中,部分题目可能表意不清,引发部分学生无从下手作答的情况。此卷应注意题干的表达,使学生清晰了解题目意图。
  第二,正态分布预期分析。由图4可知,学生总分变化曲线呈正态分布曲线样式,因而命制试题具有正态分布预期。由表5进一步分析K-S检验中的各数值可知,Z值为0.493,sig(双侧P值)=0.851>0.05,由sig(渐进显著性)>0.05,可得给定数据与正态分布没有显著性差异,即总分数据符合正态分布要求。
  第二,试题难度分析。一般认为,命题难度在0.4至0.7之间为宜,难度值小于0.4的题目难度较小,难度值大于0.7的题目较大。一般认为,最好的试题难度应接近于中等难度(即p=0.5)。因此,本命制试题全试卷具有中等偏下的难度(p=0.4)。这份命制试题如果运用在终结性考核中,用以检测学生在群体中知识掌握水平,作为合格水平测验,则效果较好。但作为过程性考核,则其难度水平较低,需适当加大难度。由表6、7可知,T9、T1难度过小,建议予以删改。T6、T3难度过大,应进一步结合课程评价标准加以研究,检验是否超纲。
  第三,区分度分析。一般认为区分度在0.4以上的题目,鉴别能力优秀;区分度在0.3至0.39间的题目,鉴别能力良好;区分度在0.39以下的题目,应进行删改。由表8可知,全卷区分度总体水平适宜,能够区分学生掌握知识程度的优劣。但T1、T3、T4、T6四题区分度较低(<0.39),说明学生在作答这些题目时,掌握的知识和对知识理解、运用的能力不能充分体现在试卷答题分数上,因此,应作删改。
  第四,信度分析。从表9可知,本次考试的信度为0.455。普遍而言,学校测验采用试卷信度应达到0.5以上。本命题试卷达不到可信要求,为提高本卷信度,本卷应进行修改。从表10可知,删除T1后全卷信度提升至5.0,故可考虑对T1进行替换。同时,目前本卷题量共12题,题目数量较少,可考虑通过适当增加题量的方法,提高全卷信度。
  第五,效度分析。从表11可知,全卷效度值为0.837,在0.01的显著性水平下,sig.值(显著性)为0.000,表明学生完成命制试题的得分与学生平时的成绩两者间呈显著的相关关系。命制试题具有较高的效度。
  参考文献:
  [1]张雪冰.试卷分析中的正态分布和非正态分布[J].安徽建筑工程学院学报(自然科学版),2009.8(17-4).
  [2]陈伙平.教育科学研究方法与原理[M].福建科学技术出版社,2005.7,124.
其他文献
摘 要: 义务教育课程标准(2011版)在继承了传统“双基”的基础上提出了“四基”,增加了“数学基本活动经验”和“数学基本思想”。这一课程总目标的变化给我们一线数学教师带来了许多新的思考,在“空间与图形”的内容领域,如何结合这一变化,改进和完善我们的课堂教学是值得进行大胆探索与研究的。作者结合自己参与教学活动展示的磨课体会,以两节立体图形表面积的教学为切入口,围绕转化思想方法的渗透与感悟,谈谈自己
摘 要: 信息技术飞速发展,信息技术课程相对存在明显滞后性,本文主要立足教师岗位,分析产生这一现状的因素,并从教材二次开发与处理的角度论述如何促使信息技术课程适应教学需求。  关键词: 滞后因素 教材 二次开发  现代信息技术的高速发展,使曾经的幻想一个个成为现实,技术引领着革命,带领人们跨入崭新的时代。它的发展也打破了原有课堂的宁静,它的快节奏促使教育进行一番改革。然而相比其他领域,技术的教育之
摘 要: “六年一贯制”实验班教育教学团队,以“创新人才教育和培养”为实验课题,在新背景下进行创新人才培养模式的探索和研究。本文主要介绍如何有效调动学生学习英语的积极性,让学生充分参与课堂,将单纯的教学模式转换为交互式教学模式,努力做到让学生“High”在课堂,乐学其中。  关键词: 创新人才培养 基础英语教学实验 后续学习  2010年发布的《国家中长期教育改革和发展纲要》明确提出进行“拔尖创新
摘 要: 将“快乐教学法”融入农村初中音乐课堂教学中,相较于传统教学模式,教学流程、方式都将发生变化,因此,探究更为科学、高效的备课方案显得十分必要。基于上述背景,本文以“快乐教学法”的课前准备为切入点,从制订完备教学计划、进行详尽课前调研和创新课前备课思路三方面出发,论述具体的备课措施,希望能够为“快乐教学法”在农村中学的推广实践提供一些参考。  关键词: 初中音乐教学 快乐教学法 备课方式  
摘 要: 2013年12月的大学英语四级题型改革给公共英语教学提出了新问题和新挑战,面对教学改革,公共英语课时量减少,如何在有限的教学时间内有效提高听、说、读、写、译方面的能力,成为众多英语教育同行都尤为关注的问题。本文在之前的新四级翻译答题技巧,海口经济学院公共英语翻译教学现状及改革模式的探索等前期研究的基础上,提出公共英语翻译教学的新模式,希望能给正在研究此类问题的同行们抛砖引玉,大家共同努力
摘 要: 基于语料库的作文批改模式可以变以往静态的作文批改模式为人机互动的动态评估与纠错模式,可以作为教师批改英语作文的有益补充。本文以句酷批改网为例,根据对某校大二非英语专业学生作文的修改情况,从共性薄弱点反馈和个性薄弱点反馈两方面进行分析,寻求借助语料库纠错和老师批改相结合的方法,旨在提高大学生的英语写作能力。  关键词: 大学英语作文 句酷批改网 批改反馈  一、引言  一直以来,对学生英语
《但愿人长久》是苏教版四年级上册的第二课,这篇文章属于“文包诗”,截取《水调歌头·中秋》的最后一部分供孩子学习。这部分是全诗的精华,是全词基调由心绪不宁转向宽慰豁达的点睛之处。这首词之所以能流芳百世,是因为它表达出作者对亲人的真挚思念和祝愿,含蓄而深沉。在教学中,我紧扣“情”字,使学生身临其境,真正领悟到“万水千山总是情”。  教学片段一:介绍苏轼。  师:幻灯片出示名言:“___________
摘 要: 早在几千年前,儒家创始人、儒学的始祖孔子就提出了六经,包括诗、书、礼、义、乐、春秋,强调礼乐对人的规范教化作用,由此可见音乐的重要性。随着时代的推移,社会的进步,音乐不仅对人有净化的作用,对人的思想品行有塑造作用,还作为一种身心放松方式,更作为一门艺术,承担起文化传承、文化交流的职责。京剧艺术是我国传统音乐艺术中最重要的形式之一,其博大精深,内涵丰富,是我国最宝贵的文化财富。然而近年来,
摘 要: 面对日益增长的就业人数,大学生的就业问题成为公众关注的热点。如何提高学生的就业竞争力和综合素质成为社会关注的焦点。创新思维是一个民族进步的灵魂,是一个国家发展的基石,而大学生是一个国家的希望,民族复兴的希望。提高大学生的创新思维能力,在日益激烈的就业及创业中具有竞争力,是今后高校应着重研究的课题。  关键词: 《职业生涯规划与就业指导》 大学生 创新思维  笔者负责重庆三峡职业学院动物科
摘 要: 以计算机技术和网络技术为代表的现代信息技术被广泛运用到课堂实践中,以其内容的丰富性、交流的开放性、及时性及互动功能深受老师和学生的欢迎,尤其在舞蹈社团教学与实践中更得到广泛的运用。  关键词: 现代信息技术 中职生 舞蹈社团  一、运用现代信息技术开展舞蹈社团活动势在必行  学生社团是由兴趣爱好自愿组成的,按照章程自主开展活动的学生组织。中青联发[2005]5号文件《关于加强和改进大学生