赵海燕
- 作品数:20 被引量:62H指数:5
- 供职机构:北京教育考试院更多>>
- 发文基金:全国教育考试“十一五”科研规划课题北京市财政局项目山东省社会科学规划研究项目更多>>
- 相关领域:文化科学理学哲学宗教更多>>
- 高等教育自学考试试卷平行性及其评价维度初探被引量:5
- 2010年
- 高等教育自学考试是一种典型的标准参照测验。试卷的平行性可以界定为相同专业下同一课程的不同试卷在形式、内容、功能和分数结果上的一致性和可比性,它对自学考试的科学性和有效性具有非常重要的意义。对自学考试试卷平行性的度量和控制,可以从试卷结构、题目内容、题目功能和结果数据四个方面进行。
- 赵海燕王桥影赵晓茫
- 关键词:高等教育自学考试标准参照测验试卷结构知识树
- 从高考到学考:有关“学考”等级划分的思考被引量:1
- 2018年
- 学业水平考试中选考科目的成绩呈现方式是广受关注的热点问题,其中等级比例的数量以及各等级考生所占比例是问题的焦点。结合高考北京卷理科综合物理学科的历年高考实测数据,按照浙、沪两版的学考等级划分方案,对选考科目的等级划分进行了研究。主要对比分析了两版等级划分方案的特点及各自优劣,以期为北京市学业水平考试的等级划分提供依据,努力实现对学考结果的科学公平的等级划分。
- 杨君赵海燕
- 关键词:学业水平考试高考
- 大规模教育考试作文评分的趋中漂移和不准确性漂移研究被引量:4
- 2020年
- 在主观题评分过程中,评分者效应随时间、场合或任务产生波动,即发生评分者漂移。本研究基于一个高利害性大规模教育考试的作文评分现场收集的操作性数据,借助传统检测方法侦测可能存在的趋中漂移和不准确性漂移,比较不同效应指标的结果。结果表明:在所检测的写作任务上,评分员在整体上并未发生明显的评分者漂移,但有相当比例的个体显示出波动;对于趋中漂移,残期相关和残模相关的效果高度一致;对于不准确性漂移,相关系数类指标对准确性提升的指示并不灵敏;动态效应并非是静态效应的简单加合,评分员是否发生评分者漂移并不取决于其静态效应,准确性较高的评分员发生改变的倾向相对较低。
- 赵海燕辛涛田伟
- 关键词:作文评分
- 难度常模及其在高考命题中的应用——基于2004-2009年北京高考卷实测数据的分析被引量:8
- 2009年
- 难度与区分度有着比较复杂的关系。对2004—2009年高考北京卷实测数据的分析表明,这两个指标虽能在一定程度上反映题目的整体特征,但却掩盖了题目的一些重要的局部特征。而题目的目标群体通过率和率差可以很好的度量题目对群体内部的区分状况。题目的难度、目标群体通过率、率差的变化存在着一定的规律与模式。把题目按难度值排列,依其难度曲线形态判定其局部区分功能,功能相似、难度接近的题目集合在一起就得到学科的难度常模。难度常模即具有特定局部区分功能的一组组题目按难度值排列的有序集合,这种局部区分功能与题目的学科、背景、内容和形式存在着较为稳定的对应关系。难度常模体现了题目的难度、区分功能与内容的一种深层次的分布关系,其建立有助于命题专家了解题目本质,准确把握局部特征和功能,也有助于考试分数的模拟与预测,对选拔性教育考试的命题与评价过程具有非常重要的意义。
- 臧铁军赵海燕
- 关键词:区分度
- CTT框架下基于数据分析的高考试题质量评价标准——对2004-2008年高考北京卷的实证研究被引量:11
- 2009年
- 考试质量的评价是当前教育和考试研究领域的一个重要课题。其中,对试卷和试题的定量评价是考试质量评价的重要基石。本文以高考北京卷的全总体统计分析为基础。从实证的角度出发。提出基于数据的高考试题质量评价标准。主要涉及试题的难度、区分度、选项分析、有效分数区间及分值利用率等方面。分析结果表明,对大规模教育考试试卷与试题的质量评价.要考虑考试类型、学科、题型、分值权重等因素。要根据考试的科目、题型设定不同的难度标准:评价区分度要考虑其分值权重,对选择题可以进一步分析其选项;对多值计分题可以进一步考察其有效分数区间和分值利用率。
- 赵海燕臧铁军
- 关键词:区分度
- 认知诊断模型中项目参数的方差-协方差矩阵估计方法比较:Bootstrap与解析法被引量:1
- 2019年
- 认知诊断模型中,项目参数的方差-协方差矩阵具有很重要的作用。作为一种非参数化的方差-协方差矩阵估计方法,Bootstrap法的一个主要优势在于它不需要解析推导。比较认知诊断模型中基于解析法的经验交叉相乘信息矩阵、观察信息矩阵和三明治协方差矩阵法,与Bootstrap法在估计项目参数标准误时的表现,模拟结果显示,认知诊断模型及Q矩阵正确设定或是模型中错误设定较少时,解析法的表现优于Bootstrap法,只有在样本量N=5000的条件下,Bootstrap法的表现才基本与解析法接近;当模型中错误设定较多时,Bootstrap法也没有表现出明显的稳健性。因此,在认知诊断模型中,推荐使用基于解析法的方差-协方差矩阵估计方法,尤其是三明治协方差矩阵法;当没有现成的基于解析法的方差-协方差矩阵估计方法可用时,Bootstrap法可以作为一种粗略的估计方法使用,尤其是在样本量较小的情况下。
- 李令青辛涛刘彦楼赵海燕
- 关键词:认知诊断模型BOOTSTRAP法解析法信息矩阵
- 高考命题中的分数分布模拟与预测——难度常模的具体应用被引量:1
- 2011年
- 难度常模的构建不仅带来了命题理念的转变和命题过程中控制技术的突破与改进,也大大简化了考试分数分布的模拟与预测过程。借助难度常模模拟和预测考试分数分布有两种方法:逐题比较法和分类合并法,分别适用于题目数较少与题目数较多的试卷。前者通过题目指标预估表和命题蓝图二者的比对,同时在难度常模中比对配对题目的数据预测分数分布;后者先将题目按难度和区分功能类型进行合并,再查询难度常模估取相应题目数据,计算得到各目标群体的得分情况。
- 赵海燕臧铁军
- 双评作文题网上阅卷评卷教师评价标准维度的确定
- 计算机技术的发展使得网上阅卷成为可能,同时也积累了大量手工阅卷时无法获得的宝贵数据。其中,教师的评卷水平对评卷质量起着决定作用,对教师的评卷水平进行评价是实现阅卷过程质量监控和教师甄选的重要基础。本文通过对2007年北京...
- 赵海燕芮南岳俊江
- 文献传递
- 作答时长对考生作答表现的影响——以高考(北京卷)理科综合生物学科为例
- 2013年
- 考试难度是社会各界和命题研究人员关注的焦点问题之一。作答时长对难度的影响,反映为对考生作答表现的影响。本研究在不同作答时长条件下以高考理科综合生物试卷对考生进行测试,研究作答时长对考生作答表现的影响。结果表明,40min的作答时长与目前生物试卷的思维量较为匹配,不同作答时长对考生作答表现有明显影响。
- 孙鹏赵海燕王永泉
- 关键词:高考理科综合
- 双评作文题网上阅卷评卷教师评卷水平评价维度的确定被引量:6
- 2009年
- 本文基于对北京高考某学科网上阅卷数据分析的基础上,提出从六个维度,对评卷教师的评卷水平进行度量。这六个维度是掌握标准宽严、趋中一发散偏好、有效度、主客观相关、考核成绩和速度。并且为对教师做出一个整体评价,对六个维度的如何进行加合提供一定的建议。
- 赵海燕芮南
- 关键词:网上阅卷评价维度