李珍
- 作品数:5 被引量:62H指数:4
- 供职机构:北京师范大学心理学院发展心理研究所更多>>
- 发文基金:教育部“新世纪优秀人才支持计划”教育部人文社会科学重点研究基地度重大研究项目国家自然科学基金更多>>
- 相关领域:文化科学哲学宗教更多>>
- 矩阵取样设计中的似真值能力估计方法被引量:2
- 2012年
- 矩阵取样是大规模教育评估中最有效的一种数据收集方式。本研究采用模拟数据考察在均衡的不完全分块(BIB)矩阵取样设计中,似真值(PV)与传统的MLE、WLE和EAP方法对学生能力总体参数估计的精确性和稳健性。结果表明,PV对总体平均数和标准差的估计最为精确和稳健;EAP倾向于低估,MLE和WLE倾向于高估,且精确性和稳健性远远不如PV。同时,总被试量对估计结果的影响很小,而每个题本中的项目数量对估计结果的影响较大。
- 黄慧静辛涛李珍
- 标准参照测验决策一致性指标研究的总结与展望被引量:10
- 2011年
- 决策一致性指考生在两次平行测验中被一致归类的程度,是衡量标准参照测验质量的重要指标。到目前为止,基于经典测量模型和项目反应模型,研究者已经提出了数十种估计决策一致性指标的方法,并对这些方法的优劣进行了比较。由于模型基础和对分数分布的假设不同,各种方法适用于不同的测验情境。未来的研究应当对已有方法进行验证,并探讨决策一致性在教育测量中的应用途径,为教育和心理测量工作者估计测验的决策一致性指标提供凭据。
- 陈平李珍辛涛高慧健
- 关键词:信度
- 认知诊断计算机化自适应测验的题库使用均匀性初探被引量:18
- 2011年
- 项目曝光控制是认知诊断计算机化自适应测验(CD-CAT)中亟需解决的重要问题之一。采用蒙特卡洛模拟方法对CD-CAT中五种常用选题策略(随机化方法、KL信息量方法、香农熵方法、后验加权的KL信息量方法和综合后验加权和距离加权的KL信息量方法)的题库使用情况进行探讨。结果发现:四种非随机化选题策略的题库使用均匀性较差、测验重叠率高,从而导致测验安全性较差;香农熵方法的判准率总是最高。今后可以将传统CAT中的项目曝光控制技术融入到CD-CAT选题策略中。
- 陈平李珍辛涛
- 美国教育标准化改革现状及其启示被引量:19
- 2011年
- 20世纪80年代美国教育界的标准化改革运动对当今美国教育影响极大。此次改革以确定学生学术标准为核心,涉及六个方面的内容。尽管此次运动在"标准"的设定、测验使用等方面仍存在争议,但它在促进教育公平、完善教育标准、推进测验发展等领域对美国教育的影响和作用是巨大的。美国教育的标准化运动为我国教育的改革与发展提供了可资借鉴的经验。
- 辛涛李珍姜宇崇伟峰
- 关键词:美国教育改革教育质量标准教育公平
- 标准设定:步骤、方法与评价指标被引量:16
- 2010年
- 标准设定(standard setting)是划分标准的过程,指在测验分数分布中划分出两类或两类以上的分界分数。通过标准设定,考生可以被分为"通过"和"未通过",或者是被分为更多的有序表现类别。标准设定是标准参照测验的重要组成部分,也可为测验决策者提供关于测验效度的依据,是目前测量领域一个颇受关注的研究问题。本文首先回顾了标准设定的源起和发展历程,然后详细地介绍了标准设定的基本步骤和几种主要的标准设定方法,评估标准设定过程的指标,最后简单论述了在国内各类考试中应用标准设定的必要性。
- 李珍辛涛陈平
- 关键词:评价指标