曾平飞 作品数:41 被引量:111 H指数:7 供职机构: 浙江师范大学教师教育学院 更多>> 发文基金: 教育部人文社会科学研究基金 浙江省自然科学基金 浙江省教育厅科研计划 更多>> 相关领域: 哲学宗教 文化科学 自动化与计算机技术 理学 更多>>
真有探究发生吗——也谈试题探究点的定位 被引量:3 2011年 中考中出现了一类新试题:探究题。学生做这类试题的过程中,真有探究发生吗?这个问题不好回答,可是几位研究生与导师,还是进行了探讨。 赵光平 曾平飞 罗星凯关键词:试题 探究题 中考 导师 数学问题提出能力的类别特征:基于潜剖面的分析 2022年 在已有测评框架的基础上,建构了测评指标的评分标准,通过应用多元概化理论验证了评分标准的可信度,进一步将其应用于小学生数学问题提出能力的实践调查中,通过潜剖面分析考察了小学生数学问题提出能力的现状及类别特征.研究结果表明:1)小学生在数学问题提出能力测评指标的3个子维度上的协方差分量较大,这说明用问题3个特征的得分来确定学生的数学问题提出能力的水平结果比较一致;2)测评工具全域总分的合成概化系数为0.9904,相对误差比较小,这说明评分者一致性程度较高,评分标准设置合理;3)潜剖面分析的拟合指数与分类验证结果表明,小学生数学问题提出能力可划分为差异明显的3类;4)问题提出能力不同类型的小学生在数学成绩上的差异明显. 洪清玉 康春花 曾平飞关键词:测评工具 一种混合计分的非参数认知诊断方法:曼哈顿距离判别法 被引量:11 2019年 研究提出了一种简洁的适于混合计分的非参数认知诊断方法—曼哈顿距离判别法(MDD),将HDD纳入MDD框架,通过模拟和实证研究考察了MDD的适宜性,结果表明:(1)MDD简单易解,适于混合计分情境,0-1计分时,HDD是MDD的一个特例;(2)MDD的判准率较高,三种判别方法 R_MDD、B_MDD和W_MDD差异极小;(3)MDD具有非参数方法不受知识状态影响、对样本容量无依赖,与属性个数关系不大等特点;(4)MDD在实践中的应用效果较好,为CDA走向实践、走向课堂提供了可能。 康春花 杨亚坤 曾平飞关键词:非参数方法 课堂评估 应大胆质疑,但需小心求证——由一道中考试题引发的问题和思考 2005年 在教学和考试中使用联系实际的素材,其价值已越来越被广大教师认同.然而,在把联系实际的理念转化为实践的过程中,会引发不少值得深思的问题.2004年武汉市使用的一道联系实际的中考物理试题给了我们一个很好的例证. 曾平飞 刘小兵 罗星凯关键词:物理试题 中考 素材 考试 乡村振兴背景下农村学校规模与学生学业表现关系的实证研究 2023年 基于浙江省某县某农村学区参加2022年中考的学生数据以及学校规模等信息,以七年级上期末考试成绩为学习起点,中考成绩为后测成绩,采用成长百分等级模型计算每位学生在在各门学科和总分的增值。运用相关性、方差分析、线性回归等方法,分析了中考成绩分别与学科起点和学科增值的关系。在此基础上,进一步比较了不同规模学校的中考成绩和学科增值的差异,以及不同规模学校对不同学生群体发展的影响。研究发现,学科起点与学科增值几乎可以完全预测中考成绩;虽然中大规模学校中考成绩优于小规模学校,但小规模学校对成绩增值的贡献均高于中大规模学校。可见,应从增值的角度肯定农村小规模学校的办学业绩,发现和认可小规模农村学校在乡村振兴中的价值与贡献。 曾善鹏 曾善鹏 苏胜 曾平飞关键词:农村义务教育 学科成绩 认知诊断十年:基于CiteSpace的知识图谱分析 被引量:1 2020年 借助CiteSpace可视化软件,对Web of Science数据库中认知诊断研究近十年的成果进行知识图谱分析。结果发现:(1)认知诊断研究覆盖国家较少,美国为核心国家,中国不断逼近核心地位;(2)跨国际机构合作较为薄弱,有待加强;(3)认知诊断知识基础包括认知诊断模型、Q矩阵校准和模型-数据拟合等方面,CDCAT研究在2013年后迅速增加;(4)研究理论较多,应用研究缺乏,应不断提升认知诊断在教学、考试中的价值,助力智慧教育的实现。 刘芯伶 康春花 曾平飞关键词:CITESPACE 教学考试 智慧教育 层级一致性指标的多级评分拓展 被引量:3 2018年 在认知诊断评估实践中,属性层级合理性的验证非常重要,而现有指标仅停留在0-1计分测验,无法适应考试形式和评分方式多样化的实践需求。研究将0-1计分层级一致性指标(MHCI)拓展至多级计分的层级一致性指标(GHCI),模拟和实证研究结果表明:(1)GHCI具有和MHCI相同的本质含义,考虑了父项目和子项目得分的多种可能性,从而将MHCI纳入GHCI体系;(2)在多级或混合计分情境,MHCI会有信息损失,容易发生低估,且易受转换比例的影响;(3)GHCI在模拟和实践情境均具较好的适宜性,拟合截断值的设置可依属性层级而定。 康春花 吴会云 孙小坚 曾平飞中日高中物理教材难度及其要素分析 被引量:1 2022年 利用教材难度模型,对中日两套有代表性的高中物理教材进行分析比较,结果发现中国人教版教材整体难度小于日本东书版教材,可比深度是造成两套教材难度不同的主要因素,力学、热学和电学是两套教材难度差异的主体部分,人教版教材的难度设计更具合理性。 李维涛 曾平飞关键词:高中物理教材 教材难度 基于曼哈顿距离构建非参数Q矩阵修正方法 被引量:1 2021年 将被试得分、理想反应距离和被试得分异常原理相结合,并加入属性计分下的被试得分特性,开发了用于多级评分情境下属性计分曼哈顿距离法(SA-MD),在不同条件下验证了SA-MD的稳定性和适宜性.通过模拟研究和实证研究表明:(i)从逻辑推导出SA-MD用于多级评分情境下Q矩阵修正更合理;(ii)在多种条件中,SA-MD均有较优的修正效果,适用范围更广,稳定性更高;(iii)当小样本测验进行Q矩阵修正时,使用SA-MD方法可获得更优的效果. 刘娜 刘芯伶 李俊杰 曾平飞 俞向军 康春花4年级数学应用题Q矩阵的适宜性 被引量:1 2016年 在认知诊断评估中,Q矩阵的界定和挑选非常重要,因其关系到诊断测验的质量和诊断评估的准确性.在模拟研究中,Q矩阵可以任意设定,但在实践研究中,Q矩阵的界定和测验Q矩阵的选择确非易事.该研究基于已有理论和模拟研究关于Q矩阵选择的原则,以小学4年级数学应用题为例,阐述如何在实践认知评估中选择适宜的测验Q矩阵,并通过实证和模拟研究验证所选测验Q矩阵的适宜性.研究结果表明:测验Q矩阵在包含R矩阵的前提下,考核模式并非越多越好、测验长度并非越长越好,相比较而言,只包含R矩阵的测验Q矩阵均要好于考核模式太多的Q矩阵. 康春花 杨亚坤 钟晓玲 曾平飞关键词:数学应用题 R矩阵