教育部人文社会科学研究基金(09YJCXLX012) 作品数:13 被引量:203 H指数:9 相关作者: 丁树良 蔡艳 涂冬波 戴海琦 喻晓锋 更多>> 相关机构: 江西师范大学 清华大学 赣南师范大学 更多>> 发文基金: 教育部人文社会科学研究基金 国家自然科学基金 江西省教育厅科学技术研究项目 更多>> 相关领域: 哲学宗教 文化科学 自动化与计算机技术 理学 更多>>
朴素贝叶斯网分类器在认知诊断中的应用 被引量:3 2012年 朴素贝叶斯网分类器是贝叶斯分类器的一种,文章将其应用到现代教育测量的认知诊断分类中,对0,1计分下的认知诊断进行了实验,并与认知诊断中典型的分类方法进行了比较。实验结果表明,利用贝叶斯网分类器分类效果明显占优。 喻晓锋 丁树良 秦春影一种多策略认知诊断方法:MSCD方法的开发 被引量:14 2012年 当前国内外开发的认知诊断模型基本上只能处理单策略的测验情景,并假设所有被试均采用同一种加工策略/解题策略,从而忽视了加工策略的多样性及差异性。本研究根据de la Torre和Douglas(2008)采用多个Q矩阵来表征多个加工策略的思想,并结合使用丁树良等(2009)修正的Q矩阵理论及孙佳楠,张淑梅、辛涛和包珏(2011)的广义距离判别法,开发了一种新的多策略认知诊断方法——MSCD方法。Monte Carlo模拟研究结果表明:在单策略测验情景下,传统的单策略认知诊断方法与采用MSCD方法的诊断正确率均比较理想,且差异不大;但在多策略测验情景时,传统的单策略认知诊断方法诊断正确率较低,而MSCD方法的诊断正确率却仍较理想;当加工策略增至5种时,MSCD方法仍有较高的边际判准率、模式判准率以及加工策略判准率。研究表明MSCD方法基本合理、可行。这为实现对加工策略的诊断提供了方法学支持,有利于拓展认知诊断在实际中的应用。 涂冬波 蔡艳 戴海琦 丁树良关键词:Q矩阵 英语阅读问题解决的认知诊断 被引量:25 2011年 本研究尝试将认知诊断技术应用于中学生英语阅读问题解决(ERPS),以实现对中学生英语阅读问题解决的认知诊断,探讨中学生英语阅读问题解决的认知发展特点及其所存在的问题,为中学生的相关认知发展和知识获取服务。研究发现:(1)基于"文本表征"和"反应决策"两个加工过程中的七个认知属性是影响中学生ERPS的主要认知成分(R2=0.792);(2)中学生对于"文本表征"加工过程所涉及的属性的掌握情况优于"反应决策"加工过程所涉及的属性,学生所面临的主要困主要难于在"反应决策"加工阶段;(3)对不同属性掌握情况上存在显著的学校类型差异。(4)学生认知掌握状态的类型主要集中在15种(占73%),最多的三种为(1111011)、(1111110)和(1111101)(占34%)。总体来说,学生的属性掌握还是比较好的。相对地,对"推理"、"信息匹配"和"正确选项的加工水平"三个属性掌握较差,应引起重视。 蔡艳 丁树良 涂冬波项目反应理论新进展:基于3PLM和GRM的混合模型 被引量:9 2011年 IRT中的计量模型较多,不同计量模型适合不同特点的数据资料,实际工作者应根据实际情况选择适当的IRT模型来分析数据。我国是个考试、测评大国,测评的题型丰富多样,在实际应用IRT时,一个模型往往很难反应所有数据资料本身的特点,这时可考虑应用多个IRT模型(即"混合模型")来分析,以达到对数据的最佳拟合。本文对混合模型的思想方法及原理、参数估计的实现、以及模型性能进行了研究,发现:(1)本文自主开发的混合模型参数估计程序Mix—Tu具有较高的返真性,且与国际知名IRT分析软件Parscale相当。(2)在"项目异常"情况下,Mix—Tu程序对参数b和c的估计受数据异常程度的影响要大于Parscale程序,而对参数a的估计受数据异常程度的影响要小于Parscale程序,而在参数theta上两个程序相当。(3)在"被试异常"情况下,Mix—Tu程序对所有参数的估计受数据异常程度的影响均要小于Parscale程序,Mix—Tu程序表现的更为稳健。 涂冬波 蔡艳 戴海琦 丁树良关键词:项目反应理论 等级反应模型 混合模型 含题组的测验等值 被引量:5 2010年 题组越来越多地出现在各类考试中,采用标准的IRT模型对有题组的测验等值,可能因忽略题组的局部相依性导致等值结果的失真。为解决此问题,我们采用基于题组的2PTM模型及IRT特征曲线法等值,以等值系数估计值的误差大小作为衡量标准,以Wilcoxon符号秩检验为依据,在几种不同情况下进行了大量的MonteCarlo模拟实验。实验结果表明,考虑了局部相依性的题组模型2PTM绝大部分情况下都比2PLM等值的误差小且有显著性差异。另外,用6种不同等值准则对2PTM等值并评价了不同条件下等值准则之间的优劣。 吴锐 丁树良 甘登文关键词:测验等值 题组 项目反应理论 MONTE CARLO模拟 几种常用非补偿型认知诊断模型的比较与选用:基于属性层级关系的考量 被引量:21 2013年 当前国际上开发了60多种认知诊断计量模型(Fu&Li,2007),各种模型各具特点,实际应用者应根据实际情况选用恰当的模型。本研究以属性层级关系为切入点,采用MonteCarlo模拟的研究方法,比较了属性层级关系正确及有误两种情况下,当前国际上常用的五种认知诊断模型的性能,以充分考察不同认知诊断模型对属性层级关系的依赖程度,及属性层级关系的错误界定对各认知诊断模型诊断正确率的影响,从而为实际运用者在认知诊断模型选用上提供借鉴和参考。 涂冬波 蔡艳 戴海琦关键词:认知诊断模型 一种多级评分的认知诊断模型:P-DINA模型的开发 被引量:55 2010年 当前绝大多数认知诊断计量模型仅适用于0-1评分数据资料,大大限制了认知诊断在实际中的应用,也限制了认知诊断的进一步推广和发展。本文对具有较好发展前景的DINA模型进行拓展,开发出适合多种评分(含0-1二级评分和多级评分)数据资料的P-DINA模型,同时采用MCMC算法实现模型参数的估计,并对该模型性能进行研究。结果表明:(1)本文开发的P-DINA模型无论是在无结构型属性层级关系下还是在结构型属性层级关系下,参数估计的精度均较高,参数估计的稳健性较强,说明开发的P-DINA模型基本合理、可行。(2)P-DINA模型可采用MCMC算法实现参数估计,且参数估计的精度较高。(3)整体来看,无结构型属性层级关系和结构型属性层级关系下,P-DINA模型在项目参数的估计精度上两者基本相当;但在被试属性判准率(MMR和PMR)上无结构型属性层级关系表现的稍差一些。(4)无结构型属性阶层关系下:模型诊断的属性个数越多,参数s估计的精度越差、属性诊断的正确率(MMR和PMR)越低,但参数g的估计精度越好;若想保证属性模式判准率在80%以上,建议诊断的属性个数不宜超过7个。总之,本研究为拓展认知诊断在教育学和心理学中的应用提供了一种新方法、新模型。 涂冬波 蔡艳 戴海琦 丁树良关键词:认知诊断模型 DINA模型 等值设计中锚题比例研究 考试机构需要建立大型题库以实现评估,大型题库的建设通常需要进行等值。然而等值之前的实测,不仅要耗时、耗财,而且可能使项目的安全性受到危害,特别是锚题反复使用危险性更大,所以等值设计中的锚题比例不希望太大。国内目前报道的结... 熊建华 叶新蓉 丁树良 罗芬关键词:测验等值 文献传递 小学儿童数学问题解决认知诊断 被引量:21 2010年 认知诊断研究有助人们更好地了解人类内部心理活动规律及加工机制,实现对个体认知发展实况(含优点与缺限)的诊断评估,以促进个体全面发展。本研究尝试将认知诊断应用于小学儿童数学问题解决中,探讨儿童对于数学问题解决的认知发展特点及所存在的缺限,以促进儿童相关认知发展及知识获取。研究发现:(1)数学关系复杂性成分和语言复杂性成分是影响小学儿童数学问题解决的主要认知成分;(2)小学儿童对于加减数学问题解决所涉及的七个关键认知属性掌握的总体情况尚可。但对属性A4(不一致型比较图式)和A6(识别隐含条件技能)掌握的相对较差,且这两个属性掌握情况存在显著的年级差异和城乡差异。(3)小学儿童所犯的认知错误主要有三类,而这些错误均与认知属性A4和A6有关。(4)问题模型表征策略和直译表征策略是小学儿童两种主要的表征策略,但以问题模型策略为主。不同策略的使用情况上存在显著的年级和城乡差异。 涂冬波 戴海琦 蔡艳 丁树良关键词:数学问题解决 引入曝光因子的计算机化自适应测验选题策略 被引量:35 2011年 在计算机化自适应测验(CAT)的研究中,制定既高效又安全的选题策略是一个追求目标。用极大项目信息量准则(MIC)选题使得测验效率高、能力估计准确,缺点是项目调用很不均匀,影响考试的安全;按a分层法通过控制试题曝光率以提高考试的安全性,但该方法可能会使测验效率略有下降,且该方法在各层内部无法实现对区分度的调整。本文针对上述两种选题策略的优缺点,对0-1评分下的CAT,通过引入曝光因子、分阶段自动调整区分度的影响以及提高选题准确性等手段,对MIC和a-STR进行改进,引入了两类新的选题策略。计算机模拟实验显示,新的选题方法效果比较理想。 程小扬 丁树良 严深海 朱隆尹关键词:计算机化自适应测验