龙卫江
- 作品数:8 被引量:22H指数:3
- 供职机构:华南理工大学理学院更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 基于斜率密度聚类的相似文本标定被引量:1
- 2013年
- 相似文本标定是抄袭检测的一个重要环节,现有标定方法大多采用直接对文本或指纹进行合并的方式,标定精度受干扰信息影响较大。针对这种局限性,分析了匹配指纹对的语义特征,提出基于斜率密度的相似文本聚类方法,将文本匹配合并问题转化成稠密样本点聚类问题,并在PAN公用语料库上对该方法进行了测试,得到的主要指标优于PAN10前3名。目前已将该方法用于华南理工大学特色专业教学平台的作业查抄,取得了较好的效果。
- 邹杜唐文军龙卫江张凌
- 关键词:抄袭检测聚类指纹
- 基于聚类的抄袭检测算法在学习平台中的应用
- 作业抄袭检测是文本抄袭检测的一个重要分支。针对教学过程中普遍存在的作业抄袭现象,本文在详细分析计算机相关课程作业抄袭特征的基础上,提出一种基于聚类的抄袭检测算法,通过Winnowing方法获取作业抽样指纹,避免分词带来的...
- 邹杜艾飞龙卫江张凌
- 关键词:文本定位聚类算法教学过程
- 文献传递
- 基于模糊支持向量机的数据域描述被引量:9
- 2004年
- 受模糊支持向量机的启发,本文系统论述了带有模糊隶属度的数据域描述方法,称为模糊支持向量域描述。适用于数据集中的数据不完全肯定来自于假设总体的情形,不同的数据对数据集的域描述可以有不同的贡献。
- 魏立力龙卫江张文修
- 关键词:模糊支持向量机数据域置信界
- 基于相近原则的半指导直推学习机
- 2004年
- 机器学习研究中的一个重要课题是如何有效结合已标识数据和未标识数据去推断未标识点标识.本文利用相近原则和直推方法求解这个问题.源于直观事实的相近原则是指"在输入空间中相近的对象其输出也相近".为求得满足这个原则的半指导学习问题的解,我们给出了作为一般方法的基于相近原则的半指导问题直推学习机.得到解的解析表达和迭代算法,公式形式简洁,计算实现容易.给出实例验证该方法在解决实际问题中的有效性,并用图例与支撑向量机和半指导支撑向量机的解作了对比.
- 龙卫江张文修
- 关键词:支撑向量机
- 基于相近原则的半指导直推学习机及其增量算法被引量:4
- 2006年
- 半指导问题是近来机器学习研究中的备受关注一个重要内容.本文以满足“在输入空间中相近的对象其输出也相近”这一源于直观事实的原则(相近原则)去解决半指导学习问题,给出在这个原则下的一个一般的直接推理方法—基于相近原则的半指导问题直推学习机,得到了这个问题的解析解及迭代算法,用模式分类实例验证该方法的有效性,并给出适于在线处理的增量学习算法,这些增量算法尤其还适于新增了有指导的信息的场合.
- 龙卫江张文修
- 合成信息系统与予信息系统的属性特征被引量:7
- 2007年
- 数据库的合成和分解在实际应用中是一个很重要的问题,它所对应的数学模型就是信息系统的合成与分解,该文给出了对象合成信息系统、属性合成信息系统、对象子信息系统及属性子信息系统的定义,讨论了合成信息系统、子信息系统与原信息系统等属性特征之间的关系。
- 邵明文龙卫江
- 关键词:信息系统粗糙集
- 基于斜率密度聚类的相似文本标定
- 相似文本标定是抄袭检测的一个重要环节,现有标定方法大多采用直接对文本或指纹进行合并的方式,标定精度受干扰信息影响较大.针对这种局限性,分析了匹配指纹对的语义特征,提出基于斜率密度的相似文本聚类方法,将文本匹配合并问题转化...
- 邹杜唐文军龙卫江张凌
- 关键词:抄袭检测聚类算法
- 文献传递