陈小莉
- 作品数:7 被引量:97H指数:5
- 供职机构:重庆广播电视大学更多>>
- 发文基金:重庆市自然科学基金中国博士后科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于上下文的领域本体概念和关系的提取被引量:14
- 2010年
- 目前本体学习的研究重点在于概念及关系的提取,概念提取领域一致度与领域相关度相结合的方法取得了比较好的效果,而关系提取则主要采用基于关联规则的方法。这种本体概念、关系学习方法由于只考虑词频,提取结果准确性欠缺。针对这种缺陷,在统计的基础上考虑了语义因素,利用词汇上下文计算概念的语义相似度并将其应用到概念与关系提取中。实验结果表明,词汇上下文与传统统计相结合的方法能够有效改进概念和关系提取的准确度。
- 张玉芳杨芬熊忠阳陈小莉
- 关键词:本体学习上下文语义相似度
- 文本分类中词语权重计算方法的改进与应用被引量:34
- 2008年
- 文本的形式化表示一直是信息检索领域关注的基础性问题。向量空间模型(Vector SpaceModel)中的tf.idf文本表示是该领域里得到广泛应用,并且取得较好效果的一种文本表示方法。词语在文本集合中的分布比例量上的差异是决定词语表达文本内容的重要因素之一。但是其IDF的计算,并没有考虑到特征项在类间的分布情况,也没有考虑到在类内分布相对均匀的特征项的权重应该比分布不均匀的要高,应该赋予其较高的权重。用改进的TFIDF选择特征词条、用KNN分类算法和遗传算法训练分类器来验证其有效性,实验表明改进的策略是可行的。
- 熊忠阳黎刚陈小莉陈伟
- 关键词:文本表示向量空间模型TFIDF
- 基于时间的个性化推荐算法在电大在线远程教学平台的应用
- 2010年
- 协同过滤算法是个性化推荐算法中使用最广泛的,但是传统的推荐算法是将用户不同时间的兴趣等同考虑,其推荐结果缺乏时效性。针对这一问题,文中提出一种基于时间的改进的协同过滤算法,使得越接近采集时间的用户兴趣在推荐过程中具有更大的权值,从而提高推荐的准确性。
- 陈小莉
- 关键词:协同过滤个性化推荐
- Web Service在跨系统信息查询中的应用被引量:1
- 2009年
- 本文以远程教育中存在跨系统信息查询为例子,分析了如何在多个独立的应用系统中实现信息共享,提出了基于Web Service的跨系统的信息共享的解决方案,解决了用户多次登陆不同应用系统的不便,弥补了综合数据库数据过时的缺点,具有极大的灵活性,减轻了数据库维护人员的工作。
- 陈小莉刘君
- 关键词:信息查询
- 基于用户行为个性化学习研究被引量:5
- 2009年
- Web日志中包含了大量的用户浏览信息,对Web日志进行分析可以发现用户偏好路径容。本文提出了一种基于Web日志挖掘出用户浏览偏爱的路径,根据路径对应的文档内容提取用户偏爱的主题,并向用户推荐偏爱主题内容,从而为个性化学习服务。
- 陈小莉
- 关键词:WEB日志挖掘
- 基于Web的毕业论文管理系统被引量:6
- 2009年
- 随着高等教育大众化、培养方式和途径多元化,毕业学生越来越多,毕业论文管理工作变得异常繁杂,为了规范毕业论文管理工作、提高毕业论文质量,开发并设计了毕业论文管理系统,实现了毕业论文管理工作的无纸化、网络化和合理化,促进了毕业论文管理工作的高效发展。
- 陈小莉刘君
- 关键词:WEB角色管理
- 基于信息增益的特征词权重调整算法研究被引量:37
- 2007年
- 传统权重公式TFIDF忽略了词语在集合中的分布比例,针对TFIDF的这个缺点,把信息增益公式引入文本集合中并提出IF*IDF*IG,取得了较好的效果。在分析中发现单纯把信息增益引入文本集合并不能完全解决词语分布对词语权重的影响。从文档类别层次上考虑,把信息论中信息增益应用到文本集合的类别层次上,提出了一种改进的权重公式tf*idf*IGc,用改进的权重公式来衡量词语在文本集合的各个类别中分布比例上的差异,进一步弥补传统公式的不足。实验对比了改进的公式tf*idf*IGc和IF*IDF*IG的实验效果,实验证明tf*idf*IGc权重公式在表现词语权重时更有效。
- 张玉芳陈小莉熊忠阳
- 关键词:信息增益信息熵文本分类