章志凌
- 作品数:7 被引量:27H指数:2
- 供职机构:上海交通大学电子信息与电气工程学院软件学院更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信文化科学更多>>
- 基于Corpus库的词语相似度计算方法被引量:23
- 2006年
- 构建了一个语义关联库,称为Corpus库,该库使用词语空间和关系空间结构化地存储了词语和其上下文之间的统计信息,并通过阅读大量的预料数据来训练其相关数据。详细介绍了Corpus库的训练方法,并对训练过程中出现的大量关系提出了裁剪方案。在此基础上,通过构建词语的上下文关系向量提出了一种词语相似度算法。实验证明这是一种有效的对词语相似度进行计算的方法。
- 章志凌虞立群陈奕秋罗海飞邵晓敏
- 关键词:CORPUS词语相似度信息检索
- 基于贝叶斯网的智能节目推荐方法被引量:5
- 2007年
- 如何面向海量信息资源为用户提供智能化、个性化的资源推荐,是一个很具应用价值的课题。以数字电视的节目推荐为背景,给出了一种基于贝叶斯网络和用户爱好的节目推荐方法。实验结果表明,对于给定的用户(组)爱好信息,该方法能准确地推荐出符合用户兴趣爱好的数字化节目资源。
- 章志凌吴刚肖君夏雨仁
- 关键词:贝叶斯网资源推荐
- 结合语义相似度的贝叶斯网在模糊信息检索上的研究与应用
- 本文提出了一种结合语义相似度的贝叶斯推理网模型,并且研究了如何将其用于模糊信息检索领域。为了计算语义相似度,本文讨论了如何构建一个描述词语关联的语义关系库,称之为Corpus库,并介绍了使用大规模语料数据对Corpus库...
- 章志凌
- 关键词:语义相似度信息检索
- 文献传递
- 一种改进型CHI的特征抽取方法
- 本文比较研究了在文档分类中特征抽取方法对分类效果的影响。考察分析了词频法,互信息法,CHI统计,信息增益法等特征抽取方法。经分析,上述方法对于词条的权重未作考虑,引进tf—idf作为权重的表征方式。并给出了经过改进型的C...
- 罗海飞虞立群章志凌邵晓敏陈林汪更生陈弈秋何伟杰
- 关键词:文本分类特征抽取
- 文献传递
- 基于贝叶斯网络模型的智能节目选择的设计与实现
- 现在在电视领域,频道的数量在不断的上升。如何为每个人选择合适的节目是一件非常有意义的事。文中设计和实现了一个基于Corpus库的智能电视节目检索系统。它包含四个引擎和三个Corpus库。描述了各部分的设计细节和它们在电视...
- 陈林章志凌罗海飞邵晓敏汪更生陈弈秋何伟杰
- 关键词:贝叶斯网络CORPUS信息检索
- 文献传递
- 嵌入式数据库技术及其在智能电视节目选择系统中的实现
- 随着智能信息家电对数据管理要求的不断提高,嵌入式数据库技术显得日益重要。本文在分析和研究通用嵌入式数据库的基础上,设计实现了一个更为精简、高效并适合于资源有限的嵌入式设备应用的数据库sjtuedb,并给出了较为详细的设计...
- 邵晓敏罗海飞章志凌
- 关键词:嵌入式数据库
- 文献传递
- 基于改进Corpus库的词语相似度计算方法
- 的相似度度量方法广泛的应用在智能信息检索等领域,本文通过构建存储词语共现信息的Corpus实现了一种度量词语相似度的方法.同时,为了控制词语关系的空间,给出了相应的关系空间裁剪方法.实验证明这是一种有效的在有限空间中对词...
- 章志凌虞立群罗海飞邵晓敏
- 关键词:CORPUS词语相似度信息检索