中国人民大学信息学院数据工程与知识工程实验室
- 作品数:390 被引量:4,489H指数:31
- 相关作者:赵素云李鹏王璞巍王占伟杜凌霞更多>>
- 相关机构:北京航空航天大学经济管理学院北京石油化工学院经济管理学院清华大学信息科学技术学院计算机科学与技术系更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金国家社会科学基金更多>>
- 相关领域:自动化与计算机技术文化科学经济管理政治法律更多>>
- 支持What-if分析的OLAP多版本管理机制被引量:1
- 2010年
- 针对What-if分析中的多版本更新管理需求,根据不同的假设更新实现技术,提出支持What-if分析的内存OLAP系统中的多版本更新策略,其中包括常规的递归假设更新和基于差值的多版本假设更新,采用预合并机制的delta记录合并算法来提高级联假设更新模式下的多版本What-if查询性能。实验表明,与常规的递归假设更新相比,该算法无论在减少多版本更新代价方面还是在减少整体What-if查询时间方面均有效。
- 张宇张延松
- 关键词:WHAT-IF分析
- 我国科研文件档案管理模式特点、问题与建议:典型案例研究被引量:2
- 2011年
- 采用典型案例研究方法,从比较高校、科研机构和科研基金管理机构的科研文件管理活动要素和科研项目文件档案管理标准规范要素角度总结了我国科研文件档案管理的现状、模式特点和存在问题,对未来研究提出了建议。
- 关宏玉刘洋安小米
- 关键词:科研档案
- XML关键词检索的查询理解被引量:2
- 2012年
- 与纯文本文档集相比,使用语义标签标注的半结构化的XML文档集,有助于信息检索系统更好地理解待检索文档.同样,结构化查询,比如SQL,XQueFy和Xpath,相对于纯关键词查询更加清晰地表达了用户的查询意图.这二者都能够帮助信息检索系统获得更好的检索精度.但关键词查询因其简单和易用性,仍被广泛使用.提出了XNodeRelation算法,以自动推断关键词查询的结构化信息(条件/目标节点类型).与已有的推断算法相比,综合了XML文档集的模式和统计信息以及查询关键词出现的上下文及其关联关系等推断用户的查询意图.大量的实验验证了该算法的有效性.
- 李求实王秋月王珊
- B3:图间节点相似度分块计算方法
- 2010年
- 传统的基于链接的对象相似度计算方法仅考虑单个图中的节点。Blondel等人将该问题扩展到图间节点,提出Blondel算法,但该算法的时间和空间复杂度过高,不适用于大规模图之间的节点相似度计算。如何高效地计算两个图之间的相似度的方法仍有待研究。提出了B3(blockbased Blondel)算法,先对图进行分块,然后将分块作为一个独立整体,应用原Blondel算法计算块内的节点相似度和块间的相似度,最后再计算任意节点间的全局相似度。该算法是收敛的,并且大大降低了时空复杂度。实验也很好地证明了算法的有效性。
- 邹李杜小勇何军
- 关键词:相似度计算链接分析块结构
- Web2.0在组织知识管理中的应用研究被引量:11
- 2010年
- 文章结合组织知识管理的主要目标和Web2.0基本原则,探讨如何借鉴Web2.0理论提高组织知识管理的效率问题。
- 朝乐门
- 关键词:WEB2.0知识管理
- 咨询公司知识地图系统的研究与开发被引量:5
- 2009年
- 根据某咨询公司的实际业务需求,运用面向对象方法和.NET技术,设计并开发典型的咨询公司知识地图系统。揭示这种知识地图系统的创新点在于通过"专家能力矩阵"和"专家兴趣矩阵"来计算"知识地图矩阵",并结合"能力/兴趣知识地图绘制算法"实现针对每项咨询项目的不同需要,动态生成个性化知识地图的功能。
- 朝乐门
- 关键词:知识地图NET框架
- 时序图上动态子图查询优化算法
- 2014年
- 挖掘时序图中的特定模式,能够有效地发现有价值的信息,并进行预测与决策支持,因此动态子图的查询及索引优化成为时序图研究的一个热点。研究了聚焦在动态子图的快速查询,着重探讨了索引优化,给出了查询模型的定义及基本查询算法。针对查询算法进行索引优化,提出了两种不同的建立索引的方法,波形索引及二叉树索引。为了验证索引的适用条件,设计了相应的实验,并使用随机数据集对实验程序进行测试,从时间消耗和空间占用的角度对两种索引的运行效率进行了验证分析。波形索引的优势在于存储结构简单,适用于边长度较长边数量不多的情况。二叉树索引的查询速度快,适用于边长度较短边数目较多的情况。
- 朱青李红
- 关键词:查询优化算法时序图索引优化
- myBUD中多媒体数据索引CFTree的研究和实现
- 2011年
- 图片、音频、视频、网页等非结构化数据的高速增长使得如何高效管理它们成为一大挑战.提出的多媒体数据索引CFTree*是非结构化数据管理系统平台myBUD中对多媒体数据进行管理的具体研究和实现.CFTree*是基于簇特征树的层次树索引结构,可用于基于内容的近似kNN查询.实验表明,基于CFTree*索引结构的近似kNN查询性能比基于顺序扫描的kNN查询有60%左右的提高.与精确kNN相比,基于CFTree*索引的近似kNN查询结果与查询对象的平均相似度略低于精确kNN结果,但结果的多样性则优于精确kNN结果.
- 张孝孙新云刘科研琚星星王珊
- 关键词:非结构化数据管理聚类算法
- 中美突发公共卫生事件中的数据共享路径研究被引量:8
- 2020年
- [目的/意义]研究突发公共卫生事件下的数据共享路径,对于促进相关主体间的数据共享和协同合作,提高突发公共卫生事件防控能力具有重要意义。[研究设计/方法]通过文本分析对中美两国相关法律政策中涉及的数据共享场景、共享主体、共享内容及其流向、共享特点和共享条件等多方面内容进行了分析。[结论/发现]研究发现中美突发公共卫生事件下数据共享路径现状和异同点,并从建立常设突发公共卫生事件应急指挥机构与应急管理体系、建立垂直管理的突发公共卫生事件监测预警系统与快速响应体系、建立健全数据共享制度、加强国际数据共享与系统合作等四方面提出了完善我国突发公共卫生事件数据共享制度的建议。[创新/价值]为相关主体有序开展数据共享,提升突发公共卫生事件防控能力提供参考。
- 宁岩安小米周雅王丽丽
- 关键词:突发公共卫生事件数据共享
- 实体搜索综述被引量:6
- 2017年
- 与传统的以网页页面集合的方式呈现搜索结果不同,实体搜索的结果是实体或实体集合,其优点是无需用户在纷杂的网页里面进行二次查找,更能提升用户的搜索体验.实体搜索的任务可以分为相关实体搜索和相似实体搜索.对近年来这两类任务的实体搜索技术进行综述.首先给出了实体搜索的形式化定义,并介绍了常用的评测指标;然后,对两种不同形式的实体搜索任务在两类数据源(非结构化数据集和结构化数据集)上的主要研究方法进行了详细的阐述和对比;最后,对未来的研究内容和发展方向进行了探讨和展望.
- 张香玲陈跃国马登豪陈峻杜小勇
- 关键词:知识图谱