国家高技术研究发展计划(2001-AA-415-410)
- 作品数:7 被引量:16H指数:2
- 相关作者:李建中张艳秋张兆功商超何震瀛更多>>
- 相关机构:哈尔滨工业大学黑龙江大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于连接代价图的并行数据库关系存储方式选择算法
- 1.引言在基于群机系统并行数据库的研究中,并行数据库物理存储方法是一个重要的研究内容。在查询处理过程中,如果数据分布不合理,系统的并行性就得不到充分的发挥,降低了并行数据库的性能。目前,在数据分布策略方面已开展了大量的研...
- 王伟平李建中高宏
- 关键词:JOIN
- 文献传递
- 混合负载多媒体服务器的数据存储和数据提交
- 1引言最近几年,信息技术以及网络技术的发展中,出现了大量音频、视频等多媒体数据。多媒体数据利用人类的感官提供丰富有效的信息。在远程教育、数字图书馆和娱乐服务系统中,多媒体信息系统得到了广泛的应用。在这些应用中,数据访问请...
- 张艳秋李建中杨艳张兆功
- 关键词:MULTIMEDIA
- 文献传递
- 基于Peer-to-Peer的多媒体数据库K-NN查询处理
- 1.引言Peer-to-Peer(P2P)是一种新兴的分布式技术,当前主要应用于文件共享、网络协同计算、实时信息传递等领域。关于如何将P2P技术和数据库相结合的研究最近才刚刚开始。P2P技术为连接在Internet上的大...
- 张炜李建中高宏潘海为
- 文献传递
- 超平面树:度量空间中相似性搜索的索引结构被引量:4
- 2003年
- 相似性搜索是从数据库中检索出同给定数据对象相似的数据对象 ,已有的基于R tree的相似性搜索 ,当搜索空间的维的个数较小时效率较高 ,但当搜索空间的维的个数较大时则效率很低 针对此问题 ,提出了新的度量空间分割方法和索引结构 pgh tree,利用数据对象与很少几个固定参考对象的距离之差进行数据分割和索引 ,产生一个平衡的索引树 在此基础上 ,提出了新的算法 ,利用查询数据对象与固定参考对象的距离之差过滤掉大部分的不相关数据 ,具有较小的I/O代价和距离计算复杂性 ,平均复杂性为θ(n0 58) ,是目前复杂性最小的相似性搜索算法 另外还讨论了基于 pgh tree的最近相邻点搜索策略 .
- 李建中张兆功
- 关键词:相似性搜索度量空间数据库数据挖掘
- 基于三级存储器的多媒体服务请求调度算法
- 1.概述现在我们处于丰富的信息之中,信息量在膨胀,信息的表现形式极其丰富。大量的信息包含在文本、音频、视频等多种形式的多媒体文件中。网络技术和存储能力使得现在能够存储和发布的信息在10年前是无法想象的,尤其多媒体信息对存...
- 张艳秋李建中
- 文献传递
- 基于本体的Web信息组织
- 1.引言Web的出现极大地改变了个人或机构的生活及运作方式,Web已经成为一个信息的载体和传播的媒介。如何更好地利用Web上的有效信息,是政府、公司、机构乃至个人都十分关心的问题。本文试
- 刘宝良李建中张兆功
- 关键词:ONTOLOGYCONCEPT
- 文献传递
- 并行文本管理原型系统PDoc的功能与总体框架被引量:1
- 2004年
- 为了探讨如何存储和管理大量的文本信息并提供方便的查询,建立了一个支持数字图书馆的并行文本数据管理原型系统,给出了PDoc系统的功能和总体框架.PDoc的功能包括文本数据采集、格式标准化、信息提取、自动分类、数据加载、数据分布、查询等.系统既提供了管理员维护界面,又针对不同用户提供了多个基于internet的查询界面,使系统管理员和普通用户都能方便地通过界面实现各种查询和维护操作.
- 李建中杨艳张艳秋
- 关键词:并行数据处理文本数字图书馆
- 并行文本数据库中基于代价的查询优化模型
- 1引言现在文档的数量呈爆炸性地增长,如何在浩如烟海的文档中迅速找到所需要的文档是当前研究的热点和难点。我们的并行文本数据库系统为了提高查询速度,使用机群并行计算机系统,即将索引分布在各台处理机上,查询时并行地查找各台处理...
- 李彦李建中杨艳
- 关键词:OPTIMIZATIONPARALLEL
- 文献传递
- 基于三级存储器的多媒体服务请求调度策略被引量:1
- 2004年
- 在当前的存储代价和多媒体数据库的高带宽要求下,多层次存储服务器越来越受到欢迎。给出一个局域网环境中基于三级存储器的多媒体数据库框架,包括多媒体服务器、协调控制服务器、快速交换网络和密户群。为了优化系统资源使用,协调控制服务器按照不同策略调度请求。给出一种新的有效的多媒体请求调度策略。
- 李光琪张艳秋李建中
- 关键词:三级存储器请求调度策略
- 海量数据上挖掘关联规则的并行算法被引量:7
- 2004年
- 针对目前关联规则挖掘算法中数据库规模很大时算法执行时间太长的问题.指出了并行计算是解决该问题的一个有效方法.利用新提出的可以忽略仅仅在少于1/4的结点机上的局部频繁项集,给出了一种新的并行随机抽样方法,并利用机群并行计算机的自治能力和I/O高度并行的特点,提高了抽样算法对海量数据的处理能力和效率.理论分析和实验数据显示,该算法的加速比接近于处理机的个数p,通信复杂性为处理机的个数p的对数,具有良好的扩展性和海量处理能力,且精确度较高.
- 张兆功李建中张艳秋
- 关键词:海量数据关联规则数据挖掘数据库