张龙波
- 作品数:48 被引量:153H指数:6
- 供职机构:山东理工大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金山东省自然科学基金山东省高等学校科技计划项目更多>>
- 相关领域:自动化与计算机技术文化科学经济管理更多>>
- 一种基于网格与加权信息熵的OPTICS改进算法被引量:11
- 2017年
- 针对现有OPTICS算法时间复杂度高且不适用于数据密集型环境的问题,提出一种基于网格与加权信息熵的改进算法。将数据集合划分为一定数量的网格单元,引入加权信息熵,自适应计算每个网格单元的最小密度阈值。对满足最小密度阈值的网格单元定义密集格的概念,利用质心点代替网格数据点集的方法对数据点进行压缩。采用Geolife Trajectories数据集对算法性能进行测试,从理论分析和实验结果两方面证明了改进算法的有效性。
- 安建瑞张龙波王雷金超怀浩王晓丹
- 强序列关系保持二值编码被引量:1
- 2020年
- 针对相对相似性保持哈希进行了研究,提出强序列关系保持二值编码,旨在保证数据点对在汉明空间和欧氏空间内的相对近邻关系具有较高的一致性,从而确保能在汉明空间内得到较优的近邻检索性能。针对相对近邻关系保持性能较弱的问题,提出建立基于四元组的相对相似性保持约束目标,并利用张量序列图构建满足特定序列约束条件的训练数据集,可有效降低训练复杂度。在训练过程中,迭代提升无法准确保持相对近邻关系数据点的权重值,使其在之后的训练过程中能够引起足够的重视,达到最小化残余性能损失的目的。在三个常用海量数据集上的近似近邻检索对比实验表明,强序列关系保持二值编码能够在汉明空间内获得较优的近似近邻检索性能。
- 王振孙福振张龙波刘萍萍
- 关键词:哈希图像检索
- 基于super-peer的连续查询策略被引量:5
- 2006年
- 连续查询是能够执行较长的一段时间、用来监视底层的数据流语义来触发用户定义的行为的查询,它将被动的网络结构转换成主动的网络结构,在大量数据被频繁地远程更新的分布式网络环境中特别有用。目前,连续查询领域已经成为倍受关注的P2P应用环境。现有P2P连续查询系统存在一定缺陷,作者提出一种基于super-peer的连续查询策略进行相似查询聚簇来减少重复操作,并提出相应的负载平衡算法对查询聚簇进行微调,改善连续查询网络的负载平衡。该策略能有效地避免洪泛整个网络,具有很好的可扩展性;它不限制系统动态性,不易产生瓶颈,能在尽量少地影响查询聚簇的情况下,改善连续查询网络的负载平衡。
- 余敏李战怀张龙波
- 关键词:PEER-TO-PEER连续查询处理DHT
- 个性化搜索中的用户特征模型研究被引量:12
- 2011年
- 用户特征的描述方式是实现个性化搜索算法的核心因素。针对传统的基于关键词向量空间模型的用户特征描述过于简单,不能全面描述用户兴趣的缺陷,将folksonomy的结构与本体概念的清晰语义相结合,提出一种多层用户特征描述方式。从用户兴趣主题、用户间关联两个不同角度,从用户生成的标签、标记的文档及主题等不同层次建立用户特征描述模型,并将其应用于个性化搜索过程的方式进行分析。同时对个性化搜索的结果评价方式、资源类型对用户特征及搜索结果的影响进行了讨论。在Delicious和Flickr两种不同类型数据集上的实验表明,所提出用户特征模型能够有效提高个性化搜索结果的性能。
- 袁柳张龙波
- 关键词:用户特征标签个性化搜索
- 基于模式P2P系统复杂查询处理研究被引量:1
- 2007年
- 通过以关系名的同义关键字作为模式信息的索引键以及垂直分区关系元组,设计了用结构化重叠网络索引模式和数据的方法。基于这两级索引,提出了支持多属性复杂查询的算法。定性分析和比较表明,该方法比相关工作更接近P2P数据管理的理想目标。
- 余敏李战怀张龙波
- 基于合并-分裂策略的近似等深直方图增量维护被引量:1
- 2009年
- 直方图在数据库领域有着广泛的应用,是一种常用的概要数据结构生成方法。首先提出了一个基于数据流界标窗口模型的近似等深直方图构建维护算法框架,该算法框架通过桶的合并-分裂实现近似等深直方图的增量维护;然后对三种不同的桶合并-分裂策略进行了比较和讨论;最后对该算法框架和三种不同的桶合并-分裂策略进行了实验分析。
- 张龙波李战怀王勇
- 关键词:数据流概要数据结构直方图
- 标签时态特征分析及其在标签预测中的应用被引量:3
- 2012年
- 标签作为用户生成的对资源的描述,反映了资源的语义和用户的兴趣。由于Web资源的动态性,标签数据相应地表现出较为明显的时态特征,已有相关研究中标签的时态特征却很少受到关注。针对这方面的不足,对标签数据的时态特征以及基于时态特征的标签间语义关联进行分析,并提出发现标签时态特征的时间段划分准则;为了评价标签时态特征的价值,以经典的统计主题模型为基础,提出新的模型用于分析数据时态特征对所生成主题的影响,并将其用于标签预测。在多个数据集上的测试验证了标签数据的时态特性及其对提高标签预测性能的影响。
- 袁柳张龙波
- 关键词:标签语义关联时态
- P2P连续查询策略分析与研究
- 1引言随着计算机技术的发展,在当今的软硬件技术环境下,客户/服务器模型已不能满足需求,其单点故障和热点问题已经变得越来越不可接受。Peerto-Peer模型(又称P2P模型或对等计算模型)是一种新型的体系结构模型,具有许...
- 余敏李战怀张龙波
- 关键词:PEER-TO-PEERSUPER-PEERDHT
- 文献传递
- 带权值数据流滑动窗口随机抽样算法的改进被引量:3
- 2007年
- 通过改进加权抽样算法,结合基本窗口技术,提出了两种面向带权值数据流上连续更新滑动窗口的随机抽样算法:WRSB算法和IWRSB算法。当新的数据元组到达时,根据数据元组的权值计算出该元组的键值,根据元组键值的大小决定其是否进入样本集以及样本集中被替换的数据元组,同时设置一个系统缓冲区来保存最近到达的键值较大的部分数据元组,作为过期数据元组的后备,使算法能够有效地处理过期数据元组问题。理论分析和实验结果表明,两种算法都能有效地处理带权值数据流上连续更新滑动窗口的随机抽样问题,相比较而言,IWRSB算法具有更好的性能。
- 张龙波李战怀余敏蒋芸
- 关键词:数据流概要数据结构
- 不确定数据频繁项集挖掘方法综述被引量:19
- 2011年
- 近几年来,不确定数据广泛出现在传感器网络、Web应用等领域中。不确定数据挖掘已经成为了新的研究热点,主要包括聚类、分类、频繁项集挖掘、孤立点检测等方面,其中频繁项集挖掘是重点研究的问题之一。综述了传统的频繁项集挖掘的两类基本算法,分析了在此基础上提出的适用于不确定数据以及不确定数据流的频繁项集挖掘的方法,并探讨了今后可能的研究方向。
- 汪金苗张龙波邓齐志王凤英王勇
- 关键词:不确定数据频繁项集数据挖掘