肖明忠
- 作品数:10 被引量:126H指数:6
- 供职机构:北京大学计算机科学技术研究所更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金中国下一代互联网示范工程更多>>
- 相关领域:自动化与计算机技术自然科学总论电子电信更多>>
- Bloom Filter及其应用综述被引量:40
- 2004年
- Bloom Filter对数据集合采用一个位串表示并能有效支持集合元素的哈希查找操作。本文对Bloom Filter及其改进型进行了综述性分析研究,探讨了它的实用性。较为详细地阐述了它在P2P网络文件存储系统OceanStore和文本检索系统中的应用情况。最后指出了进一步的研究方向。
- 肖明忠代亚非
- 关键词:BLOOMFILTER数据集合应用程序计算机
- 视频点播代理服务器技术研究
- 视频点播系统媒体流的网络传输问题制约着系统能同时支持的用户数、同时提供服务的节目数以及影响着用户感受的播放质量。近年来,基于覆盖网络的传输技术展现出很好的前景,并开始在大规模流媒体服务中得到应用。通过研究在分布式代理服务...
- 肖明忠
- 关键词:视频点播VOD代理服务器视听传播计算机网络网络服务器
- 活跃型用户对P2P文件共享系统可用性的影响被引量:7
- 2006年
- 对等用户参与P2P(peer-to-peer)文件共享应用的自由性,影响着该类系统的可用性.作为国内教育网上Maze系统的开发者,试图利用收集到的系统日志深入分析Maze用户特性,发现影响资源可用性的关键点,以指导Maze系统的演进.从用户需求的角度重新定义了P2P文件共享系统可用性的概念,并结合Maze系统日志,率先采用聚类技术对P2P文件共享系统的用户进行了量化分类,且深入研究了占用户总数大约0.77%的活跃型用户对Maze系统可用性的影响.发现活跃型用户具有服务器性质,可大幅提升系统的可用性,是改进P2P文件共享系统设计可利用的资源.
- 刘翰宇肖明忠代亚非李晓明
- 关键词:P2P文件共享系统系统可用性聚类
- 拆分型Bloom Filter被引量:35
- 2004年
- BloomFilter对数据集合采用一个位串表示并能有效支持集合元素的哈希查找操作 .在对BloomFilter及其改进型进行综述性分析研究并探讨它们的实用性之后 ,本文提出了使用位矩阵表示数据集合的拆分型BloomFilter并对其作了分析比较研究 ,以允许集合元素不断增加的分布式系统应用模型为例 。
- 肖明忠代亚非李晓明
- 关键词:BLOOMFILTERS哈希查找分布式系统
- 一个实用的针对URL的哈希函数被引量:6
- 2006年
- 在Web信息处理的研究中,不少情况下需要对很大的URL序列进行散列(hashing)操作.本文提出了一个针对URL数据集合的均匀哈希函数,它是ELFhash函数的变型.通过对天网搜索引擎采集的1亿多个URL集合的抽样实验表明它能有效使得URL集在哈希表中均匀散布.并通过与MD5和SHA-1的对比,认为它是实用的.最后,指出了进一步的研究方向.
- 肖明忠闵博楠王佳聪代亚非
- 关键词:URL哈希函数均匀分布MD5SHA-1
- 针对动态集的矩阵型Bloom filter表示与查找被引量:4
- 2008年
- 提出一种针对动态集合的矩阵型Bloom filter表示与查找法(matrix Bloom filter,MBF),它使用一个s×m位矩阵对数据集合进行哈希表示与查找,较同类算法SBF和DBF,能继承Bloom filter算法常数查找开销的基本精髓。
- 肖明忠王佳聪闵博楠
- 关键词:BLOOM过滤器
- 一种P2P环境下基于用户行为的语义检索方案被引量:16
- 2007年
- 受资源类型多样化、搜索复杂度的制约,现有的P2P文件共享系统中的搜索机制是基于文件名的关键字匹配,这种方法不能发现关键字与资源内容之间的深层关系,因此不能实现语义检索.针对这个问题,提出一种新的搜索方案,该方案建立在已有的搜索机制之上,利用用户的搜索行为和下载行为的规律自动发现关键字和资源间的深层关系,在底层的P2P网络上构建一个元数据空间以辅助搜索.该方案具有实现代价小、时间复杂度低、可进化和支持语义搜索的优点.在Maze系统上的实验表明,该方案具有较高的查询命中率和查询准确率.
- 邱志欢肖明忠代亚非
- 关键词:对等网络用户行为语义检索MAZE
- P2P内容存取蓄势待发
- 2009年
- “Peer”在英语里有“对等者”和“伙伴”的意思。由此,按照字面意思,P2P可以理解为对等互联网。也就是网络的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、网络连接能力、打印机等),这些共享资源通过网络提供服务和内容,能被对等节点(Peer)直接访问而无需经过中间实体。在此网络中的参与者既是资源(服务和内容)提供者(Server),又是资源获取者(Client)。
- 肖明忠
- 关键词:P2P存取字面意思共享资源资源获取
- P2P文件共享系统的内容过滤方案被引量:3
- 2008年
- 抑制非法内容共享行为是P2P文件共享系统需要解决的重要问题。Maze系统从活跃对等用户入手,提出基于文件流行度的过滤策略。模拟实验证明该过滤技术能迅速减少不良文件下载的次数和网络带宽资源的消耗,方法简单实用,可以对大规模系统中的内容进行有效控制。
- 肖明忠侯潇潇闵博楠
- 关键词:P2P文件共享系统
- 基于流媒体文件字节有用性的代理服务器缓存替代策略被引量:23
- 2004年
- 将流媒体文件缓存到离用户最近的代理服务器上 ,能够减少广域网络带宽的消耗 ,减轻服务器的负载压力以及降低用户的始播延迟 ,文章关注代理服务器的缓存替代问题 .通过对问题建立模型并分析后得到替代算法模型 ,提出了流媒体文件字节有用性的概念并反映到替代算法的设计之中 ,并提出了BB ,BBLRU K和BBLCB K缓存替代算法 ,在与LRU 2 ,LFU ,LCB 2和LRU等算法的性能模拟实验比较中 ,BBLCB 2算法性能最优 ,但BB算法简单有效 .
- 肖明忠李晓明刘翰宇代亚非张进宇
- 关键词:流媒体文件代理服务器