余智华
- 作品数:74 被引量:400H指数:13
- 供职机构:中国科学院计算技术研究所更多>>
- 发文基金:国家重点基础研究发展计划国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学电子电信更多>>
- 网络舆情信息源影响力的评估研究被引量:29
- 2011年
- 文章通过对网络舆情、信息源、影响力等概念的深入研究,构建网络舆情信息源影响力评估体系。评估方法试图从根本上抓住网络舆情信息源影响力的本质特点:除了考虑信息源的表现力,还考虑网民对影响力的反馈,以及信息源转载信息这一行为中隐含的对同行信息源影响力的反馈。在量化影响力时,文章借鉴网络链接分析算法PageRank,提出算法SrcRank对信息源重要度进行排名。实例分析结果表明,评估方法能够客观而合理地评价网络舆情信息源的影响力。
- 郭岩刘春阳余智华张瑾戴媛
- 关键词:网络舆情PAGERANK
- 超大规模真实原始数据的浓缩方法
- 白硕王珏赵凯卜东波余智华
- 对数据浓缩的优化本质有了更进一步的认识,并积累了一系列面向结构化和非结构化海量数据的聚类、分类和规则提取等数据浓缩操作的有实用价值的理论、方法和算法,在网络信息服务、数字图书馆等领域得到了初步的应用。直接使用“规则+例外...
- 关键词:
- 关键词:数据浓缩SETS
- 网络信息过滤系统的过载处理方法研究被引量:2
- 2008年
- 针对网络信息过滤系统的过载问题,通过牺牲少量准确率和召回率来提高系统检测能力,并使用采样和规则泛化等近似处理技术保持系统在过载情况下的总体过滤能力。实验结果表明,在准确率或召回率仅降低10%~15%的情况下,能使系统可承受负载提高3倍,性能提升效果显著。
- 余智华
- 关键词:信息过滤采样
- 大规模网络信息监测与服务系统关键技术及应用
- 程学旗王丽宏余智华查礼许洪波张瑾廖华明王元卓郭嘉丰郝晓伟
- 互联网中蕴含着人类有史以来可访问的最大量信息,面向全网规模的信息监测与分析研判,是提升国家软实力、推动社会主义文化大发展大繁荣的关键,更是关系国家政治安全、促进社会和谐发展、占领网络话语权的制高点。同时,基于海量数据管理...
- 关键词:
- 关键词:互联网
- 高速大流量网络环境下Webmail信息获取关键技术研究
- 目前在高速大流量网络环境下,对Webmail的信息获取还存在以下关键问题:(1)Webmail处理策略;(2)Wcbmail数据流识别;(2)Webmail内容提取。作者通过Webmail网页结构和链接特征分析,提出了基...
- 熊刚刘杰余智华方滨兴时金桥
- 关键词:电子邮件信息获取
- 文献传递
- 多样性图排序的研究现状及展望被引量:1
- 2015年
- 排序是信息检索、数据挖掘以及社会网络分析的基础工作之一。在线社交网络和社会媒体的快速发展积累了大量的图数据——由表示实体的节点和表示实体间关系的连边构成。图数据中节点之间连接关系复杂,通常缺少显式的全序结构,使得图排序在图数据分析中显得尤为重要。图排序算法主要包括2大类,面向节点中心度的图排序算法和面向节点集合多样性的图排序算法。与传统的图排序不同,多样性图排序考虑排序和聚类的融合,体现为节点集合对网络整体的覆盖程度。近年来,多样性图排序得到了广泛的关注,取得了一系列研究进展,研究成果成功应用到了搜索结果排序、文档自动摘要、信息推荐系统和影响最大化等诸多场景中。文章评述了多样性图排序的研究现状及主要进展,将现有的多样性图排序方法按照研究思路的不同分为边际效益最大化、竞争随机游走、聚类与排序互增强3类,分别评述了每类方法的优势和不足。最后指出,设计有效的评价指标和标准测试集、克服多样性图排序面临的精度和速度的矛盾等是多样性图排序未来的研究重点。
- 程学旗孙冰杰沈华伟余智华
- 关键词:社交网络
- 大规模网络数据的感知与获取方法和系统
- 本发明涉及一种大规模网络数据的感知与获取方法,包括:感知网络数据的信息来源并将其拆分为信源,对该信源设置采集策略;生成采集任务,注册采集节点,以该注册节点拉取采集器并对其进行配置;根据该采集策略,通过该采集器执行该采集任...
- 程学旗史存会俞晓明郭岩贺广福孟剑周秀花姜世勇肖若晗赵岭张乐焦利颖周映彤周术夏余智华刘悦
- 一种网络事件预警方法及系统
- 本发明提出一种网络事件预警方法及系统,包括:针对现有网络事件预警技术在子指标的计算、指标权重的赋值、预警效果的评价方面缺乏足够客观性,进而影响预警准确率的问题,本发明提出一种网络事件预警方法及系统。在计算子指标方面,本发...
- 郭岩匡广生陈娟郝长盈余智华刘悦程学旗
- 基于内容的个性化信息过滤系统的研究与设计被引量:18
- 2005年
- 以典型的向量空间模型为例,剖析了个性化信息服务中内容过滤面临的主要问题及基本对策,并结合用户的实际需求,设计实现了“天罗”个性化信息过滤系统,实验结果表明,系统达到了很高的准确率、召回率和处理速度。
- 于满泉许洪波赵章界余智华
- 关键词:个性化信息过滤向量空间模型关键词匹配
- WWW站点的分析与分类
- 该文中作者们分别给出了这些处理的算法和流程及相庆的数据结构.针对研究过程中遇到的问题,作者们应用相关领域的研究成果基础上,提出了多个新的算法和判定规则:采用Chient/Server结构的采集系统,并允许机同时采集,实现...
- 余智华
- 关键词:网络信息采集
- 文献传递