赵中英
- 作品数:17 被引量:3H指数:1
- 供职机构:中国科学院深圳先进技术研究院更多>>
- 发文基金:教育部人文社会科学研究基金国家自然科学基金广东省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于微博的广告推荐方法及系统
- 本发明适用于数据挖掘领域,提供了一种基于微博的广告推荐方法及系统。所述方法包括:读取微博数据;初始化微博数据,获得微博文本词项集合;删除微博文本词项集合的停用词,获得微博文本原始特征词项集合;将微博文本原始特征词项集合与...
- 章昉刘明君赵中英
- 一种面向社区发现的高鲁棒性标签传播算法被引量:1
- 2018年
- 社区结构是真实网络普遍具有的拓扑特征,已经成为社交网络分析与挖掘领域的重要研究课题之一.研究社区结构对理解网络功能、揭示网络模式、分析网络行为等具有重要的研究意义.标签传播算法是速度较快的社区发现算法之一,但存在明显的缺陷,譬如划分社区不稳定、鲁棒性差等.为解决上述问题,本文提出一种有效改善标签传播的高鲁棒性算法(LPA_D_CC),算法首先根据节点度和聚集系数对网络中所有节点做影响力排序,根据影响力将网络中节点做初始划分,并对划分后的所有节点有条件的赋标签,最后根据标签传播过程对网络进行划分得到社区结构.在四种真实数据集上对算法进行实验与比较分析,结果表明,与原始LPA算法相比,该算法具有更高的准确性和稳定性,同时能够减少传播过程中的迭代次数,能快速收敛得到结果.
- 郑少强赵中英赵中英李超
- 区域影响分析系统及其分析方法
- 一种区域影响分析系统,通过确定分析目标,规划获取的数据对象,根据所述数据对象建立数据源站点列表;然后利用数据获取算法从数据源站点列表中的站点中获取数据对象,再对数据对象进行预处理后将其格式化为标准文件;并根据标准文件中以...
- 赵中英李超冯圣中
- 文献传递
- 基于词项关联的短文本分类研究被引量:2
- 2015年
- 以短文本为主体的微博等社交媒体,因具备文本短、特征稀疏等特性,使得传统文本分类方法不能够高精度地对短文本进行分类。针对这一问题,文章提出了基于词项关联的短文本分类方法。首先对训练集进行强关联规则挖掘,将强关联规则加入到短文本的特征中,提高短文本特征密度,进而提高短文本分类精度。对比实验表明,该方法一定程度上减缓了短文本特征稀疏特点对分类结果的影响,提高了分类准确率、召回率和F1值。
- 章昉颜华驹刘明君赵中英
- 关键词:数据挖掘关联规则
- 一种面向微博的特定倾向的高影响力用户群发现方法
- 本发明涉及社会化媒体数据分析与挖掘技术领域,提供了一种面向微博的特定倾向的高影响力用户群发现方法,该方法包括:S1、对微博网站上的数据进行抓取;S2、对获取的数据进行分析,找出每条微博所对应的不同主题;S3、建立新的微博...
- 刘斯尧赵中英冯圣中
- 文献传递
- 应用于单台多核处理器主机的多线程网络爬虫执行方法
- 本发明提出的应用于单台多核处理器主机的多线程网络爬虫执行方法包括步骤:S10、创建网页爬取线程、网页分析线程以及URL种子线程;S20、将URL种子载入URL种子缓冲队列;S30、从URL种子缓冲队列中取出URL种子块,...
- 冯铮赵中英刘明君何一峰冯圣中
- 一种大规模图结构数据处理方法、装置和系统
- 本发明公开了一种大规模图结构数据处理方法、装置和系统,以提高数据计算效率并增强系统运行的可靠性。所述方法包括:从节点将图结构数据读取至内存;对内存中的图结构数据进行预处理,得到图结构数据中相邻顶点处于同一数据片的至少一个...
- 刘明君赵中英冯铮何一峰冯圣中
- 数据获取、分析以及预警系统及其方法
- 一种数据获取、分析以及预警系统,通过构建爬虫来实时并行地获取数据,通过分析和学习所获取到的数据来建立时间序列模型,根据所述时间序列模型进行时间计算与阈值计算,并设定预警阈值空间与预警级别,且所述预警阈值空间包括地区、数量...
- 赵中英李超冯圣中
- 文献传递
- 动态社区发现及追踪系统及其方法
- 一种动态社区发现及追踪系统,包括:社区构建模块与判断模块,其中,社区构建模块根据t时间的网络数据找出其隐含的所有社区<Image file="DDA00002614815000011.GIF" he="22" imgCo...
- 赵中英成杰峰冯圣中
- 文献传递
- 一种基于微博的广告推荐方法及系统
- 本发明适用于数据挖掘领域,提供了一种基于微博的广告推荐方法及系统。所述方法包括:读取微博数据;初始化微博数据,获得微博文本词项集合;删除微博文本词项集合的停用词,获得微博文本原始特征词项集合;将微博文本原始特征词项集合与...
- 章昉刘明君赵中英
- 文献传递