王斌
- 作品数:44 被引量:33H指数:4
- 供职机构:中国科学院信息工程研究所更多>>
- 发文基金:国家自然科学基金国家科技支撑计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于自编码器的变体词识别方法及系统
- 本发明提供一种基于自编码器的变体词识别方法,其步骤包括:将与变体词有关的语料作为数据集,进行分词和向量化;从数据集中生成批量样本,输入到自编码器的各自编码单元中进行非监督的预训练,得到各自编码单元神经网络的神经元参数;从...
- 沙灜游绩榕梁棋李锐邱泳钦王斌
- 文献传递
- 一种提速的基于IPC编码的查询处理方法
- 本发明涉及一种提速的基于IPC编码的查询处理方法。该方法把IPC编码下的索引文件视为树形的跳表文件,实现快读略过子树的算法;在处理布尔的求交查询时,根据链表的单调性判断是否略过(skip)某些子树,略过(skip)操作可...
- 付玺王斌李鹏王卿李雄徐杰马宏远
- 文献传递
- 基于字词联合的变体词规范化研究被引量:1
- 2017年
- 社交网络中的文本具有随意性和非正规性等特点,一种常见现象是社交网络文本中存在大量变体词.人们往往为了避免审查、表达情感等将原来的词用变体词替代,原来的词成为目标词.本文研究变体词的规范化任务,即找到变体词所对应的初始目标词.本文利用变体词所在文本的时间和语义,结合变体词词性,提出了一种时间和语义结合的方法获取候选目标词,然后提出基于字词联合的词向量方法对候选目标词排序.我们的方法不需要额外的标注数据,实验结果表明,相比于当前最好的方法在准确性上具有一定的提升,针对与目标词存在相同的字的变体词其性能更好.
- 施振辉沙灜梁棋李锐邱泳钦王斌
- 关键词:社交网络
- 一种网络水军的自动识别方法及系统
- 本发明提供一种网络水军的自动识别方法及系统,该方法步骤包括:1)采集社交网络中认证账号的消息信息以及每条消息下的评论信息;2)监测上述每条消息下的每条评论信息是否被删除,若是则读取该评论信息对应账号的历史被删评论数;3)...
- 梁棋沙灜李锐邱泳钦王斌
- 文献传递
- 一种基于多级共现关系词图的可视化文本信息发现方法及系统
- 本发明提供一种基于多级共现关系词图的可视化文本信息发现方法,其步骤包括:抽取文档的文本内容,对文本内容进行切分,得到文本片段;对文本片段进行切分,提取关键词,并标记词类别标签;根据关键词在文本片段中的共现关系构建多级共现...
- 李鹏王斌郭莉梅钰
- 文献传递
- 一种面向用户个人文件的聚类方法及系统
- 本发明提供一种面向用户个人文件的聚类方法,步骤包括:利用用户对相似文件的保存习惯对用户文件进行分组,得到多个文件组;对文件组内的文件进行聚类,得到一个或多个局部簇,每个局部簇内的文件内容相似;将每个局部簇视为一个文件,对...
- 李鹏王斌齐保元周美林郭莉梅钰
- 文献传递
- 一种基于格的口令认证密钥交换方法及系统
- 本发明公开了一种基于格的口令认证密钥交换方法及系统。本发明通过使用错误协调机制AKC,当两个参与方交换完信息seed,y<Sub>C</Sub>和y<Sub>S</Sub>,并根据这些信息分别计算出两个近似的值σ<Sub...
- 杨颖珊顾小卓王斌
- 文献传递
- 一种基于搜索引擎的主题语料构建方法及系统
- 本发明涉及一种基于搜索引擎的主题语料构建方法及系统。该方法包括以下步骤:1)利用搜索引擎获取主题相关的种子网页;2)对种子网页进行扩展以发现列表页;3)对列表页进行判断,得到与主题真正相关的列表页;4)对与主题真正相关的...
- 李鹏王斌周美林齐保元梅钰
- 面向领域的高质量微博用户发现被引量:1
- 2018年
- 在微博系统中,寻找高质量微博用户进行关注是获取高质量信息的前提。该文研究高质量微博用户发现问题,即给定领域词查询,系统根据用户质量返回相关用户排序列表。将该问题分解成两个子问题:一是领域相关用户的检索问题,二是微博用户排序问题。针对用户检索问题,提出了基于用户标签的用户表示方法以及基于维基百科的查询—用户相似度匹配方法,该方法作为ESA(explicit semantic analysis)的一个扩展应用,结果具有良好的可解释性,实验表明基于维基百科的效果要优于基于其他资源的检索效果。针对用户排序问题,提出了基于图的迭代排序方法 UBRank,在计算用户质量时同时考虑用户发布消息的数量和消息的权威度,并且只选择含URL的消息来构建图,实验验证了该方法的高效性和优越性。
- 叶永君李鹏周美林万仪方王斌
- 关键词:用户行为模型
- 一种椭圆曲线公钥文本化传递方法及系统
- 本发明公开了一种椭圆曲线公钥文本化传递方法及系统。本方法为:1)对公钥P进行压缩,得到压缩后的公钥P’;2)选取2<Sup>k</Sup>个汉字组成数组C,根据公钥P’的长度确定编码公钥P所需汉字个数n;3)设置一保留位...
- 王斌陈朝晖李彦初荆继武顾小卓马原
- 文献传递