方全
- 作品数:32 被引量:42H指数:4
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金国家科技攻关计划北京市自然科学基金更多>>
- 相关领域:自动化与计算机技术机械工程航空宇航科学技术理学更多>>
- 问题加注标签方法、装置、电子设备和存储介质
- 本发明提供一种问题加注标签方法、装置、电子设备和存储介质,其中方法包括:获取目标问题和标签集合,标签集合内包含多个候选标签;对目标问题和各候选标签分别进行特征提取,得到目标问题的问题语义特征和各候选标签的标签语义特征;基...
- 徐常胜许诺佳钱胜胜方全胡骏
- 热点话题检测方法及装置
- 本发明涉及计算机技术领域,具体涉及一种热点话题检测方法。本发明的热点话题检测方法包括:基于预设实体知识库提取目标文本的关键句作为目标文本的摘要;使用LSH算法计算摘要的文档指纹;基于KNN算法对文档指纹进行聚类分析以确定...
- 徐常胜方全李泳锡
- 文献传递
- 基于知识图谱的用户建模方法、序列推荐方法
- 本发明属于用户建模与推荐系统领域,具体涉及一种基于知识图谱的用户建模方法、序列推荐方法,旨在为了解决现有用户建模方法无法有效提取用户动态访问信息的特征,准确捕捉用户兴趣;现有序列推荐系统推荐准确率不高,用户体验较差的问题...
- 徐常胜黄晓雯方全钱胜胜桑基韬
- 文献传递
- 基于有监督对比的跨模态检索方法、系统及设备
- 本发明属于跨模态检索领域,具体涉及了一种基于有监督对比的跨模态检索方法、系统及设备,旨在解决现有的监督式跨模态学习方法一般通过线性投影捕获数据相关性,且通常聚集于最大化成对相关性或分类准确性,InfoNCE损失平等对待所...
- 徐常胜钱胜胜方全
- 文献传递
- 命名实体识别方法、装置、电子设备及存储介质
- 本发明提供一种命名实体识别方法、装置、电子设备及存储介质,其中命名实体识别方法包括:获取待识别医学文本及与待识别医学文本关联的医学图像;将医学文本及医学图像输入至命名实体识别模型的编码器,得到多层文本编码特征及多层图像编...
- 徐常胜张凡李泳锡方全
- 文本链接嵌入方法
- 本发明涉及互联网文本分析技术领域,具体涉及一种文本链接嵌入方法,所述方法是根据预设的字符级特征向量进行向量拼接得出待检测文本的目标词条和知识实体库中实体的特征向量,然后计算实体和目标词条的特征向量相似度以找到与目标词条对...
- 徐常胜方全李泳锡
- 文献传递
- 多模态多层次事件网络的谣言检测被引量:3
- 2021年
- 目的自动检测谣言至关重要,目前已有多种谣言检测方法,但存在以下两点局限:1)只考虑文本内容,忽略了可用于判断谣言的辅助多模态信息;2)只关注时间序列模型捕捉谣言事件的时间特征,没有很好地研究事件的局部信息和全局信息。为了克服这些局限性,有效利用多模态帖子信息并联合多种编码策略构建每个新闻事件的表示,本文提出一种新颖的基于多模态多层次事件网络的社交媒体谣言检测方法。方法通过一个多模态的帖子嵌入层,同时利用文本内容和视觉内容;将多模态的帖子嵌入向量送入多层次事件编码网络,联合使用多种编码策略,以由粗到细的方式描述事件特征。结果在Twitter和Pheme数据集上的大量实验表明,本文提出的多模态多层次事件网络模型比现有的SVM-TS(support vector machine—time structure)、CNN(convolutional neural network)、GRU(gated recurrent unit)、CallAtRumors和MKEMN(multimodal knowledge-aware event memory network)等方法在准确率上提升了4%以上。结论本文提出的谣言检测模型,对每个事件的全局、时间和局部信息进行建模,提升了谣言检测的性能。
- 李莎张怀文钱胜胜方全徐常胜
- 关键词:多模态社交媒体
- 基于异质图神经网络预训练的多标签文档分类研究
- 2024年
- 多标签文档分类是一种将文档实例与相关标签相关联的技术,近年来受到越来越多研究者的关注。现有的多标签文档分类方法尝试探索文本之外的信息的融合,如文档元数据或标签结构。然而,这些方法要么简单地利用元数据的语义信息,要么没有考虑标签的长尾分布,因此忽略了文档及其元数据之间的高阶关系和标签的分布规律等信息,从而影响到多标签文档分类的准确性。因此,文中提出一种新的基于异质图神经网络预训练的多标签文档分类方法。该方法通过构造文档与其元数据的异质图,采用两种对比学习预训练方法捕获文档与其元数据之间的关系,并通过平衡标签长尾分布的损失函数来提高多标签文档分类的准确性。在基准数据集上的实验结果表明,所提方法的准确率比Transformer提高了8%,比BertXML提高了4.75%,比MATCH提高了1.3%。
- 吴家伟方全胡骏钱胜胜
- 关键词:元数据
- 基于元路径的上下文感知用户建模方法、序列推荐方法
- 本发明属于用户建模与推荐系统领域,具体涉及一种基于元路径的上下文感知用户建模方法、序列推荐方法,旨在为了解决现有用户建模方法仅考虑用户历史行为的简单序列关系,无法捕获复杂的用户偏好;现有的推荐系统推荐的准确性不高,推荐的...
- 徐常胜黄晓雯方全钱胜胜桑基韬
- 文献传递
- 热点话题检测方法及装置
- 本发明涉及计算机技术领域,具体涉及一种热点话题检测方法。本发明的热点话题检测方法包括:基于预设实体知识库提取目标文本的关键句作为目标文本的摘要;使用LSH算法计算摘要的文档指纹;基于KNN算法对文档指纹进行聚类分析以确定...
- 徐常胜方全李泳锡
- 文献传递