窦志成
- 作品数:98 被引量:91H指数:5
- 供职机构:中国人民大学更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金天津市应用基础与前沿技术研究计划更多>>
- 相关领域:自动化与计算机技术文化科学政治法律经济管理更多>>
- 一种基于自注意力网络的搜索结果多样化方法
- 本发明通过人工智能领域的方法,实现了一种基于自注意力网络的搜索结果多样化方法,采用重排序模型,通过将模型设置编码器和解码器构成的编码器‑解码器结构以及排序学习函数,经过训练步骤后,针对输入的查询和子话题进行运算,最终生成...
- 窦志成秦绪博
- 大数据时代的互联网分析引擎被引量:5
- 2015年
- 随着互联网尤其是移动互联网的高速发展,互联网文档的数量、内容的丰富度和复杂度都大大增加,互联网正朝大数据时代迈进,而用户的信息需求也趋于复杂化。除了基本的信息检索需求外,对大量相关文档的深入理解与聚合分析的需求也越来越强烈,而传统的互联网搜索引擎已经无法满足人们对该类信息的需求。针对这一问题,提出"互联网分析引擎"的构想,阐述了其与搜索引擎和OLAP分析系统的区别,介绍了一种互联网分析引擎的架构,并详细讨论了实现该引擎的核心问题。
- 窦志成文继荣
- 关键词:分析引擎
- 大语言模型时代下的信息检索研究发展趋势被引量:2
- 2023年
- 以ChatGPT为代表的大语言模型带来了人工智能技术的新一轮发展浪潮,获得了广泛的社会关注。大语言模型通过大规模无标注数据预训练、指令微调、人类对齐等关键技术途径,学习到了丰富的世界知识,具有较好的文本理解与生成能力,能够有效求解各种复杂任务。这一重要技术进展对于信息检索领域的发展带来了新的机遇。本文从大语言模型对于已有信息检索架构的改进以及现有检索技术如何改进大语言模型两个方面进行阐述,针对相关科学问题的可行技术方法进行了梳理与展望,探讨大语言模型时代下的信息检索发展趋势,旨在推动信息检索领域的科研进步。
- 赵鑫窦志成文继荣
- 关键词:信息检索
- 一种基于生成式对抗网络的搜索结果多样化方法
- 本发明通过人工智能领域的方法,实现了一种基于生成式对抗网络的搜索结果多样化训练方法,在给出查询词后,定义对应的候选文档集合,对逻辑路径依次设置的采样器、生成器和判定器单元,并在判定器和生成器中设置多样化评分函数的手段,通...
- 窦志成刘炯楠
- 文献传递
- 一种法律法条引用信息抽取系统
- 本发明通过人工智能领域的方法,实现了一种法律法条引用信息抽取系统,系统架构分为输入模块、基于DFA与深度文本匹配模型和输出模块,通过输入模块读取外部输入的文本信息,并作为待匹配文本输入所述基于DFA与深度文本匹配模型,基...
- 窦志成苏展
- 文献传递
- 基于记忆网络的个性化搜索方法及系统
- 本发明涉及一种基于记忆网络的个性化搜索方法及系统,该方法的具体过程为:S1、基于记忆网络,根据用户当前需求从查询内存和文档内存中动态寻找相关的历史行为;S2、基于记忆网络,从意图内存中寻找与查询和文档相关的会话信息;S3...
- 窦志成文继荣
- 对话生成方法和装置
- 本发明提供一种对话生成方法和装置,方法包括:对用户输入语句进行检索处理以获得检索结果集和评分集;其中,检索结果集包括第一检索结果,评分集包括第一评分,第一检索结果对应一个第一评分;根据第一检索结果和第一评分确定第一检索结...
- 窦志成朱余韬文继荣
- 文献传递
- 一种社会热点与商品品类的匹配方法
- 本发明涉及一种社会热点与商品品类的匹配方法,其步骤:构建商品品类知识图谱;获取微博热门话题内容;将商品品类知识图谱与热门话题内容进行匹配:对于每一个实时产生的热门话题,获得该话题对应的微博内容,对于其中涉及到的知识图谱中...
- 窦志成左笑晨黄真文继荣
- 文献传递
- 一种针对海量数据中查询词的搜索维度挖掘方法
- 本发明公开了一种针对海量数据中查询词的搜索维度挖掘方法,其该方法包括如下步骤:1)基于文本、HTML标签和重复区域等模式,从抓取到的数据集中的每一个网页中抽取Lists;2)增加抽取机制,以实现对步骤1)中抽取到的Lis...
- 窦志成文继荣李谨秀
- 文献传递
- 一种基于联邦学习增强隐私保护的个性化搜索系统
- 本发明通过人工智能领域的方法,实现了一种基于联邦学习增强隐私保护的个性化搜索系统,系统的硬件架构由客户端和服务器构成,并构建基于联邦学习的个性化搜索框架,其中具体训练的底层模型为个性化排序模型,通过联邦学习的方式共同参与...
- 窦志成姚菁文继荣