徐立恒
- 作品数:9 被引量:36H指数:2
- 供职机构:中国科学院自动化研究所更多>>
- 发文基金:国家自然科学基金北京市重点实验室开放基金国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 基于多特征表示的本体概念挂载被引量:2
- 2012年
- 该文研究了一种基于多特征表示的本体概念挂载方法。以中国大百科知识体系作为本体体系结构,抽取网络知识库条目作为本体概念,通过分析条目中文本内容、语义标签和半结构化信息获得本体概念间层级关系。该文将中国大百科知识体系扩展为百万级概念的多领域中文本体,为进一步抽取本体概念的属性、概念之间的非层级关系以及支持问答服务等应用建立了良好的基础。实验证明该方法相对于单一特征方法能够提高11.8%的挂载精度。
- 徐立恒刘洋来斯惟刘康田野王渝丽赵军
- 关键词:本体
- 基于多知识库和整数线性规划ILP的自动问答方法和系统
- 本发明提供一种基于多知识库和整数线性规划ILP的自动问答方法和系统,所述方法包括:创建用于索引多个知识库的实体和/或关系的资源字典;在所述资源字典中查询并由自然语句的多个文本片段映射到的多个实体和/或多个关系构成多个候选...
- 刘康赵军徐立恒张元哲
- 文献传递
- 基于多特征表示的本体概念挂载
- 本文研究了一种基于多特征表示的本体概念挂载方法。以中国大百科知识体系作为本体体系结构,抽取网络知识库条目作为本体概念,通过分析条目中文本内容、语义标签和半结构化信息获得概念问层级关系。本文将中国大百科知识体系扩展为百万级...
- 徐立恒刘洋来斯惟刘康田野王渝丽赵军
- 关键词:本体
- 文献传递
- 一种基于循环卷积网络的文本分类方法
- 本发明公开了一种基于循环卷积网络的文本分类方法,包括以下步骤:步骤1,利用双向循环网络对所有词进行上下文向量的表示;步骤2,将上下文向量及当前词的词向量组合成当前词的表示;步骤3,利用最大池化技术提取最重要的上下文信息得...
- 徐立恒刘康赵军来斯惟
- 基于概率软逻辑PSL的事件识别方法和系统
- 本发明提供一种基于概率软逻辑PSL的事件识别方法和系统,所述方法包括:分别计算候选与事件的条件概率、以及两个不同候选、两个不同事件、事件与主题、候选与主题出现在同一语句和/或文档中的条件概率;在PSL模型中为不同条件概率...
- 刘康赵军徐立恒刘树林
- 文献传递
- 基于表示学习的中文分词算法探索被引量:34
- 2013年
- 分词是中文自然语言处理中的一个关键基础技术。通过基于字的统计机器学习方法学习判断词边界是当前中文分词的主流做法。然而,传统机器学习方法严重依赖人工设计的特征,而验证特征的有效性需要不断的尝试和修改,是一项费时费力的工作。随着基于神经网络的表示学习方法的兴起,使得自动学习特征成为可能。该文探索了一种基于表示学习的中文分词方法。首先从大规模语料中无监督地学习中文字的语义向量,然后将字的语义向量应用于基于神经网络的有监督中文分词。实验表明,表示学习算法是一种有效的中文分词方法,但是我们仍然发现,由于语料规模等的限制,表示学习方法尚不能完全取代传统基于人工设计特征的有监督机器学习方法。
- 来斯惟徐立恒陈玉博刘康赵军
- 关键词:中文分词
- 基于概率软逻辑PSL的事件识别方法和系统
- 本发明提供一种基于概率软逻辑PSL的事件识别方法和系统,所述方法包括:计算至少候选与事件、以及至少在同一文档和/或同一语句中出现候选与主题、事件与主题、两个不同候选或两个不同事件中的至少任意一个的条件概率;在PSL模型中...
- 刘康赵军徐立恒刘树林
- 一种基于循环卷积网络的文本分类方法
- 本发明公开了一种基于循环卷积网络的文本分类方法,包括以下步骤:步骤1,利用双向循环网络对所有词进行上下文向量的表示;步骤2,将上下文向量及当前词的词向量组合成当前词的表示;步骤3,利用最大池化技术提取最重要的上下文信息得...
- 徐立恒刘康赵军来斯惟
- 文献传递
- 基于多知识库和整数线性规划ILP的自动问答方法和系统
- 本发明提供一种基于多知识库和整数线性规划ILP的自动问答方法和系统,所述方法包括:创建用于索引多个知识库的实体和/或关系的资源字典;在所述资源字典中查询并由自然语句的多个文本片段映射到的多个实体和/或多个关系构成多个候选...
- 刘康赵军徐立恒张元哲