国家社会科学基金(06BTQ030)
- 作品数:5 被引量:28H指数:3
- 相关作者:王惠临高影繁吴丹林芳王军辉更多>>
- 相关机构:中国科学技术信息研究所北京大学中国医学科学院北京协和医学院更多>>
- 发文基金:国家社会科学基金国家科技支撑计划中国博士后科学基金更多>>
- 相关领域:文化科学医药卫生自动化与计算机技术更多>>
- 临床疾病领域本体构建方法研究——以手足口病本体为例被引量:4
- 2009年
- 在对现有领域本体构建方法进行了综合分析的基础上,介绍了澳大利亚Hadzic等人提出的四维通用疾病本体模型,并针对该模型的不足对其进行了改进,提出包含疾病类型、表型、病因、治疗手段、并发症和检测手段六个维度的改进模型,并根据改进后的模型尝试构建了手足口病本体。
- 方安王惠临王军辉林芳
- 关键词:本体领域本体本体构建方法手足口病
- 一种面向复杂多值属性的本体存储方法研究被引量:1
- 2010年
- 随着本体种类和资源的增加,本体的结构越来越复杂,如何合理地存储各种结构类型的本体、支持高效的本体查询是一项很有意义且具有挑战性的课题。本文提出一种面向复杂多值属性的本体存储方法,采用与传统的本体分解存储模式不同的数据库模式分解方法,将单属性值资源与多属性值资源的存储分别处理来解决资源与属性值之间的复杂关系问题,并通过对资源和其属性值的统一存储来解决存储冗余问题。实验结果验证了该本体存储方法在获取复杂本体关系方面的优势,但同时也暴露出模式结构的易理解性与模式的查询效率之间的矛盾,在此基础上提出了修正存储模式的折中方案,实验表明查询资源的速度比原来方案基本快了一个数量级,但这是以冗余的多个表结构为代价的。
- 高影繁刘娟王惠临
- 关键词:本体数据存储数据库
- 本体在跨语言信息检索中的应用机制研究被引量:20
- 2006年
- 解释多语本体的含义,指出其在不同语言中所对应的领域知识,分析多语本体在查询扩展、语义标注、基于概念索引3方面对改善跨语言信息检索的作用,并通过介绍EuroWorldNet和Cindor系统的多语本体概念的对应方法,探讨本体应用于跨语言信息检索最关键的多语本体库的映射方法,认为采用中间语言作为概念表示、并通过词典翻译对照与不同语种的词汇建立链接关系是多语本体映射的一种良好方法。
- 吴丹王惠临
- 关键词:本体信息检索跨语言信息检索
- 一种基于泊松估计的可控特征选择算法
- 2010年
- 特征选择是文本分类的关键技术之一。本文提出一种基于泊松估计的可控特征选择算法,该算法以基于泊松假设估算的文档频率作为衡量特征语义信息的依据,以通信领域中的信息率失真理论作为可控特征选择的思想来源。在Reuters-21578新闻语料上进行的实验结果表明,基于泊松估计的特征选择算法性能优于基于语义的WN算法和同样基于统计的IG、Chi2等算法;在以特征漏选率作为信息率失真函数的前提下,设定分类算法分类指标下限值,则可以通过改变特征漏选率得到任意的分类精度值。实验表明本文算法在与相关算法的对比中存在优势。算法思想来源于通信领域中的信息率失真理论,也是一种在领域融合方面的崭新尝试。
- 高影繁王惠临
- 关键词:语义特征率失真理论
- 跨语言信息检索查询翻译词典自动构建研究被引量:4
- 2010年
- 双语机读词典是基于查询翻译的跨语言信息检索中的常用资源,但是传统的手工构建词典的方法费时费力,本文利用统计方法从英汉句对齐平行语料库中自动获取翻译词典,以用于查询翻译过程中。
- 徐红姣王惠临章成志
- 关键词:跨语言信息检索翻译词典