朱永盛
- 作品数:5 被引量:23H指数:1
- 供职机构:南京大学计算机科学与技术系计算机软件新技术国家重点实验室更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金更多>>
- 相关领域:自动化与计算机技术医药卫生文化科学更多>>
- 论坛消息语义结构的提取与分析
- 随着Web技术的发展,网上论坛在人们的生活中起到了越来越重要的作用,论坛中也逐渐积累内容丰富的文档资料.然而,论坛消息本身的特点使得传统的信息检索和文本分析技术无法收到良好的效果.本文在分析论坛站点内部信息组织模式和链接...
- 李昕朱永盛武港山
- 关键词:语义单元信息抽取
- 文献传递
- 论坛消息语义结构的提取与分析
- 随着Web 技术的发展,网上论坛在人们的生活中起到了越来越重要的作用,论坛中也逐渐积累内容丰富的文档资料。然而,论坛消息本身的特点使得传统的信息检索和文本分析技术无法收到良好的效果。本文在分析论坛站点内部信息组织模式和链...
- 李昕朱永盛武港山
- 关键词:语义单元信息抽取
- 文献传递
- 基于知识的中医药信息检索技术研究
- 人类社会的不断进步,知识的持续增长,随之而来的是Web网络的快速发展,网络上信息资源越来越丰富。网络已经成为人们获取信息的重要途径。人们通常使用各种信息检索系统来寻找需要的信息和知识,而现有的信息检索系统存在文档信息难以...
- 朱永盛
- 关键词:中医药信息检索信息检索系统半结构化信息抽取
- 论坛消息的语义漂移分析被引量:1
- 2006年
- 引入多维文档模型来组织论坛消息的描述性特征和语义性特征,并在多维索引的基础上,提出了加窗分析技术。目的在于分析论坛站点中语义漂移现象,进而发现论坛中的完整语义信息单元。
- 李昕朱永盛武港山
- 基于Web的新闻信息抽取被引量:22
- 2006年
- 随着互联网的普及,信息技术的发展,形成了大量的新闻信息资源。从海量的新闻信息中抽取出有用的资源,是当前迫切需要解决的问题。该文在分析新闻网页结构的基础上,结合了基于DOM的结构抽取和基于文本特征模式抽取两种处理技术的优点,提出了基于Web新闻网页的半自动化抽取技术,自动下载了有用的Web页面,抽取了所需的新闻信息。最后,该文描述了一个面向奥运新闻的信息抽取系统,并给出了该系统的实验结果。
- 朱永盛武港山
- 关键词:信息抽取包装器DOM抽取规则