您的位置: 专家智库 > >

沈洲

作品数:10 被引量:131H指数:5
供职机构:上海交通大学电子信息与电气工程学院计算机科学与工程系更多>>
发文基金:国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 9篇期刊文章
  • 1篇学位论文

领域

  • 7篇自动化与计算...
  • 3篇文化科学

主题

  • 4篇自动机
  • 4篇自然语言
  • 3篇多模式
  • 3篇多模式匹配
  • 3篇有限状态自动...
  • 3篇语言处理
  • 3篇中文
  • 3篇状态自动机
  • 3篇自动摘要系统
  • 3篇自然语言处理
  • 3篇字符
  • 3篇字符串
  • 2篇多模式匹配算...
  • 2篇新闻
  • 2篇主题
  • 2篇自动文摘
  • 2篇自动文摘系统
  • 2篇字串
  • 2篇文摘
  • 2篇模式匹配算法

机构

  • 10篇上海交通大学

作者

  • 10篇沈洲
  • 9篇王永成
  • 4篇许一震
  • 3篇刘功申
  • 2篇吴芳芳
  • 2篇韩客松
  • 1篇鲍峥嵘
  • 1篇方澈

传媒

  • 3篇情报学报
  • 2篇上海交通大学...
  • 1篇数据采集与处...
  • 1篇计算机工程
  • 1篇高技术通讯
  • 1篇中文信息学报

年份

  • 3篇2002
  • 6篇2001
  • 1篇2000
10 条 记 录,以下是 1-10
排序方式:
一种面向新闻文献的自动摘要系统的研究与实践被引量:4
2000年
主要介绍了一种面向新闻文献的自动摘要系统的研究与实践.阐述了面向新闻文献的自动摘要原理,在建立新闻文献主题提取规则库过程中的几点体会,又简要地介绍了系统的流程,最后给出了对该系统进行大规模黑箱测试的结果.评测结果显示该系统已经基本成熟,可以用于实际应用中.
沈洲王永成许一震吴芳芳
关键词:自然语言处理自动摘要系统
三个层面的中文文本主题自动提取研究被引量:23
2001年
为适应Internet时代和大规模文献处理的需要 ,以中文文本为处理对象 ,研究了从主题词、主题概念和主题句三个不同层面自动抽取文本主题的方法 ,着重讨论了加权体系和一些经验值的获取方法。对新闻类文献做了实验 。
韩客松王永成沈洲吴芳芳
关键词:主题概念主题句加权中文文本主题提取文本处理
一种快速的多模式字符串匹配算法被引量:50
2002年
以基于有限自动机的多模式匹配算法 (DFSA)为基础 ,结合 Boyer- Moore(BM)和 QuickSearch (QS)快速单模式匹配算法的优点 ,提出了一种快速的多模式字符串匹配算法 .在一般情况下 ,该算法不需要匹配目标文本串中的每个字符 ,能充分利用匹配过程中本次匹配不成功的信息和已经匹配成功的信息 ,跳过尽可能多的字符 .实验表明 ,模式串较短时 ,本算法所需时间为 DFSA算法的 1 /2~ 1 /3 ;模式串较长时 ,其所需时间为 DFSA算法的 1 /3~ 1
许一震王永成沈洲
关键词:字符串有限自动机多模式匹配信息处理
自动文摘系统评价方法的研究与实践被引量:24
2001年
自动文摘系统作为一种信息压缩精选工具 ,越来越引起人们广泛的兴趣。但是 ,目前仍未有一种客观公认的评价方法来对已有的系统进行评价 ,从而极大地阻碍了自动文摘领域的研究。本文首先阐述了自动文摘系统评价所面临的问题 ,随后综述了当前国内外自动文摘的评价方法 。
沈洲王永成许一震方澈
关键词:自然语言处理自动文摘系统
一种面向中文的快速字串多模式匹配算法被引量:20
2001年
针对中文字串匹配问题 ,提出一种快速多模式匹配算法 .算法采用新型组合状态自动机 ,将2个状态组合起来匹配一个双字节字符 ,从而解决了双字节字符构建完全 Hash表时带来的存储空间膨胀问题 ;同时考虑到待匹配模式串中的字符在大字符集中呈稀疏分布的特点 ,尝试将单模式QS匹配算法的思想与 DFSA算法进行结合 ,应用于多模式匹配中 .实验结果显示 ,本算法明显优于 DFSA算法 ,平均所花费时间仅为 DFSA算法的 45 .2 % .
沈洲王永成许一震
关键词:字符串有限状态自动机多模式匹配
一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践被引量:3
2001年
介绍了一种基于主题敏感辞分析的新闻文献自动摘要系统的研究与实践。首先阐述了主题敏感辞分析的心理语言学基础 ,然后详细介绍了系统中的主题敏感辞的获取、敏感辞修饰关系分析、敏感辞同现关系分析等步骤 ,最后给出了该系统与原有摘要系统评价测试对比结果。评测结果显示 。
沈洲王永成韩客松
关键词:自然语言处理自动摘要系统心理语言学网络新闻电子信息
基于概念粘合度(CC)的多主题分析被引量:3
2002年
针对多主题分割的需要 ,本文讨论了以知网的义原为基本单位 ,综合知识间的关系和语料统计的优点 。
刘功申王永成鲍峥嵘沈洲
关键词:主题自动摘要系统自然语言理解技术知网
改进的中文字串多模式匹配算法被引量:17
2002年
针对中文字串匹配问题 ,提出了一种改进的多模式匹配算法。该算法采用新型组合状态自动机 ,解决了对大字符集语言构建字符完全Hash表时可能遇到的存储空间膨胀问题。此外 ,算法还充分利用中文大字符集语言的优势 ,将QS算法的思想融入到多模式匹配应用中 ,取得了良好的效果。实验结果显示 ,本算法明显优于DFSA算法 ,在平均情况下所花费时间仅为DFSA算法的 70 33%。
沈洲王永成刘功申
关键词:有限状态自动机多模式匹配QS算法
面向网络新闻领域的自动文摘系统的研究与实践
据报道,美国现有网民人数达1.6亿,而中国的网民人数也已经超过了3000万,统计数据显示网民所关心的网上信息中新闻就占80%以上。另据china info bank统计,现在每天网上仅中文新闻信息就有3万多条,每条信息平...
沈洲
关键词:新闻领域自动文摘
文献传递网络资源链接
一种有效的字符串有序跳跃模式近似匹配算法被引量:3
2001年
字符串的模式匹配问题是计算机科学的基本问题之一 ,而近似模式匹配更是近期的研究热点。本文分析了文本分析领域中出现的一种特殊的近似模式匹配问题 ,即字符串有序跳跃模式近似匹配问题 ,提出了一种基于有限自动机的组件组合分析算法。算法的特点在于将组件匹配过程与组配过程进行分离 ,这样既降低了问题的复杂度 ,又可以实现按策略组配的灵活性。组件匹配过程中利用有限自动机对跳跃模式的组件进行匹配查找 ;组件的组配过程中先对查找到的组件进行组合分析 ,然后再对各种组合进行初步筛选和基于策略的优选。初步筛选工作是依据顺序性、唯一性和最大数三条原则进行 ;而优选工作是根据四个设计的评价参数选择其中最佳组合。实验结果表明 ,该算法的确能解决字符串有序跳跃模式匹配问题 。
沈洲王永成刘功申
关键词:有限状态自动机字符串计算机
共1页<1>
聚类工具0