您的位置: 专家智库 > >

王永成

作品数:166 被引量:1,451H指数:24
供职机构:上海交通大学更多>>
发文基金:国家高技术研究发展计划国家自然科学基金国家科技型中小企业技术创新基金更多>>
相关领域:自动化与计算机技术文化科学语言文字经济管理更多>>

文献类型

  • 125篇期刊文章
  • 40篇会议论文
  • 1篇科技成果

领域

  • 105篇自动化与计算...
  • 69篇文化科学
  • 5篇语言文字
  • 4篇经济管理
  • 2篇理学
  • 1篇机械工程
  • 1篇交通运输工程
  • 1篇医药卫生

主题

  • 28篇中文
  • 23篇信息处理
  • 21篇索引
  • 20篇搜索
  • 20篇自然语言
  • 19篇引擎
  • 19篇搜索引擎
  • 14篇中文信息
  • 13篇语言处理
  • 13篇自然语言处理
  • 13篇计算机
  • 12篇信息检索
  • 12篇中文信息处理
  • 10篇文本
  • 9篇自动机
  • 9篇网页
  • 9篇标引
  • 8篇情报
  • 7篇向量
  • 6篇代理

机构

  • 165篇上海交通大学
  • 1篇东南大学
  • 1篇北京工业大学
  • 1篇中国科学院
  • 1篇新加坡国立大...

作者

  • 166篇王永成
  • 17篇韩客松
  • 14篇尹中航
  • 11篇许欢庆
  • 11篇蔡巍
  • 10篇刘功申
  • 9篇张云涛
  • 9篇刘传汉
  • 9篇龚玲
  • 9篇滕伟
  • 9篇沈洲
  • 8篇许一震
  • 8篇宋聚平
  • 6篇刁倩
  • 6篇陈桂林
  • 6篇苏贵洋
  • 6篇马颖华
  • 6篇张惠惠
  • 5篇孙强
  • 5篇刘德荣

传媒

  • 32篇情报学报
  • 18篇上海交通大学...
  • 13篇计算机工程
  • 10篇现代图书情报...
  • 9篇高技术通讯
  • 6篇计算机仿真
  • 6篇中文信息学报
  • 5篇中国索引
  • 4篇计算机应用研...
  • 4篇2000年C...
  • 3篇计算机研究与...
  • 3篇计算机工程与...
  • 3篇第四十届全国...
  • 2篇广西师范大学...
  • 2篇软件学报
  • 2篇计算机科学
  • 2篇第二届中国R...
  • 2篇第二十届全国...
  • 2篇第十四届全国...
  • 2篇网络环境下信...

年份

  • 1篇2013
  • 1篇2011
  • 2篇2008
  • 4篇2007
  • 10篇2006
  • 9篇2005
  • 12篇2004
  • 22篇2003
  • 21篇2002
  • 15篇2001
  • 34篇2000
  • 7篇1999
  • 6篇1998
  • 3篇1997
  • 1篇1996
  • 1篇1995
  • 2篇1994
  • 4篇1993
  • 1篇1992
  • 1篇1991
166 条 记 录,以下是 1-10
排序方式:
自动分类中的过学习问题与支持向量机
由于网上信息的迅速增长,文本分类已经成为网上信息管理中的热点研究课题.现今流行方法的重要基础是传统的统计学,前提是要有足够的样本,当样本数目有限时容易出现过学习的问题,导致分类效果不理想.本文首先从理论上分析了这种出现过...
尹中航王永成蔡巍
关键词:支持向量机
文献传递
三种分类算法的实验比较被引量:6
2004年
对文本自动分类算中的k最近邻算法、向量空间模型算法以及混合分类算法进行了比较分析,在构造分类用知识库的主题抽取方法相同的条件下,使用中国资讯行提供的2000篇网上新闻语料分别对3种分类算法作了实验研究.实验结果表明,针对网上新闻而言,混合分类算法性能指标优于另外2种算法.结合实验语料环境,对3种分类算法的适用范围作了分析.
蔡巍王永成李伟尹中航
关键词:K最近邻算法混合算法
基于主成分分析的文本检索结果集的排序和聚类
本文阐述了基于主成分分析法的降维原理,给出了基于主成分分析的文本检索结果集的排序和聚类算法的八个步骤.
张云涛龚玲王永成
关键词:文本检索主成分分析排序聚类结果集
文献传递
汉语的自动分词
1989年
本文分析了汉语自动分词的困难,概述了已公布的主要分词方法,简单介绍了在1986年开发的一个分词系统.
王永成李健
关键词:汉字自动分词信息处理
一种高效的中文电子词表数据结构被引量:48
2000年
在分析中文字编码体系、中文词一些特点的基础上,文中提出了一种新的中文电子词表数据结构,并讨论了利用首字Hash 加二分查找的数据查找算法以及相关的数据更新、删除和插入算法. 理论分析和试验结果表明。
陈桂林王永成韩客松王刚
关键词:中文信息处理数据结构计算机
Internet网络信息自动摘要的研究被引量:32
1999年
针对Internet网络信息的基本特征,提出了一套新的自动摘要方案:首先根据标识符的不同赋予相应文本字串不同的权值,在文本字串长度大于一定阈值的情况下,对中英文字串采用不同方式调整权值,然后根据权值大小挑选字串,生成文字流畅且具备一定质量的自动摘要。
陈桂林王永成
关键词:互联网网络信息
中国法律信息库的开发
1994年
介绍中国法律信息库的内容及特点,并对其采用的独特技术进行了分析论证。
王永成吴建华
关键词:信息库法律情报检索数据库
搜索引擎中Robot搜索算法的优化被引量:39
2002年
目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种情况就是 ,Web上明明存在某些重要网页 ,却没有被搜索引擎的robot发现。本文针对这种现象 ,重点讨论搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索阶段就能够充分处理与Robot频繁交互的URL列表。根据网页的内容、HTML结构以及其中包含的超链信息计算网页的PageRank ,使URL列表能够根据重要性调整排列顺序。初步的试验结果表明 。
宋聚平王永成滕伟许欢庆
关键词:搜索引擎超链接ROBOTPAGERANK搜索策略搜索算法
一种快速单模式准确匹配算法被引量:12
2001年
引入连续跳跃查找文本的思想 ,提出了一种新的单模式精确匹配算法 ,其最优条件下的时间复杂度为 O[n/(m+1 ) ],新算法的平均时间复杂度分析表明其具有优越的查找性能 .对比实验结果显示 ,新算法的性能优于目前所见的同类算法 ,特别是在模式较短的情况下 ,优势更为明显 ,这一特点非常适合于自然语言文本的检索 .
王永成陈桂林韩客松
关键词:快速搜索算法时间复杂度
炎黄子孙携手共建中华网与信息库
该文从二十一世纪的发展真挚及对炎黄子孙的要求分析出发,指出了加强中华网与信息库的建设是一切炎黄子孙当前的紧急任务,是中华振兴的必需;与此同时,该文还提出了信息库建设优先、抓好信息标引、抓好人机界面建议与基本实现思路,介绍...
王永成尹中航
关键词:中华网信息库
文献传递
共17页<12345678910>
聚类工具0