程军
- 作品数:7 被引量:129H指数:3
- 供职机构:中国科学院文献情报中心更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 一种新的基于统计的自动文本分类方法被引量:84
- 2002年
- 自动文本分类就是在给定的分类体系下 ,让计算机根据文本的内容确定与它相关联的类别。为了提高分类性能 ,本文提出了中文文本多层次特征提取方法和基于核的距离加权KNN算法。多层次特征提取方法在汉字、常用词表和专业词表三个层次上提取文档的统计特征 ,能够更好地反映文档的统计分布。基于核的距离加权KNN算法解决了样本的多峰分布、边界重叠问题和分类器的精确分类决策问题。实际应用中 ,互联网和文本库提供了大量经过粗分类的训练文本 ,但普遍存在样本质量较差的问题 ,本文通过样本重要性分析技术解决此问题。实验系统证明了新方法的有效性。
- 刘斌黄铁军程军高文
- 关键词:自动文本分类汉字识别
- 知识管理中对隐性知识发掘的探讨被引量:37
- 2002年
- 探讨了知识管理中隐性知识这一重要概念的本质 ,讨论了隐性知识所包含的具体内容以及知识创新过程和相关的知识学习过程 ,提出了有助于隐性知识发掘的激励机制的模型。
- 吕青程军叶小梁
- 关键词:知识管理隐性知识显性知识激励机制
- 中国科学院文献信息管理系统2000年问题解决过程回顾
- 2000年
- 本文从中国科学院文献情报中心(以下简称中心)计算机2000年问题(Y2K问题)的处理过程回顾中,全面展示了解决这一问题的对策和效果。
- 程军沈英
- 关键词:Y2K文献信息管理系统文献情报中心计算机
- 智能信息处理系统的内核实现被引量:3
- 2002年
- 介绍当代智能文本处理的主要技术核心,以向量空间模型为基础的检索算法,并利用中文字符集的特点,设计并实现了以单字为匹配向量的算法,在全部使用散列函数的基础上,获得了非常快的文本处理速度。
- 程军
- 关键词:智能信息处理系统文本匹配向量空间模型信息过滤索引文件
- ASNLIS系统数据库平台转换
- 2000年
- 主要讲述了中国科学院文献情报中心自主开发的 ASNL IS图书馆自动化系统后台数据库的转换过程。介绍了操作系统和数据库的选型 ,以及转换中遇到的问题和解决方法。
- 程军
- 关键词:图书馆自动化系统数据库转换
- 基于统计的文本分类技术研究
- 2004年
- 程军
- 关键词:文本分类技术自动化网络信息检索
- 针对电子图书的元数据标准被引量:5
- 2002年
- 在介绍中外电子图书元数据标准的基础上,分析国内外电子图书元数据研究的现状和取得的进展,并对其中有可能成为我国元数据标准之一的OEB元数据标准进行详细说明,希望能对中文元数据标准的制定和推广应用有所促进。
- 程军
- 关键词:元数据数字图书馆电子图书TEIEAD