黑龙江省自然科学基金(F2004-04)
- 作品数:2 被引量:4H指数:2
- 相关作者:郑皓李生徐耀群赵铁军郑德权更多>>
- 相关机构:哈尔滨工业大学中国农业银行中国工商银行更多>>
- 发文基金:黑龙江省自然科学基金国家自然科学基金黑龙江省青年科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于一种混合语言模型的自动文本分类技术研究被引量:2
- 2007年
- 随着Internet以及Intranet中大量可利用信息的爆炸式增长,文本分类成为处理和组织大量文档数据的关键技术之一。该文提出一种本体论和统计方法相结合的混合语言模型,用以解决自动文本分类问题。首先,通过学习不同类别的训练语料,分别获得各自类别的语言本体知识库,构造成为不同类别的分类器。对于实际文档,将基于不同类别的语言本体知识库分别获得对文档的评价值,并以所获得的最高评价值决定该文档的类别归属。与Bayes,k-nearest neighbor,support vector machine等3种典型的文本分类器进行了比较。实验结果表明,该文方法的分类性能均胜于其上述3种方法。
- 郑德权李生赵铁军于浩
- 关键词:文本分类水体混合语言模型上下文多元信息
- 一种暂态混沌神经网络及其应用被引量:2
- 2006年
- 讨论了Hopfield神经网络算法在优化计算中的应用,提出了一种暂态混沌神经网络模型,把混沌动力学与收敛动力学相结合,使网络逐渐由混沌神经网络向Hopfield网络过渡,达到控制混沌的目的,并且提供一个在全局最优解附近的初值,然后用Hopfield网络得到最优解,有效地解决了Hopfield网络的局部极值问题.仿真结果表明算法对于初始值是稳健的,并且具有很强的克服陷入局部极小能力.
- 徐耀群郑皓宋庆泽史心东
- 关键词:暂态混沌神经网络混沌动力学优化算法旅行商问题
- 基于特征句抽取的网页去重研究
- 去除重复网页一直是信息检索领域的一个待解决的问题。本文基于双语文章的内容,提出了一种抽取特征词和特征句,判别跨语言重复网页的方法。并将其运用到了跨语言的重复网页的识别上。实验结果表明:该方法对双语重复网页的识别准确率在8...
- 彭渊赵铁军郑德权于浩
- 关键词:网页去重特征词跨语言
- 文献传递
- 基于内容的词义本体知识自动获取
- 由于自然语言的灵活性和复杂性,给语言知识自动获取带来一定的困难。本文提出基于内容的词义本体知识自动获取方法,该方法首先定义了词义本体知识描述框架,然后从语料库中获取词本身与同现的其它信息在语义、语用、句法等方面的用法,形...
- 郑德权赵铁军李生于浩
- 关键词:知识获取知识库共现
- 文献传递