吴科
- 作品数:5 被引量:47H指数:2
- 供职机构:山东大学更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- 基于向量空间模型的中文文本分类的研究
- 本文主要是探讨在空间向量机模型下的中文的文本自动分类问题.考虑到中文与拉丁语系的区别,本文把重点也放在了中文文本的文本表示上.中文与拉丁语言不同就在于中文需要分词,因而分词精度的高低直接影响到后面文本表示上.本文提出了基...
- 吴科
- 关键词:文本分类向量空间模型分词
- 文献传递
- 基于文本集密度的特征选择与权重计算方案被引量:22
- 2004年
- 在信息检索的向量空间模型中 ,文本被形式化表示为由词语权重组成的向量。因此如何让这种向量尽量准确的有效的表示出文本内容一直是该模型中的基础性问题。在这篇论文中 ,我们提出了一种基于文本集密度的特征词选择与权重计算方案的方法。它是一种使用词对文本集密度的贡献衡量该词的价值的方法。使用这种方法 ,我们能找出不损失文本有效信息的最小特征词语集 ,并且创造出更为合理权重计算方案。在文中还用了一种新的衡量权重好坏的标准———元打分法 。
- 吴科石冰卢军牛小飞
- 关键词:计算机应用中文信息处理信息检索
- 基于文档信息空间模型的词元权重调整被引量:1
- 2004年
- 在web文档信息检索中,文档分类、文档过滤的质量一直是影响用户查询结果的关键。这篇论文将通过分析一些典型的权重函数的构造,提出一个基于文档信息空间的权重函数来计算调整文档中词元的权重,使文档的分类和过滤效率更高。
- 吴科石冰
- 关键词:信息检索文档分类文档过滤权重函数
- 挖掘关联规则的高效ABM算法被引量:21
- 2004年
- 提出了一种基于矩阵的挖掘关联规则的高效ABM算法,与经典的挖掘算法相比,该算法只需对数据库扫描一遍,并且存放辅助信息所需要的空间也比较少,实验表明该算法的效率较高。
- 牛小飞石冰卢军吴科
- 关键词:关联规则频繁项集
- 中日工业制成品产业内贸易研究
- 传统的贸易理论无法解释二战后发达国家之间进口和出口同一产业内产品的现象,这使得经济学者们开始关注产业内贸易这种新的贸易现象,此后各种产业内贸易理论也应运而生。产业内贸易由于更贴近当今世界各国贸易现状,而成为国际贸易领域最...
- 吴科
- 关键词:工业制成品产业内贸易G-L指数