何超
- 作品数:31 被引量:179H指数:10
- 供职机构:武汉大学信息管理学院信息资源研究中心更多>>
- 发文基金:国家自然科学基金教育部人文社会科学重点研究基地度重大研究项目教育部博士研究生学术新人奖更多>>
- 相关领域:文化科学自动化与计算机技术经济管理语言文字更多>>
- 基于领域本体的语义文本挖掘研究被引量:16
- 2011年
- 为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型。该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式。实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性。
- 张玉峰何超
- 关键词:领域本体语义模式
- 基于本体的馆藏数字资源语义聚合与可视化研究被引量:32
- 2013年
- 针对馆藏数字资源深度开发与利用所存在的数字资源孤岛问题和数字资源超载问题,构建了基于本体的馆藏数字资源语义聚合与可视化模型。该模型利用本体提供的语义知识进行深层次的馆藏数字资源语义聚合,解决数字资源孤岛问题和数字资源超载问题;利用本体软件提供的可视化插件将非空间数据转换为视觉形式进行聚合结果展示,揭示馆藏数字资源内部存在的错综复杂关联和深层次内涵,加深馆藏数字资源聚合结果的认知和理解。
- 何超张玉峰
- 关键词:本体馆藏数字资源可视化
- 基于Web日志挖掘的网络动态竞争情报分析研究被引量:10
- 2011年
- 通过挖掘蕴含在Web日志中的隐含模式和知识,Web日志挖掘为企业实现网络竞争情报动态分析提供了一种有效的途径。文章分析Web日志挖掘的原理和过程,并探讨Web日志挖掘在动态竞争情报分析中的应用。
- 张玉峰何超
- 关键词:情报分析WEB日志挖掘竞争情报
- 融合语义相似度的商务情报链接分析算法研究被引量:3
- 2013年
- 针对传统链接分析算法存在的链接丢失问题和语义异构问题,设计基于语义相似度的商务情报链接分析算法。该算法综合应用锚链文本和锚链结构信息解决链接丢失问题,应用领域本体提供语义知识解决语义异构问题。实验结果表明,该算法能够显著提高商务情报分析结果的准确性。
- 何超张玉峰
- 关键词:语义相似度链接分析
- 基于本体的竞争情报语义整合与分析研究被引量:6
- 2011年
- 针对现今的信息资源整合技术无法有效地解决不同数据源之间的语义异构问题和传统的竞争情报分析技术无法获取高质量的深层情报知识,构建了基于本体的竞争情报语义整合与分析模型。该模型利用本体理论与方法对网络异构信息进行有机整合,解决信息孤岛和语义异构问题;并在此基础上实现语义层面的竞争情报自动分析和智能分析,有利于提高情报分析的准确率和效率。
- 张玉峰何超
- 关键词:竞争情报本体
- 馆藏资源聚合结果的层次可视化方法研究被引量:10
- 2013年
- 由于层次信息可视化方法在层次结构认知和理解方面具有不可比拟的优越性,文章将层次信息可视化方法融入馆藏资源聚合结果的可视化展示之中,利用层次信息可视化方法进行海量馆藏资源聚合结果的动态展示,探讨和研究了馆藏资源聚合结果的层次可视化方法和主要算法。实验结果表明,该方法既能够在有限的可视化空间提供海量馆藏资源聚合结果的有效表达,又可以根据聚合簇或核心节点之间的语义关联进行深入挖掘分析,为馆藏资源深度开发与利用提供技术支持。
- 张玉峰何超
- 关键词:层次分析法信息可视化信息聚合信息资源
- 基于潜在语义分析和改进的HS-SVM的文本分类模型研究被引量:3
- 2010年
- 为提高文本分类的准确性与效率,提出一种基于潜在语义分析和改进的超球支持向量机的文本分类模型。该模型利用潜在语义分析进行特征抽取,消除同义词和多义词在文本表示时所造成的偏差,实现文本向量的降维。针对超球重叠区域的文本分类问题,设计一种新的决策方法—基于密集度的决策策略。实验结果表明,该模型在类别数目较小时具有较好的分类效果,改进的算法有效可行。
- 张玉峰何超
- 关键词:文本分类潜在语义分析
- 基于潜在语义分析和HS-SVM的文本分类模型研究被引量:9
- 2010年
- 为了提高文本分类的准确性和效率,提出了一种基于潜在语义分析和超球支持向量机的文本分类模型。针对SVM对大规模文本分类时收敛速度较慢这一缺点,本文将超球支持向量机应用于文本分类,采用基于增量学习的超球支持向量机分类学习算法进行训练和分类。实验结果表明,超球支持向量机是一种解决SVM问题的有效方法,在文本分类应用中具有与SVM相当的精度,但是明显降低了模型复杂度和训练时间。
- 张玉峰何超
- 关键词:文本分类潜在语义分析支持向量机
- 基于数据挖掘的商务情报智能分析方法研究:现状调查与问题分析被引量:1
- 2013年
- 文章选取金融业、制造业、信息咨询服务机构等多行业中若干典型的企事业单位作为研究对象,采用网络调研方法总结其商务情报需求及分析现状,并根据调研结果分析当前商务情报分析方法存在的主要问题,提出融合数据挖掘等高新技术,构建科学合理的智能化分析方法是获取高质量商务情报的有效途径。
- 何超张玉峰
- 关键词:数据挖掘分析方法
- 融合领域本体的中文文本语义特征提取算法研究被引量:6
- 2013年
- 针对传统的中文文本特征提取算法存在的语义丢失和语义缺乏问题,设计了融合领域本体的中文文本语义特征提取算法。该算法利用基于种子—扩展机制的关键词识别与提取算法解决传统算法中利用分词工具进行关键词提取所产生的语义丢失问题;利用基于领域本体的文本概念特征语义映射与聚合算法解决传统算法中利用向量空间模型进行文本表示所产生的高维和语义缺乏问题。实验结果表明,该算法取得了很好的预期效果,能够显著提高文本特征提取的深度和准确性。
- 何超张玉峰
- 关键词:领域本体