郗亚辉
- 作品数:17 被引量:91H指数:6
- 供职机构:河北大学数学与计算机学院更多>>
- 发文基金:国家自然科学基金保定市科技攻关计划项目河北省教育厅科学技术研究计划更多>>
- 相关领域:自动化与计算机技术电气工程经济管理文化科学更多>>
- 基于领域本体的Deep Web内容获取技术研究被引量:1
- 2011年
- 为了用户方便快速地使用Deep Web中的信息,对在线数据库中的内容进行获取是一种行之有效的方法。本文设计了一种基于领域本体的Deep Web数据库内容获取技术,利用训练数据库训练构建领域本体,通过领域本体中的有效查询项获得查询关键字集,对数据库内容进行查询,最终获得Deep Web内容。通过实验证明,该方法能有效地获取Deep Web中的大部分内容,用户可以通过搜索引擎更快更方便地查询Deep Web中的信息。
- 张明刘宇郗亚辉
- 关键词:领域本体DEEPWEB
- 通用查询模块的设计与实现被引量:2
- 2003年
- 查询系统是管理信息系统的重要组成部分 ,普通的查询方法只是针对某一具体的主题 ,查询结果以报表的形式显示给用户 .本文讨论了一种PowerBuilder程序设计中通用查询模块的设计思路与实现方法 ,该模块可以灵活指定查询条件 ,实现对任意数据的查询 ,这对于提高MIS系统的开发效率具有重要意义 .
- 郗亚辉王苗袁方张明
- 关键词:POWERBUILDER数据窗口MIS查询通用查询模块
- 加权模糊产生式规则的泛化能力研究被引量:5
- 2006年
- 为了提高模糊产生式规则的知识表示能力,人们在模糊产生式规则中引入了局权、全权、置信度等参数。视加权模糊规则中的权重等为可调的知识表示参数,首先研究这些知识表示参数与加权模糊规则的泛化能力之间的关系,然后提出了一种基于极大模糊熵原理的知识表示参数优化方法。在选定数据集上的仿真实验数据表明,提出的方法可以明显提高基于加权模糊产生式规则的专家推理系统的泛化能力。
- 王熙照郗亚辉董春茹安素芳
- 关键词:加权模糊产生式规则泛化能力模糊推理
- 产品评论挖掘可视化实验平台的开发被引量:7
- 2012年
- 针对目前研究人员已经提出多种中文评论挖掘方法,缺乏统一的评论实验数据集的现状,首先从知名网站上随机抽取手机评论,经过垃圾去除、手工标注,最终构造出手机领域的评论挖掘实验数据集.基于实验数据集构造出手机领域的情感词库,并利用模式匹配方法建立了产品特征粒度树,开发出一个可视化平台,研究人员可以直接用其检验挖掘方法的效果,也可以对不同的挖掘方法进行客观比较.
- 李爱清何烁郗亚辉
- 关键词:可视化
- 产品评论特征及观点抽取研究被引量:11
- 2014年
- 随着电子商务的飞速发展,电子商务网站上各种产品的评论数量也在飞速地增长。如何从Web中大量存在的产品评论中挖掘出对消费者和生产厂商都有价值的信息,已经成为一个非常重要的研究领域。产品特征及观点的抽取是产品评论挖掘中的基本工作,其质量的好坏直接决定着后续工作的效果。双向传播算法能有效地抽取产品评论中的特征及观点,但对中文产品评论仍存在一些不足。本文对双向传播算法做了进一步的改进,提高了在中文产品评论中特征及观点抽取的准确率和召回率。首先,增加了两种产品特征和观点的间接句法依存关系模式,并引入了动词产品特征以增加召回率;其次,将产品特征和观点之间的句法依存关系模式作为HUB节点,利用HITS算法对候选产品特征和观点排序,从而提高准确率;最后,提出了模式相关性对最终抽取的产品特征进行优化,进一步提高了产品特征抽取的准确率。实验结果表明,本文的算法在不同产品评论的特征及观点抽取中都取得了较好的效果。
- 郗亚辉
- 关键词:HITS算法
- 用于文本分类的快速KNN算法被引量:8
- 2008年
- KNN(k Nearest Neighbor)算法是一种简单、有效、非参数的文本分类方法.传统的KNN方法有着样本相似度计算量大的明显缺陷,使其在具有大量高维样本的文本分类中缺乏实用性.提出了一种快速查找精确的k个最近邻的TKNN(Tree-k-Nearest-Neighbor)算法,该算法建立一棵用于查找的树,加速k个最近邻的查找.首先以整个样本集合中心为基准,按照距离中心的距离将所有样本进行排序,并等分L组,作为根结点的孩子,每个孩子以同样方式处理,直到每组样本数量在[k,2k]间为止.根据这棵树查找k个最近邻,减小了查找范围,极大地降低了相似度计算量.
- 刘海博郗亚辉王煜
- 关键词:KNN文本分类相似度
- 基于GIS的地下管网可视化管理信息系统研究
- 卢素魁杨文柱刘云山王思乐张明郗亚辉戴晓东司建辉何海斌
- 研究制定了统一规范的“基于保定高新技术开发区”的地下管线的技术信息内容和标准。给出了地下管线的勘测技术方案和施工方案,确定所需采集的数据。对地下管网的空间信息和属性数据进行完整的、科学的规划,设计了合理的数据结构。根据各...
- 关键词:
- 关键词:地下管线地理信息系统
- 产品评论中领域情感词典的构建被引量:23
- 2016年
- 领域情感词典是情感分析最重要的基础。由于产品评论的数量巨大、领域众多,如何自动构建领域情感词典已经成为近年来的一个研究热点。该文提出了一个两阶段的领域情感词典构建算法。第一阶段,利用情感词间的点互信息和上下文约束,使用基于约束的标签传播算法构造基本情感词典;第二阶段,根据情感冲突的频率来识别领域相关情感词,并根据其上下文约束以及修饰的特征完善领域情感词典。实验结果表明,该方法在实际产品评论数据集上取得了较好的效果。
- 郗亚辉
- 关键词:情感分析
- 电子商务环境下产品评论信息挖掘研究
- 郗亚辉陈昊
- 研究主要对电子商务环境下产品评论信息挖掘及相关问题进行了比较深入的研究。重点研究了高效、准确抽取产品特征及其观点的评论挖掘算法,建立一棵合理的产品特征层次树来表示产品特征之间的关系,建立一套领域相关的情感极性词典以便准确...
- 关键词:
- 关键词:电子商务环境
- 电力智能服务系统
- 王熙照袁方陈昊郗亚辉刘晓鹏王思乐常卓高相辉杨晨晓闫建辉卢明珠霍建兵王海波孙金燕
- 该项目组开发的电力智能服务系统是一个以电力企业和电力用户为基础,具备完善地理信息功能的基础应用平台,其服务主要面向电力企业、工矿企业高压电用户。其主要功能包括:基于电子地图的配电网管理、基于动态配置业务流的业扩报装管理、...
- 关键词:
- 关键词:电力GIS