您的位置: 专家智库 > >

陶永才

作品数:74 被引量:256H指数:9
供职机构:郑州大学更多>>
发文基金:河南省教育厅科学技术研究重点项目国家自然科学基金国家高技术研究发展计划更多>>
相关领域:自动化与计算机技术自然科学总论更多>>

文献类型

  • 52篇期刊文章
  • 19篇专利
  • 2篇学位论文
  • 1篇科技成果

领域

  • 62篇自动化与计算...
  • 1篇自然科学总论

主题

  • 13篇调度
  • 12篇网格
  • 10篇MAPRED...
  • 8篇异构
  • 8篇网络
  • 7篇文本分类
  • 6篇云计算
  • 6篇神经网
  • 6篇神经网络
  • 6篇卷积
  • 5篇作业调度
  • 5篇文本
  • 5篇分布式
  • 5篇负载均衡
  • 4篇异构网
  • 4篇网格环境
  • 4篇网格平台
  • 4篇缓存
  • 4篇个性化推荐
  • 4篇工作流

机构

  • 64篇郑州大学
  • 13篇华中科技大学
  • 1篇北京理工大学
  • 1篇教育部
  • 1篇中国科学技术...
  • 1篇郑州师范学院
  • 1篇郑州轻工业学...
  • 1篇国土资源
  • 1篇郑州轻工业大...
  • 1篇郑州财税金融...

作者

  • 74篇陶永才
  • 52篇石磊
  • 46篇卫琳
  • 12篇吴松
  • 10篇曹仰杰
  • 9篇金海
  • 7篇高宇飞
  • 5篇邹德清
  • 5篇张青
  • 5篇羌卫中
  • 4篇王凯
  • 4篇石宣化
  • 4篇曹海军
  • 3篇谢夏
  • 3篇马建红
  • 3篇廖振松
  • 2篇徐飞兵
  • 2篇景京
  • 2篇李运发
  • 2篇赵峰

传媒

  • 38篇小型微型计算...
  • 5篇计算机应用
  • 2篇计算机工程与...
  • 2篇计算机仿真
  • 1篇计算机工程
  • 1篇计算机应用与...
  • 1篇计算机工程与...
  • 1篇福建电脑
  • 1篇郑州大学学报...

年份

  • 2篇2025
  • 4篇2024
  • 3篇2023
  • 4篇2022
  • 5篇2021
  • 5篇2020
  • 4篇2019
  • 7篇2018
  • 2篇2017
  • 3篇2016
  • 6篇2015
  • 4篇2014
  • 3篇2013
  • 4篇2012
  • 5篇2011
  • 4篇2010
  • 2篇2009
  • 2篇2008
  • 2篇2007
  • 1篇2006
74 条 记 录,以下是 1-10
排序方式:
一种改进的MapReduce互信息文本特征选择机制被引量:7
2018年
文本分类是数据挖掘的重要环节,而特征选择又是文本分类的核心步骤,互信息方法是常用的特征选择评价函数,但该方法过于简单,分类精度相对较低.基于此,本文提出一种基于MapReduce的互信息文本特征选择机制,一方面对传统的互信息计算公式进行改进,并且引入熵的思想对公式计算加以修正,使特征词选择更加得当,从而提高后期分类精度;另一方面引入MapReduce技术,利用其处理大规模数据的优势,缩短文本训练和分类的过程.实验表明基于MapReduce的互信息文本特征选择机制可以显著提高文本分类的精度,而且明显提升执行效率.
陶永才赵国桦石磊卫琳
关键词:文本分类特征提取互信息云计算MAPREDUCE
Web页面流行度模拟器的设计与实现被引量:3
2005年
研究Web访问特征是有效进行Web缓存管理的基础。该文使用Zipf第一法则和第二法则建立数学模型,分别模拟Web页面高频区及低频区流行度特征,设计并实现了一个Web日志模拟生成器POPSIM。这种模拟器不仅可以模拟生成Web页面访问日志,而且具有很大的灵活性,为进一步研究Web缓存技术和预取技术提供依据。
陶永才石磊
关键词:WEB缓存
基于语义相似度与信息量的Web服务标签优化被引量:1
2015年
Web服务标签是用户向Web服务添加的描述其功能或属性的关键词,用来提高服务相似度计算的准确率进而改善服务发现、服务组合和服务聚类等.目前不准确甚至错误的无效标签比例较高,影响了服务相似度计算的准确率.为此,提出一个Web服务标签优化模型WS-TOM,分析了Web上已有WSDL文档,给出一种考虑到编程风格和命名规范的特征提取方法,用于Web服务相似度计算;然后综合标签与WSDL的语义相似度和标签的信息量来对标签进行排名,降低不准确标签的影响.实验结果及分析验证了WS-TOM模型能够提高Web服务相似度计算的准确率.
石磊谢涛曹仰杰卫琳陶永才
关键词:WEB服务相似度计算标签语义相似度
一种结合LSTM和集成算法的文本校对模型被引量:11
2020年
伴随着互联网的飞速发展,各行各业产生了大量的电子文本数据,但是这些文本经常存在语义错误,数据质量良莠不齐,如何提高电子文本的质量是亟待解决的难题.本文设计一种基于集成算法和长短时记忆网络的集成模型,提高语义特征检测和校对的准确性.主要工作分为三部分:(1)使用神经网络和HowNet学习词语-义原之间的搭配关系;(2)将抽象化信息输入至长短时记忆网络集成模型,预测语义搭配关系;(3)结合模糊匹配方法,依据聚合度对预测结果投票并排序,将排名靠前的结果作为校对建议输出.实验结果显示,本文提出的校对模型和算法与其他文献相比在检错准确率和校对准确率上分别提高了1.8%和2.3%.
陶永才吴文乐海朝阳石磊卫琳
关键词:文本校对
自注意力机制和BiGRU相结合的文本分类研究被引量:3
2022年
在文本分类任务中,双向门控循环单元(Bidirectional Gated Recurrent Unit,BiGRU)被广泛使用,其不仅能提取文本上下文语义信息和长距离依赖关系,还可以避免出现传统RNN中存在的梯度弥散或爆炸问题.然而,BiGRU在捕获文本局部特征方面存在不足.本文提出一种基于自注意力和双向门控循环单元的文本分类模型(Self-attention and Bidirectional-gated-recurrent Unit based Text Classification,SBUTC),利用自注意力机制关注对分类贡献较大的文本部分,使用含有不同尺寸卷积核的多通道CNN提取不同粒度的文本局部特征;通过含有跳层连接结构的堆叠BiGRU网络提取文本间上下文语义信息和长距离依赖关系;将CNN和BiGRU的输出进行特征融合,训练分类器对不同类型的文本信息进行分类.在ChnSentiCorp数据集和THUCNews_Title数据集上的对比实验结果表明,本文提出的模型在分类准确率和F1值上优于其他对比模型.
石磊王明宇宋哲理陶永才陶永才卫琳范雨欣
关键词:文本分类卷积神经网络
基于时间序列预测的自适应失效检测模型被引量:1
2014年
失效检测是实现分布式系统高可用性的重要保障技术,其本质属于非线性时间序列预测问题.最小二乘支持向量回归算法是非线性时间序列预测领域的有效方法之一,在小样本空间和预测精度等方面有一定优势.传统失效检测算法基于概率统计模型计算下一心跳的到达时间,受限于某种概率分布且需要较大数据量,存在一定局限性.实际应用中常面临小样本空间,为此本文提出FD-LSSVR(Failure Detection-Least Squares Sport Vector Regression)模型并进行了讨论.针对现有自适应失效检测算法需考虑离群值这一问题,模型引入聚类分析法过滤对预测结果影响较大的离群值.实验结果表明,FD-LSSVR模型在检测时间和准确度方面均有较好表现,可用以缓解子网络延迟对失效检测的影响.
石磊景京卫琳陶永才曹仰杰
关键词:时间序列预测
CGGA:一种CNN与并行门控机制混合的文本分类模型被引量:5
2021年
针对中文文本分类准确率低、单一的卷积神经网络模型难以提取多方面特征的问题,本文提出一种基于CNN的并行门控机制的混合文本分类模型——CGGA(Convolutional Neural Network with parallel gating unit and attention mechanism).利用卷积提取文本的局部特征,并加入双向门控循环单元对数据进行上下文数据建模,提取关系特征,同时,引入门控Tanh-ReLU单元进行进一步的特征筛选,从而控制信息向下层流动的力度,并且减轻梯度弥散,提高模型分类准确率.最后,使用多头注意力机制进行权重更新计算,以提高在相应文本类别上的输出,进而优化模型分类性能.实验结果显示,本文提出的文本分类模型和分类算法,在THUCNews数据集和搜狐数据集上,比基线模型的宏平均精确率分别提高了2.24%、6.78%.
马建红刘亚培刘言东陶永才石磊卫琳
关键词:文本分类
基于Maxdiff直方图的MapReduce负载均衡研究被引量:2
2016年
MapReduce作为处理大数据的分布式计算框架,被越来越多地应用在科学研究中.科研数据通常具有高度倾斜性.数据分布的均匀程度很大程度上影响着MapReduce的性能.当前MapReduce多采用Hash随机划分为Reduce阶段分配数据,当数据分布倾斜时,会造成Reduce阶段各节点负载不均衡.为解决这一问题,提出一种基于Maxdiff直方图的负载均衡方法M HLB.采用M axdiff直方图估计M ap阶段输出中间结果的数据分布情况,并提出改进的数据划分方法,实现数据混洗过后数据记录的均衡划分.实验结果证明,在同构集群下,较之标准MapReduce,负载均衡方法 MHLB可有效实现各Reduce节点的负载均衡,降低作业运行时间.
陶永才张丹丹石磊卫琳
关键词:MAPREDUCE直方图数据划分
基于区块链的身份认证隐私保护机制研究系统及方法
本发明涉及电子信息技术领域,公开了基于区块链的身份认证隐私保护机制研究系统,包括:数字身份管理模块、身份代理机构、用户认证模块、应用服务模块、区块链和星际文件系统;所述数字身份管理模块用于负责在区块链上部署智能合约,定义...
陶永才宋凯石磊卫琳高宇飞和孟佯
一种适用于网格环境的基于可靠性代价的作业调度系统
本发明为一种适用于网格环境的基于可靠性代价的作业调度系统。如图1所示,整个系统分为三层:第一层为作业提交接口模块1,第二层为作业调度模块2,以及底层为网格资源平台7。从工作原理上说,本发明的核心为第二层的作业调度模块,它...
金海陶永才吴松邹德清石宣化曹海军
文献传递
共8页<12345678>
聚类工具0