教育部科学技术研究重点项目(02038)
- 作品数:17 被引量:147H指数:7
- 相关作者:黄亚楼冯兴杰刘山戴敏李飞更多>>
- 相关机构:南开大学中国民用航空学院天津理工大学更多>>
- 发文基金:教育部科学技术研究重点项目天津市自然科学基金天津市高等学校科技发展基金计划项目更多>>
- 相关领域:自动化与计算机技术经济管理理学更多>>
- 基于文件静态信息的木马检测模型被引量:19
- 2006年
- 提出了一种基于文件静态信息检测木马文件的新方法,并以PE文件为分析对象,利用决策树与基于BP学习算法的分层网络,设计了基于文件静态信息的木马检测模型,实验证明,该模型能有效地判断文件是否为木马文件。
- 戴敏黄亚楼王维
- 关键词:木马检测数据挖掘决策树PE文件
- 增量式CURE聚类算法研究被引量:23
- 2004年
- 聚类是一种非常有用的数据挖掘方法 ,可用于发现隐藏在数据背后的分组和数据分布信息 .目前已经提出了许多聚类算法及其变种 ,但在增量式聚类算法研究方面所作的工作较少 .当数据集因更新而发生变化时 ,数据挖掘的结果也应该进行相应的更新 .由于数据量大 ,在更新后的数据集上重新执行聚类算法以更新挖掘结果显然比较低效 ,因此亟待研究增量式聚类算法 .通过对 CURE聚类算法的改进 ,提出了一种高效的增量式 CU RE聚类算法 .它能够很好的解决传统聚类算法在伸缩性、数据定期更新时所面临的问题 .
- 冯兴杰黄亚楼
- 关键词:数据挖掘最近邻增量式聚类算法
- 民航计算机系统间的数据交换被引量:1
- 2004年
- 集中式主机系统与Client/Server处理系统的连接和数据交换的3层系统结构方案。在此基础上,介绍了基于COM技术的订座数据下载应用服务器的设计和实现过程。
- 冯兴杰黄亚楼
- 基于数据挖掘的运动员体能测试数据分析被引量:19
- 2003年
- 数据挖掘就是利用机器学习的方法从大量数据中提取有价值知识的过程。该文以运动员体能测试数据为分析对象,采用关联规则技术分析测试项之间的关联,并进一步优化体能测试指标。把基于体能数据对运动员的综合评价问题转化为分类问题,设计基于BP学习算法的分层网络,有效地解决运动员体能状态评价。
- 戴敏黄亚楼
- 关键词:数据挖掘关联规则神经网络
- 基于临近区域递归的二进制数到三进制数合并算法
- 2005年
- 讨论了基于广播Banyan网作为路由网的点到多点通信问题,即传输信元的二进制地址到三进制地址的合并算法,本算法采用临近区域分类的集合递归合并的方法,将二进制地址有效地合并成三进制地址。分析表明此算法可以有效地减少网络内部占用的链路数,提高了使用网络资源的效率。
- 刘山
- 关键词:二进制
- 基于分治的属性约简相对核计算被引量:1
- 2004年
- 针对信息表中相对核的计算采用分治策略提出了一个新的属性约简方法,将在计算整个全域上的属性约简问题转化为计算在相应划分的子区域上属性约简问题.将原有计算POSX0(Y)的算法复杂度O(|A||U|2),降为O(|A|(|Y1|2+|Y2|2+…+|Yn|2)),对于一般比较大的|U|说,效率提高非常明显,提高了属性约简的可计算性.
- 刘山冯兴杰
- 关键词:粗糙集属性约简分治
- 一种基于网格和密度的数据流聚类算法被引量:12
- 2008年
- 在"数据流分析"这一数据挖掘的应用领域中,常规的算法显得很不适用。主要是因为这些算法的挖掘过程不能适应数据流的动态环境,其挖掘模型、挖掘结果不能满足实际应用中用户的需求。针对这一问题,本文提出了一种基于网格和密度的聚类方法,来有效地完成对数据流的分析任务。该方法打破传统聚类方法的束缚,把整个挖掘过程分为离线和在线两步,最终通过基于网格和密度的聚类方法实现数据流聚类。
- 高永梅黄亚楼
- 关键词:聚类网格数据流
- 一种基于加权多代表点的层次聚类算法被引量:7
- 2005年
- CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想。本文通过对已有的基于多代表点的层次聚类算法特点的分析,提出了一种新的基于多代表点的层次聚类算法WRPC。它使用了基于影响因子的簇代表点选取机制和基于k-近邻方法的小簇合并机制,可以发现形状、尺寸更为复杂的簇。实验结果表明,该算法在保证执行效率的情况下取得了更好的聚类效果。
- 倪维健黄亚楼李飞刘赏
- 关键词:聚类算法代表点加权K-近邻聚类效果
- 基于支持向量回归的旅客吞吐量预测研究被引量:21
- 2005年
- 在分析现有机场旅客吞吐量预测方法不足的基础上,利用基于结构风险最小化原则的支持向量回归方法,建立了机场旅客吞吐量预测模型。通过实际数据的检验及与BP神经网络等方法的预测结果相比较,证明应用支持向量回归方法对机场旅客吞吐量进行预测具备可行性,同时具有较高的预测精度。
- 冯兴杰魏新黄亚楼
- 关键词:旅客吞吐量支持向量回归结构风险最小化原则BP神经网络机场
- 属性约简中核的计算方法被引量:3
- 2004年
- 属性约简是粗糙集理论研究的主要内容之一,该文首次采用了分治策略,提出了一个新的属性约简方法,将在计算整个全域上的属性约简问题转化为计算在相应划分的子区域上属性约简问题。将原有计算核的算法复杂度为O(|A||U|2)犤1犦,降为O(|A|(|Y1|2+|Y2|2+……+|Yn|2)),对于一般比较大的|U|而言,提高效率非常明显,提高了属性约简的可计算性。
- 刘山
- 关键词:粗糙集属性约简分治