蔡庆生
- 作品数:207 被引量:2,069H指数:25
- 供职机构:中国科学技术大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术理学经济管理文化科学更多>>
- 抽样在数据挖掘中的应用研究被引量:24
- 2004年
- 大规模数据集是数据挖掘高效实现的障碍。抽样是统计学中一种常用的调查方法,作为克服该障碍的方法,抽样被引入数据挖掘中。在国外,抽样在数据挖掘中的应用研究已比较广泛,而国内相关研究很少。本文在总结现有相关工作的基础上,系统介绍了数据挖掘中抽样的应用及其相关问题,相信抽样在数据挖掘中的应用研究推动数据挖掘的发展。
- 张春阳周继恩钱权蔡庆生
- 关键词:数据挖掘数据库数据仓库数据分析统计学数据集
- 一种基于时间范例的预测技术被引量:4
- 2003年
- 介绍了CBR与模糊结合的技术在预测领域中的应用现状,阐述了一种经作者改进的模糊k NN技术的工作原理,详细论述了时间范例相似度的匹配算法与预测算法.给出该算法在电力负荷预测中的应用的实例,描述了预测系统工作原理、系统结构设计,最后给出了实验结果.
- 郑烇王俊普蔡庆生
- 关键词:CBR电力系统电力负荷预测
- 大型数据库中的高效序列模式增量式更新算法被引量:18
- 2003年
- 提出一种称为FIMS(fastincrementalminingofsequentialpatterns)的序列模式增量式更新算法,处理因数据库的更新而引起的序列模式的维护问题.主要思想是利用原先的序列模式挖掘结果,通过建立一个投影数据库来减少对整个数据库的扫描次数和候选序列的生成,从而提高挖掘的效率.实验结果显示在更新数据量远小于整个数据库的大小时,FIMS算法的性能优于GSP算法4~7倍.
- 邹翔张巍蔡庆生王清毅
- 关键词:数据库增量式更新算法数据挖掘
- 数据挖掘在电信业中的应用被引量:52
- 2004年
- 介绍了应用于移动通信业的数据挖掘系统,以一些实际数据说明了关联规则挖掘和分类模型挖掘在电信业务中的具体应用。
- 汤小文蔡庆生
- 关键词:数据挖掘电信业务关联规则
- Q-learning算法及其在囚徒困境问题中的实现被引量:9
- 2001年
- Q-learning是一种优良的强化学习算法。该文首先阐述了Q-learning的基本学习机制,然后以囚徒困境问题为背景,分析、对比T Q-learning算法与TFT算法,验证了 Q-learning算法的优良特性。
- 张春阳陈小平刘贵全蔡庆生
- 关键词:人工智能
- 在数据库中自动发现广义序贯模式被引量:16
- 1997年
- 本文将序贯模式的发现从单层(SingleLevel)概念扩展到多层(MultipleLevel)概念.即既允许在同层概念之间,也允许在不同层概念之间发现序贯模式,提出了发现广义序贯模式的自顶向下逐层递进的方法.
- 欧阳为民蔡庆生
- 关键词:知识发现数据库
- 关于模糊联想类比推理的数学模型及逻辑初探
- 1996年
- 本文借用模糊数学,对模糊联想类比推理的基础理论进行了研究,并给出模糊联想类比推理的一种模型及其一种逻辑。
- 徐金辉李凡长蔡庆生
- 关键词:数学模型数学逻辑人工智能
- 事件序列中频繁串行情节的增量式发现算法
- 1999年
- 本文研究事件序列中频繁情节的发现问题,提出了在事件序列中发现频繁串行情节的增量式算法.如果在事件序列中发现了频繁情节及其出现频率,我们就可以生成描述或预测该序列行为的情节规则.
- 魏正红欧阳为民蔡庆生
- 关键词:数据发掘频繁情节数据库
- 电力负荷预测的CBR中权重向量的选取模型被引量:1
- 2007年
- 电力负荷预测是一个较为复杂的过程,由于影响负荷的因素较多,权重向量的选取较为困难,导致负荷预测的准确性较差。通过遗传算法选取合适的权重向量,在范例检索的过程中利用时间序列和组合属性对权重向量和预测结果进行进一步修正,使得负荷预测的精度大大提高,实验结果表明该模型具有有效性和实用性。
- 章曙光蔡庆生
- 关键词:负荷预测权重向量
- 连续值属性的概念层次自动提取算法被引量:2
- 2003年
- 针对数值型属性的特点 ,通过不同数值分段的分布特性 ,给出了一种能自动从大型数据库中提取数值型属性的概念层次的有效算法 ,算法的时间复杂度为O(n) ,并通过具体实验对算法进行测试 .结果表明 ,该算法能正确有效地生成概念层次树 ,为高质量地进行数据挖掘提供了一种行之有效的数据预处理方法 .
- 杨学兵蔡庆生
- 关键词:数据库知识发现数据挖掘自动提取算法