段磊
- 作品数:82 被引量:356H指数:11
- 供职机构:四川大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术医药卫生文化科学航空宇航科学技术更多>>
- 基于GEP和神经网络的属性约简分类算法被引量:6
- 2006年
- 分类(Classification)是数据挖掘(DataMining)中的一个重要研究方向,目前传统的方法有神经网络,Fisher判别法等。神经网络缺乏对分类结果的直观解释;Fisher判别对于大数据集分类准确率大大下降,且不具有属性约简能力。为此,该文做了如下工作(1)提出了自动获取最佳阈值的思想;(2)对于错分的实例,提出了运用神经网络分类器二次分类的思想;(3)提出了基于基因表达式编程和神经网络的属性约简分类算法(AttributionReductionClassificationAlgo-rithmsBasedonGEPandNeuralNetwork,ARCA-GEPNN);(4)实验表明,ARCA-GEPNN的分类精度比Fisher判别提高了约25%,比GEP提高了约21%。
- 邓松元昌安赵波段磊杨乐婵饶元廖剑平
- 关键词:基因表达式编程神经网络属性约简
- 基于基因表达式编程的信用评估模型挖掘方法被引量:7
- 2007年
- 提出了一种基于基因表达式编程(GEP)的信用评估模型挖掘方法GEP-CREDIT。该方法基于客户信贷数据,利用GEP算法自动进行属性筛选,并进行属性融合,在此基础上训练和建立信用评估模型。在德国信用数据库真实数据集上做的实验和性能分析表明,基于GEP的信用评估模型挖掘方法较Nave Bayes算法的预测精度提高了3%;较SVM算法的预测精度提高了1.6%;较KNN(K=17)算法的预测精度提高了6.83%。
- 吴江唐常杰段磊李太勇
- 关键词:数据挖掘基因表达式编程信用评估
- 一种以项集为序列元素的对比序列模式挖掘方法
- 本发明公开了一种以项集为序列元素的对比序列模式挖掘方法,所述方法包括:步骤1:输入以项集为元素的正例序列集D<Sub>+</Sub>和负例序列集D<Sub>–</Sub>,间隔约束<I>γ</I>,正例支持度阈值<I>α...
- 段磊杨皓秦攀
- 文献传递
- 一种基于多视图融合的生物医学材料分子表征方法及系统
- 本发明公开了一种基于多视图融合的生物医学材料分子表征方法及系统,属于生物医用材料分子表征学习、材料基因工程、深度学习技术领域,解决现有技术学习到的分子的表征不全面的问题。本发明对材料分子的不同视图进行强弱关联定义,并对材...
- 段磊张译丹马润泽
- 中国出生缺陷数据挖掘系统HealthyBaby
- 在国家'十一五'科技支撑计划'出生缺陷干预效果评价系统'和国家自然科学基金'亚复杂系统中干预规则挖掘'支持下,中国出生缺陷数据挖掘系统HealthyBaby的测试版本已经在具有30年数据的全国出生缺陷数据仓库运行。介绍并...
- 段磊左劼李川陈瑜唐常杰朱军代礼牟昕
- 关键词:数据挖掘系统
- 文献传递
- 提高基因表达式编程发现知识效率的回溯策略被引量:13
- 2006年
- 传统基因表达式编程(GEP)编码简单,适应性强,但可能陷入局部最优的“早熟”陷阱.因此,作者借鉴生物界的“返祖现象”,提出了基于回溯的基因表达式编程方法.主要工作包括:(1)在传统GEP算法中引入回溯机制,提出基于回溯策略的GEP算法GEPBS(GEP withBacktracking Strategy);(2)提出回溯检查点概念,设计等比递增检查点序列和加速递增检查点序列,约束回溯过程;(3)扩充基于回溯的GEP算法,设计了退化因子(RF),提出了按比例回溯策略GEPPBS(GEP with Proportional Backtracking Strategy);(4)通过两个实验验证了新算法的有效性,在相同条件下较传统算法的适应度最大提高了49.2%,成功率最高提高了4倍.
- 钟义啸唐常杰陈宇段磊魏大刚
- 基于TF/IDF相似度的标签聚类方法
- 社会标签系统是Web2.0中提出的新概念,旨在更好地表达用户的兴趣和意愿。标签聚类是社会标签数据挖掘中一个非常重要的研究课题.标签相似度的计算是标签聚类的关键技术。主要工作包括:(1)提出一种基于TF/IDF的标签相似度...
- 韩敏唐常杰段磊李川巩杰
- 关键词:数据挖掘聚类算法
- 文献传递
- TRAODGrid:基于Grid空间划分的高效离群轨迹检测方法
- 为在海量离群轨迹数据的挖掘中提升算法运行效率,提出一种高效的离群轨迹挖掘算法TRAODGrid.该算法通过挖掘离群轨迹点探测离群轨迹.轨迹向量度量方法可以有效检测出轨迹点和轨迹分段在空间位置和轨迹方向上的离群性,并且通过...
- 唐良唐常杰姜页希李川段磊曾春秋徐开阔
- 文献传递
- 基于基因表达式编程的股票指数时间序列分析被引量:17
- 2005年
- 基因表达式编程(GEP)是遗传算法研究的新分支.针对股票对象的特点,提出了适应股票规律的GEP-STOCK模型,包括n时段-STOCK-GENE,STOCK-fitness以及STOCK-GEP算法,并以上海证券交易指数时间序列数据为对象做了实验.进行了误差和指数涨跌分析.实验结果表明GEP-STOCK模型预测精度较高,20d的平均绝对误差为11.08,平均相对误差为0.64%.从涨跌情况预测来看,模型对6d后指数的涨跌判断,正确率高于80%以上.
- 廖勇唐常杰元昌安陈安龙段磊
- 关键词:数据挖掘基因表达式编程时间序列
- 基于基因表达式编程的话务量预测方法被引量:5
- 2008年
- 解决了在未知难以证明的先验知识时,传统时间序列分析方法无法得出精确的预测结果这一问题。将基因表达式编程(GEP)技术引入电信分析领域,提出了一种基于基因表达式编程的话务量预测模型GEP-Telecom。技术对某电信公司的话务量纪录进行的相关试验达到了预期的效果,给出了精确的预测。研究表明,GEP-Telecom模型在未知函数类型先验知识的情况下,能够自动进行属性筛选和属性融合,避免了传统预测方式的盲目性,提高了预测的精度。
- 曾雪胡建华段磊
- 关键词:数据挖掘基因表达式编程时间序列话务量