国家自然科学基金(31170393) 作品数:12 被引量:176 H指数:9 相关作者: 马春森 王超学 张涛 马罡 董丽丽 更多>> 相关机构: 中国农业科学院植物保护研究所 西安建筑科技大学 西安理工大学 更多>> 发文基金: 国家自然科学基金 陕西省教育厅自然科学基金 陕西省自然科学基金 更多>> 相关领域: 自动化与计算机技术 生物学 农业科学 电气工程 更多>>
改进SVM-KNN的不平衡数据分类 被引量:21 2016年 针对支持向量机(SVM)在超平面附近进行不平衡数据(imbalanced datasets)分类的不准确性,提出了一种改进SVM-KNN算法,该算法在分类阶段计算测试样本与最优超平面的距离,如果距离差大于给定阈值可直接应用支持向量机分类;如果距离差小于给定阈值,则将所有支持向量都作为测试样本的近邻样本,进行KNN分类。通过对UCI数据集的大量实验表明,该算法在少数类样本的识别率和分类器的整体性能上有明显改善。 王超学 张涛 马春森关键词:支持向量机 K近邻法 不平衡数据集 蚜虫诱导的植物免疫反应 被引量:10 2015年 在植物与昆虫长期的互作过程中,植物建立起一系列精密而又复杂的防御机制以应对昆虫取食为害,并且能够识别不同取食类型昆虫的效应因子作出不同的防御应答。最近研究揭示了许多植物与蚜虫之间相互抗争的分子机制,这不仅包括植物激素介导的诱导防御途径、植物先天免疫系统和基于gene-for-gene的R抗性识别和作用机制,而且还包括蚜虫在取食过程中分泌的唾液成分,它有助于蚜虫取食韧皮部组织,抑制植物病原相关分子模式激活的免疫反应(Pathogen-associated molecular patterns triggered immunity,PTI)防御,以及被植物核苷酸结合位点区-亮氨酸重复序列区(NBS-LRR)膜受体识别激活效应因子免疫反应(ETI)防御等方面。本文综述了蚜虫诱导的植物防御途径、蚜虫诱导的植物免疫反应、蚜虫效应因子的鉴定与功能分析三方面的最近研究进展,提出了未来发展的研究方向。这些基于病原微生物提出的"zig-zag"模型为进一步理解植物先天免疫、诱导防御系统和蚜虫唾液腺组分的互作提供新理论支撑,为揭示了植物与蚜虫抗性互作的分子机制及有效安全地防治害虫提供了新思路。 袁亮 郭慧娟 孙玉诚 肖铁光 戈峰关键词:蚜虫 水杨酸 唾液腺 免疫反应 基于协同进化基因表达式编程的函数发现研究 被引量:1 2013年 基因表达式编程(GEP)算法是一种具有强大函数发现能力的新型进化算法。GEP在函数发现时如何确定合适的数值常量对算法的性能具有很大影响。提出了一种基于协同进化基因表达式编程的函数发现算法(GEP-DE),该算法的最大改进在于一种新的常量优化方法:在每一代中将函数发现的过程分为两个阶段:第一阶段,由标准GEP算法结合固定常量集确定函数结构;第二阶段,使用差分进化算法(DE)对第一阶段得出的函数结构的常量进行优化。实验结果表明,GEP-DE算法比重要文献中的常量处理方法其效果有较大提升,并且算法的综合性能也优于最新重要文献提出的GEP算法。 王超学 张星 马春森 张涛关键词:进化计算 函数发现 差分进化 协同进化 基于聚类权重分阶段的SVM解不平衡数据集分类 被引量:9 2015年 SVM在处理不平衡数据分类问题(class imbalance problem)时,其分类结果常倾向于多数类。为此,综合考虑类间不平衡和类内不平衡,提出一种基于聚类权重的分阶段支持向量机(WSVM)。预处理时,采用K均值算法得到多数类中各样本的权重。分类时,第一阶段根据权重选出多数类内各簇边界区域的与少数类数目相等的样本;第二阶段对选取的样本和少数类样本进行初始分类;第三阶段用多数类中未选取的样本对初始分类器进行优化调整,当满足停止条件时,得到最终分类器。通过对UCI数据集的大量实验表明,WSVM在少数类样本的识别率和分类器的整体性能上都优于传统分类算法。 王超学 张涛 马春森关键词:不平衡数据集 双系统协同进化的基因表达式编程及其在函数发现中的应用 被引量:3 2016年 受人类进化过程的启发,提出了一种双系统协同进化的基因表达式编程算法DSCE-GEP。DSCE-GEP由自然进化系统和人工干预系统组成。人工干预系统包括个体干预和种群干预。个体干预是依据基因库对种群中的个体进行去劣和增优操作,旨在改善种群中个体的质量;种群干预通过引入随机和镜像个体来提高种群的多样性和全局寻优能力。与权威文献中改进的GEP关于函数发现问题的大量对比实验表明,本文算法在收敛速度、求解质量方面优于对比算法,具有明显的竞争力。 王超学 吴书玲 张婧菁关键词:基因库 改进型加权KNN算法的不平衡数据集分类 被引量:26 2012年 K最邻近(KNN)算法对不平衡数据集进行分类时分类判决总会倾向于多数类。为此,提出一种加权KNN算法GAK-KNN。定义新的权重分配模型,综合考虑类间分布不平衡及类内分布不均匀的不良影响,采用基于遗传算法的K-means算法对训练样本集进行聚类,按照权重分配模型计算各训练样本的权重,通过改进的KNN算法对测试样本进行分类。基于UCI数据集的大量实验结果表明,GAK-KNN算法的识别率和整体性能都优于传统KNN算法及其他改进算法。 王超学 潘正茂 马春森 董丽丽 张涛关键词:不平衡数据集 K-MEANS算法 抗冻蛋白特征、作用机理与预测新进展 被引量:16 2012年 抗冻蛋白(antifreeze proteins,AFPs)可以通过抑制冰晶生长保护生物体免受低温冻害,具有重要的生物学意义和应用价值。现在在鱼类、节肢动物、植物及微生物中均发现有AFPs的存在。基于对已有研究文献和相关网络数据的系统调查统计,详细描述了AFPs数据的类别特征,并对其作用机理的研究历史和最新取得的突破性进展作了较为系统的阐述,并对AFPs预测所取得的成果作了介绍,还对AFPs研究的现状和未来研究方向作了讨论和展望。 李文轲 马春森关键词:抗冻蛋白 基于改进SMOTE的非平衡数据集分类研究 被引量:19 2013年 针对SMOTE(Synthetic Minority Over-sampling Technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制。将SSMOTE与KNN(K-Nearest Neighbor)算法结合来处理不平衡数据集的分类问题。通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能。 王超学 潘正茂 董丽丽 马春森 张星关键词:非平衡数据集 轮盘赌选择 气候变化下极端高温对昆虫种群影响的研究进展 被引量:26 2016年 全球平均温度升高导致极端高温事件发生幅度、频率和持续时间增加,对生物和生态系统造成显著影响.以往气候变暖与昆虫种群关系的研究多关注平均温度的变化,常导致过高地估计了温度升高对昆虫的正面作用,而忽视了自然界存在的极端高温的不利影响.本文综述了气候变化下极端高温对昆虫种群地理分布、种群统计参数和种群增长、行为及种间关系等影响的研究进展.极端温度通过限定昆虫的适宜温度阈限和耐受温度范围决定其在不同纬度、海拔和景观地区的分布.极端高温通过即时和后续效应抑制昆虫的发育、存活、繁殖等核心生命参数,进而改变了昆虫种群统计参数和种群增长.极端高温可通过影响昆虫的体温调节、取食及扩散等行为改变其发育、繁殖等核心生命参数.昆虫对极端高温的反应具有物种特异性,不同种类昆虫对气候变化的响应不同,导致相对优势度、群落结构、食物链等种间关系发生变化,进而影响生态系统的功能.目前关于极端高温对昆虫种群影响的研究多关注发生在夏季的热浪天气和日间极端高温.气候变化导致温度的升高在季节间具有非对称性,发生在春、秋、冬季节相对的极端高温对昆虫种群未来发展的影响将是未来该领域研究的重点. 马罡 马春森关键词:全球变暖 昆虫 极端高温 种群动态 种间关系 基于改进蜜蜂进化型遗传算法的含分布式电源的配电网重构 被引量:18 2012年 为改善分布式电源(Distributed Generation,DG)并入电网后配电网重构算法的性能,提出一种基于佳点集的蜜蜂进化型遗传算法(Bee Evolutionary Genetic Algorithm Based on Good Point Set,GBEGA)。该算法的关键有三点:1.提出一种基于佳点集的种群初始化方法,该方法比随机方法产生的种群在搜索空间更为均匀;2.引进佳点集交叉算子,该算子能在父代附近进行更加精细的搜索;3.采用自适应的交叉变异概率,有利于算法开采与勘探的平衡。将DG处理为PQ、PV两种模型,并将GBEGA与相关文献中的算法关于IEEE33和IEEE69节点系统进行了对比测试。仿真结果表明,GBEGA适合于含DG的配电网重构,在全局寻优能力和收敛速度上表现出色。 王超学 吕志奇 董慧 崔杜武 孙有田关键词:分布式电源 配电网重构 佳点集 自适应