崔晓晖
- 作品数:17 被引量:83H指数:6
- 供职机构:北京林业大学信息学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金黑龙江省自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学农业科学电气工程更多>>
- 面向服务匹配问题的协同演化算法被引量:4
- 2015年
- 服务匹配是服务发现的主要环节.目前,原子服务匹配过程主要存在服务匹配概念狭窄、匹配算法的时间复杂度较高及匹配方案的表示难以被智能优化算法处理等问题.针对上述问题,在原子服务匹配的基础上引入复合服务匹配、抽象复合服务匹配过程的适应度函数及约束条件,设计适用于智能优化算法处理的匹配方案的表示方法.同时,结合协同演化算法设计思路,提出基于粒子群和模拟退火的协同演化算法(PSO-SA),用以求解复合服务匹配.实验结果表明:与现有智能优化算法相比,PSO-SA可在有限迭代次数内获得精度较高的匹配结果,对不同维度的服务匹配问题具有较高的适应性,可用于提高服务发现结果的质量.
- 崔晓晖印桂生董红斌
- 关键词:粒子群优化模拟退火
- 改进型遗传算法在种子园无性系配置设计中的应用被引量:4
- 2018年
- 【目的】使用优化算法优化种子园无性系配置的设计方案,以保证种子园子代在具有较高的遗传增益的前提下维持丰富的遗传多样性,为高世代种子园的无性系配置设计提供参考。【方法】基于已有的内蒙古红花尔基樟子松国家良种基地的樟子松亲本为材料,采用SSR分子标记技术及其分析软件确定樟子松亲本之间的遗传距离,使用优化算法开展基于遗传距离的樟子松种子园无性系配置优化设计,并基于研究目标改进原有的优化方法,最后与传统的种子园无性系配置方案、其他优化方法得到的方案进行对比分析。【结果】使用本文改进的优化算法获得的种子园无性系配置方案优于传统的顺序错位以及其他方法的种子园配置方案,该方法能够使遗传距离较近的无性系在配置上保持最大距离,减少近亲交配机会,在一定程度上扩大了子代的遗传基础。【结论】当已知种子园无性系亲本间遗传距离时,可利用本文提出的基于传统遗传算法进行改进的多种群并行自适应的方法,即改进型自适应并行遗传算法,来实现基于遗传距离的种子园无性系优化配置。
- 王晴齐建东崔晓晖李伟
- 关键词:种子园遗传算法
- 基于OBE的软件估算技术教学改革
- 软件估算技术是电子信息类专业研究生的专业选修课程,基于OBE的教育理念,本文分析了目前课程教学中存在的问题,提出基于OBE的课程教学改革,介绍了课程大纲修订的情况,并结合课程特点,从教学内容、教学方法、教学手段等方面提出...
- 孟伟崔晓晖王春玲许福
- 关键词:教学改革
- 基于改进型果蝇算法的无性系种子园设计被引量:2
- 2018年
- 种子园的规划设计是林木育种的基础工作,在亲本数量不确定的前提下,最大限度避免种子园内无性系之间近交繁殖,保证种子园具有较高的遗传效益,是种子园设计的目标。以内蒙古红花尔基樟子松(Pinussylvestris var.mongolica)国家良种基地的1、1. 5、2代种子园樟子松无性系通过SSR等技术分析得到的不同亲本之间的遗传距离为数据支撑,考虑复杂的亲本关系,通过改进的智能优化算法进行种子园设计,并将最终结果与其他智能优化算法和传统算法的结果进行对比分析。结果表明:改进型果蝇算法的收敛速度和效果优于其他算法,由所有算法分别执行200次之后的对比结果中可见,其最大值低于其他算法的最小值。在完全随机算法设计方案中存在多处同一无性系分株相邻出现,遗传算法和改进型果蝇算法设计方案并无同一无性系分株作为近邻出现且改进型果蝇算法设计方案的优先交配优于遗传算法设计方案。结果表明,基于遗传距离处理亲本复杂的亲缘关系,采用智能优化算法进行方案配置,可以为高世代种子园设计提供参考。
- 齐建东刘春霞崔晓晖李伟
- 关键词:无性系
- 基于改进Sequence-to-Sequence模型的文本摘要生成方法被引量:13
- 2019年
- 基于循环神经网络和注意力机制的Sequence-to-Sequence模型神经网络方法在信息抽取和自动摘要生成方面发挥了重要作用。然而,该方法不能充分利用文本的语言特征信息,且生成结果中存在未登录词问题,从而影响文本摘要的准确性和可读性。为此,利用文本语言特征改善输入的特性,同时引入拷贝机制缓解摘要生成过程未登录词问题。在此基础上,提出基于Sequence-to-Sequence模型的新方法 Copy-Generator模型,以提升文本摘要生成效果。采用中文摘要数据集LCSTS为数据源进行实验,结果表明所提方法能够有效地提高生成摘要的准确率,可应用于自动文本摘要提取任务。
- 周健田萱崔晓晖
- 关键词:文本摘要语言特征
- 面向实践创新能力培养的数据库实验设计被引量:6
- 2015年
- 针对数据库教学中学生理论能力与实践能力发展不匹配的问题,分析产生该问题的根源,提出实验教学改革的依据和原则,设计满足改革依据的实验主体案例——精简推荐系统,围绕该案例建立实验任务的规划方案。
- 崔晓晖陈志泊韩慧
- 关键词:数据库实验教学推荐系统
- 基于Spark框架XGBoost的林业文本并行分类方法研究被引量:10
- 2019年
- 针对当前“互联网+”技术与林业的交叉融合,涌现出海量待挖掘的涉林文本,而林业文本分类的相关研究尚不成熟的问题,使用网络爬虫技术面向互联网采集涉林文本,基于丰富的语料重新构建分类标签,提出基于Spark计算框架的XGBoost并行化方法,对林业文本进行分类。经由交叉验证,构建的XGBoost并行分类算法准确率为0.9234,在各类别中最低F1为0.8604,最高为0.9984;其在2.1万条、4.2万条、8.4万条数据集上的训练加速比分别为2.13、3.47、3.82。结果表明,基于该标签设定的分类模型对现存互联网中涉林文本的适应性较好;Spark环境下实现的XGBoost并行化算法的准确率显著优于其他4种机器学习(朴素贝叶斯、GBDT决策树、BP神经网络和ELM神经网络算法)的并行化算法,算法执行效率远高于单机版本,且数据量越大,其加速比越高,能有效应对海量林业文本的实时、准确分类。
- 崔晓晖师栋瑜陈志泊许福
- 关键词:文本分类SPARK
- 基于TextRank和簇过滤的林业文本关键信息抽取研究被引量:14
- 2020年
- 目前,获取林业文本关键信息存在2个问题:关键信息获取主要从关键词角度考虑,忽略了词语的信息类型;网络上的林业文本没有统一的记述结构,词语信息类型提取困难。为此,本文提出了基于改进TextRank和簇过滤的林业文本关键信息抽取方法,以“关键词+信息类型”两部分表示文本关键信息。首先,抽取关键词并进行Word2Vec向量化,然后通过构建融合词语特征值、边权值的图模型对TextRank进行改进,对经迭代收敛得到的稳定图进行归并聚类形成簇;然后,设计簇品质评价公式进行簇过滤,再次应用TextRank形成最终簇集合;最后,对簇进行信息类型标注。对于测试文本,通过比较关键词向量和簇心向量的距离获得词语的信息类型,将信息类型与关键词结合得到文本的关键信息。基于2000篇与林业政策新闻相关的林业文本进行实验,最终簇集合的紧密度为0.9680,间隔度为0.0572,综合评价指标为0.8871;对其中400篇文本进行关键词人工标注,将本文关键词抽取方法与TextRank、TF IDF等6种算法进行比较,结果表明,本文方法在MRR、Bpref、准确率和综合评价指标上均获得了较好的效果,说明本文方法在提取林业文本关键词方面具有优势。
- 陈志泊李钰曼许福冯国明师栋瑜崔晓晖
- 关键词:关键词抽取信息类型
- 基于混合驱动的本科教学评价指标体系分析系统的构建与应用——以北京市某大学为例被引量:1
- 2018年
- 教学评价指标体系的分析结果是优化高校现行本科教学评价指标体系的重要依据。以北京市某大学为例,利用已有教学评价数据分析现行本科教学评价指标体系的信度和效度,是该校教评中心的年度业务需求之一。基于此,尝试借助信息化技术对本科教学评价指标体系分析系统的构建进行了探索。首先,基于混合驱动的数据分析模式,对本科教学评价指标体系分析系统的功能需求进行归纳,并明确了系统构建的总体框架。其次,对本科教学评价指标体系分析系统采取的信度分析和效度分析方法进行了重点介绍。最后,应用构建的本科教学评价指标体系分析系统对该校2011—2014年的本科教学评价数据进行了具体分析,结果表明该校采用的本科教学评价指标体系具有较高的可信度,但在效度方面应根据学生班级规模不同等情况,制定差异化的教学评价指标权重分配方案,以便获得更具辨识能力的本科教学评价结果。
- 崔晓晖张戎陈俊生齐建东
- 关键词:高等教育教学管理信度分析
- 基于注意力机制的林木物候期识别方法被引量:5
- 2021年
- 【目的】针对物候期识别传统方法特征提取不充分、未对关键特征进行区分,导致方法泛化能力较差、迁移应用识别精度低的问题,本研究将注意力机制引入残差神经网络,结合基于数字照相的物候观测方式,提出具有较强细粒度特征识别能力且实用性较强的林木物候期识别方法,从而为林木的长期实时物候监测提供技术支撑。【方法】以PhenoCam中的栎林及槭林像片为研究材料,选取2017—2018年的数据作为训练集,以2019年的数据评价模型的泛化能力。研究结合实地观测数据对研究区的林木物候期进行划分,设计数据裁剪公式,在增强数据的同时均衡各个物候期数据的数量。研究基于ResNet50残差神经网络设计了深度学习模型,针对林木物候期差异较小的特性引入了注意力机制,注意力模块在通道及空间维度对神经网络提取的特征进行再处理,提升了模型对细粒度图像差异的识别能力。【结果】注意力机制的引入有效提升了模型的泛化能力,增强了模型对易混淆物候期的识别能力,在未参与训练的19年数据集的栎林物候期识别取得了90.58%的准确率,槭林物候期识别准确率为89.27%,较引入前模型准确率在两个研究区分别提升21.86%与13.15%,优于传统AlexNet和HOG-SVM方法。【结论】基于残差注意力网络的林木物候期识别方法较好解决了原有方法泛化能力较差的问题,该方法具有准确度高、迁移应用能力强等优势,能对易混淆的林木物候期进行精准区分,适用于林木物候的长期观测。
- 崔晓晖陈民陈志泊陈志泊许福