教育部“新世纪优秀人才支持计划”(NCET-12-0919)
- 作品数:12 被引量:364H指数:6
- 相关作者:苗启广曹莹刘家辰宋建锋权义宁更多>>
- 相关机构:西安电子科技大学西北大学西安测绘研究所更多>>
- 发文基金:中央高校基本科研业务费专项资金教育部“新世纪优秀人才支持计划”国家自然科学基金更多>>
- 相关领域:自动化与计算机技术天文地球更多>>
- 基于不规则三角网的LiDAR数据的边缘检测新算法被引量:4
- 2014年
- 给出了一种三角形形变量的定义,并提出了基于不规则三角网(TIN)的LiDAR数据边缘检测新方法。将点LiDAR数据进行三角剖分,生成不规则三角网,计算TIN中每个三角形的形变量,根据三角形形变量的不同来确定处于地物目标边缘的三角形,对这些边缘三角形进行处理得到边缘点。针对LiDAR数据中可能由于河流等导致的数据空白区域,仅利用三角形形变量无法检测到所有边缘点的问题,提出了顶点到重心距离的平方和作为测度来确定狭长三角形,从而提取到河流等数据空白区域的边缘点。实验结果表明,该算法能够较好地提取LiDAR数据的边缘点,得到LiDAR数据的边缘信息。
- 宣贺君苗启广刘如意郭雪
- 关键词:遥感LIDAR数据不规则三角网
- 基于区域预测的LiDAR点云数据形态学滤波算法被引量:24
- 2015年
- 点云数据滤波是机载激光雷达(Li DAR)数据处理研究中很重要的问题之一。提出了一种基于区域预测的Li DAR点云数据形态学滤波算法,该算法由点云数据建立规则格网、去除粗差点,对实验区域进行分块,然后使用各个分块区域的高程标准差预测地形坡度参数s从而进行渐进式形态学滤波,最终确定地面点。文中算法优点在于可以根据区域地形起伏情况自适应地得到阈值进行滤波。使用国际摄影测量与遥感学会(ISPRS)提供的测试数据进行实验,实验结果表明,提出的算法能够有效去除地物点和保留地面点,并且能有效降低总误差。
- 苗启广郭雪宋建锋宣贺君
- 关键词:图像处理
- AdaBoost恶意程序行为检测新算法被引量:5
- 2013年
- 提出了一种新的程序行为抽象方法,将程序执行时发起的API调用、网络数据包信息以及静态分析给出的文件结构特征作为数据源,对API序列进行低聚合度依赖关系分析,将网络数据包信息及静态分析结果转化为离散值特征,共同嵌入到高维特征空间中.在此基础上,采用决策树作为子分类器,针对AdaBoost.M1算法容易过度拟合噪声数据的问题,设计出一种基于改进AdaBoost.M1算法的恶意程序行为检测算法.该算法采用一种新的损失函数,降低了噪声数据进入训练下一个子分类器的训练样本集的概率,提高了算法的抗噪声能力;同时,为每个子分类器生成一个投票向量,而不是单一的投票权值,以区分子分类器对不同类别样本分类的能力.
- 曹莹刘家辰苗启广高琳
- 关键词:恶意程序决策树ADABOOST损失函数
- 一种自动的高分辨率遥感影像道路提取方法被引量:24
- 2017年
- 从高分辨率遥感影像中提取道路有着非常重要的意义,但是受到遥感影像噪声、复杂的自然场景和已有算法的局限性的影响,道路提取有待于进一步研究.近些年来水平集方法被用于提取道路,但是初始水平演化曲线的确定却是一个大的难点.笔者提出一种自动的水平集分割方法,并将其用于道路检测中.首先,将卷积神经网络用于道路的粗分类.然后,利用形状特征和孔洞填充方法得到比较准确的道路区域.在此基础上,利用张量投票来提取道路的交叉口,并将其轮廓作为水平集演化的初始曲线进行水平集分割.最后,结合卷积神经网络分类和水平集分割的优势,得到比较完整的道路区域,并保持了道路的边缘.实验结果表明,该方法能自动地提取准确完整的道路区域.
- 刘如意宋建锋权义宁许鹏飞雪晴杨云苗启广
- 关键词:卷积神经网络张量投票水平集分割信息融合
- 一种融合信息熵的个人网络主题圈子发现算法被引量:3
- 2017年
- 个人网络由于规模小、信息量大的原因,成为社交网络分析中重要的研究对象,而现有的社区发现算法主要集中在全局大规模网络上,已有研究表明,全局网络的社区性质并不明显.文中提出了一种个人网络主题圈子发现算法,引入信息熵的概念衡量个人网络中用户圈子是否具有共同的主题,定义了新的目标函数,通过对目标函数进行启发式过程优化,实现了对用户个人网络主题圈子的挖掘和发现.并对微博文本进行主题提取,抽取出用户的主题兴趣,使用信息熵对用户主题的分布进行评估.然后,利用调和因子对结构性质函数与信息熵函数进行融合,给出了结合信息熵与结构模块性的目标函数.最后,对提出的目标函数进行近似,求得最优解,得到个人网络中的主题圈子.在新浪微博数据集上的实验结果表明,新算法能够有效地在个人网络上挖掘出具有文本高度聚合性的主题圈子,并且各个圈子在结构上具有高内聚低耦合的性质,对个人网络的分析和研究具有较大的应用意义.
- 唐兴权义宁董泽苗启广
- 关键词:社交网络文本挖掘个人网络信息熵
- 使用聚类稳定性分析方法增强单类学习算法被引量:9
- 2015年
- 针对传统单类学习模型对多模态或多密度分布数据描述能力不足的问题,将集成聚类和聚类稳定性分析引入单类学习.首先将确定聚类簇个数与确定聚类簇分布统一到同一个增强单类学习框架中,之后各聚类簇互为正负类分别建起立多个单类分类模型,最后采用最大融合体积方法融合其决策边界.以经典的支持向量数据描述(SVDD)为例,设计了基于集成聚类的稳定支持向量数据描述算法——ECS-SVDD.在标准UCI数据集和一个真实恶意程序行为数据集上的实验结果表明,ECS-SVDD的性能较单个支持向量数据描述及同类单类学习方法更优.该方法可直接推广到其他最小包含体积集合类型的单类学习算法上,以增强单类学习算法处理多模态和多密度分布数据的能力.
- 刘家辰苗启广宋建锋曹莹
- 关键词:聚类分析支持向量数据描述
- 基于混合多样性生成与修剪的集成单类分类算法被引量:9
- 2015年
- 针对传统集成学习方法直接应用于单类分类器效果不理想的问题,该文首先证明了集成学习方法能够提升单类分类器的性能,同时证明了若基分类器集不经选择会导致集成后性能下降;接着指出了经典集成方法直接应用于单类分类器集成时存在基分类器多样性严重不足的问题,并提出了一种能够提高多样性的基单类分类器混合生成策略;最后从集成损失构成的角度拆分集成单类分类器的损失函数,针对性地构造了集成单类分类器修剪策略并提出一种基于混合多样性生成和修剪的单类分类器集成算法,简称为PHD-EOC。在UCI标准数据集和恶意程序行为检测数据集上的实验结果表明,PHD-EOC算法兼顾多样性与单类分类性能,在各种单类分类器评价指标上均较经典集成学习方法有更好的表现,并降低了决策阶段的时间复杂度。
- 刘家辰苗启广曹莹宋建锋权义宁
- AdaBoost算法研究进展与展望被引量:264
- 2013年
- AdaBoost是最优秀的Boosting算法之一,有着坚实的理论基础,在实践中得到了很好的推广和应用.算法能够将比随机猜测略好的弱分类器提升为分类精度高的强分类器,为学习算法的设计提供了新的思想和新的方法.本文首先介绍Boosting猜想提出以及被证实的过程,在此基础上,引出AdaBoost算法的起源与最初设计思想;接着,介绍AdaBoost算法训练误差与泛化误差分析方法,解释了算法能够提高学习精度的原因;然后,分析了AdaBoost算法的不同理论分析模型,以及从这些模型衍生出的变种算法;之后,介绍AdaBoost算法从二分类到多分类的推广.同时,介绍了AdaBoost及其变种算法在实际问题中的应用情况.本文围绕AdaBoost及其变种算法来介绍在集成学习中有着重要地位的Boosting理论,探讨Boosting理论研究的发展过程以及未来的研究方向,为相关研究人员提供一些有用的线索.最后,对今后研究进行了展望,对于推导更紧致的泛化误差界、多分类问题中的弱分类器条件、更适合多分类问题的损失函数、更精确的迭代停止条件、提高算法抗噪声能力以及从子分类器的多样性角度优化AdaBoost算法等问题值得进一步深入与完善.
- 曹莹苗启广刘家辰高琳
- 关键词:BOOSTINGADABOOST泛化误差
- 一种快速生成DSM的不规则三角网构网新方法被引量:5
- 2014年
- 针对目前存在的不规则三角网(triangulation irregular network,TIN)构网效率较低的问题提出了一种新的生成数字表面模型(digital surface model,DSM)的构网方法。首先,通过建立虚拟格网和格网插值,在线性时间内快速建立初始三角网。然后,对初始三角网中局部少量数据优化得到最终的TIN。最后,对数据进行冗余处理和密集处理,构造高分辨率的DSM。实验结果表明,该算法的构网效率高于当前存在的TIN构网方法,对于大数据量的DSM生成具有良好的适用性。
- 苗启广史俊杰刘天歌师顿
- 关键词:数字表面模型不规则三角网激光雷达DELAUNAY三角网
- 微博个性化转发行为预测新算法被引量:3
- 2016年
- 目前,对微博转发行为预测主要是对所有微博用户的历史数据进行学习,从而得到转发模型.但是这类模型需要对所有用户的转发行为进行全局预测,存在同质性且无法对具体用户进行个性化预测的缺陷.针对这些问题,提出了基于多任务学习的个性化微博转发行为预测算法.对新浪微博进行了数据抓取、分析和特征选择,根据社会学中影响力的理论,针对微博用户之间进行社交信息交流而导致相互影响的特点,引入了多任务学习方法,以逻辑回归预测模型作为基准算法,将预测模型分为全局模型与个性模型进行学习.预测模型把对每个用户转发行为的预测对应为多个任务,根据微博用户间的社交交互对这些任务进行关联.实验结果表明,所提出的模型能够有效地对单个用户的微博转发行为进行预测,并且提高了转发行为预测的准确率.
- 唐兴权义宁宋建锋邓凯朱海苗启广
- 关键词:多任务学习个性化社交网络数据挖掘