天津市应用基础与前沿技术研究计划(10JCZDJC16000)
- 作品数:6 被引量:7H指数:2
- 相关作者:石陆魁张军陈飞李金钊宫晓腾更多>>
- 相关机构:河北工业大学天津工业大学更多>>
- 发文基金:天津市应用基础与前沿技术研究计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于XML的WEB信息自动抽取方法的研究
- 2010年
- 互联网的快速发展以及Web数据的日益庞大,使用户从Web中获取有用信息变得日益困难,如何快速有效地从Web中准确抽取信息已经成为亟待解决的问题,Web信息抽取技术应运而生.提出了一种新的基于XML的WEB信息自动抽取方法,采用数据转换算法将HTML文档标准化,通过学习样本实例的XPATH表达式,形成抽取规则库,并利用规则库对其它同类页面实现信息的自动抽取.实验结果表明,该方法具有较高的查全率和查准率,且抽取结果具有自描述性,方便于建立各个领域的数据抽取系统.
- 宋洁张娜刘艳柳顾军华
- 关键词:XSL信息抽取DOM树
- 机器人势场平衡路径规划算法研究被引量:1
- 2013年
- 为使移动机器人按照某一性能指标搜索一条从起始点到目标点的无碰撞最优路径,提出了势场平衡路径规划算法,针对障碍物对机器人有排斥力且目标点对机器人有吸引力,利用障碍物对机器人的斥力值,建立障碍物环境地图,通过搜索斥力值与引力值之和的最小值,进行路径规划。同时,与滚动窗口路径规划算法相结合,完成动态环境下的路径规划。仿真实验表明,改进算法具有较强的全局与局部搜索能力,解决了势场法中易存在的局部极小值问题,使机器人能在复杂的动态环境中顺利避开障碍物,快速的以最优路径到达目标点。
- 张茜茜吴清石陆魁张蒙
- 关键词:动态环境路径规划
- 基于小世界模型的流形学习算法被引量:1
- 2010年
- 等距特征映射(ISOMAP)不仅计算复杂度很高,而且缺乏对新样本的学习能力。基于标志点的ISOMAP(L-ISOMAP)通过只保持一些标志点之间的测地线距离有效地降低了复杂度,然而标志点集的随机选择常常会导致较差的嵌入结果。为此,提出了一种基于小世界模型的流形学习算法。根据小世界模型的原理,该算法仅仅保持每个样本点与其k个最近邻和一些随机选择的远点之间的测地线距离,采用最速梯度下降法优化来得到数据的低维表示。理论分析表明,该算法的计算复杂度远远低于ISOMAP的复杂度。利用应力函数和剩余方差对3个算法进行了比较。实验结果表明,从该算法得到的结果与从ISOMAP得到的结果相近,且优于从L-ISOMAP得到的结果。同时,该算法可以实现对新样本的学习,对噪声也不太敏感。
- 石陆魁杨庆新
- 关键词:流形学习等距特征映射小世界模型
- 基于流形学习的基因微阵列数据分类方法被引量:1
- 2012年
- 提出了一种结合流形学习方法与分类算法的基因微阵列数据分类模型,先用流形学习算法对基因微阵列数据进行降维处理,然后再对降维后的数据进行分类.在实验中将流形学习算法LLE、ISO-MAP、LE和LTSA与三种分类算法相结合,并与直接用高维数据进行分类的结果进行了比较,实验结果表明所提出的模型极大地提高了分类精度,同时也提高了分类算法的执行效率.
- 李强石陆魁刘恩海王歌
- 关键词:流形学习基因微阵列数据
- 基于邻域保持的流形学习算法评价模型被引量:2
- 2012年
- 应力函数和残差只适合于评价距离严格保持的流形学习算法,dy-dx表示法又是一个定性模型。虽然距离比例方差可以比较和评价大多数的流形学习算法,但其需要计算测地线距离,具有较高的计算复杂度。为此,提出一种基于邻域保持的流形学习算法定量评价模型,该模型仅仅需要确定两个空间中每个对象的k个近邻,并计算出每个点在低维空间中的近邻保持情况,不用计算测地线距离。理论分析表明,邻域保持模型的计算复杂度远远低于距离比例方差的复杂度。在三个数据集上比较了两个模型的性能,实验结果表明,利用邻域保持模型不但可以评价同一算法在不同邻域参数下的嵌入效果,而且可以在不同的流形学习算法之间进行比较,并且其评价流形学习算法的性能优于距离比例方差。
- 石陆魁张军宫晓腾
- 关键词:流形学习应力函数
- 汇编语言程序相似性检测混合算法被引量:2
- 2011年
- 根据汇编语言自身的特点,提出了结合属性计数和结构度量技术的相似性检测混合算法。在该方法中,将程序段的数目、子程序定义和调用的次数、循环指令loop出现的次数、转移指令出现的次数作为结构信息,73个使用频率较高的关键字作为属性信息。在从汇编语言程序中提取这些信息后,利用卡方检验来判断2个程序的相似性。实验结果表明,从混合算法得到的结果与人工检测的结果相一致,优于从属性计数和结构度量技术得到的结果。
- 石陆魁张军陈飞李金钊
- 关键词:汇编语言抄袭