国家重点基础研究发展计划(2010CB327903)
- 作品数:16 被引量:192H指数:6
- 相关作者:路通郭延文周志华商琳高阳更多>>
- 相关机构:南京大学江苏省高级人民法院南京航空航天大学更多>>
- 发文基金:国家重点基础研究发展计划国家自然科学基金江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 用于入侵检测及取证的冗余数据删减技术研究被引量:12
- 2014年
- 近年来计算机犯罪逐年增多,并已成为影响国家政治、经济、文化等各个领域正常发展的重要因素之一。入侵检测技术与入侵取证技术对于打击计算机犯罪、追踪入侵、修补安全漏洞、完善计算机网络安全体系具有重要意义。但是,随着网络的普及以及计算机存储能力的提升,入侵检测及取证技术目前需要分析的往往是GB乃至TB级的海量数据,而且有用信息往往湮没在大量由正常系统行为触发的冗余事件之中。这无疑给分析过程带来了巨大的挑战,也使分析结果的准确性不高。因此,如何设计出一种自动冗余数据删减技术来提高入侵检测及取证方法的准确率及效率,是当前入侵检测和取证领域的关键问题之一。文中即对这方面已有的研究工作进行了综述,首先介绍了冗余数据删减技术的发展历程及其在医学数据分析等传统领域的应用,然后重点介绍了针对入侵检测和入侵取证的现有各种冗余数据删减方法,最后通过对当前冗余数据删除技术的比较,指出了该领域当前存在的问题及未来的研究方向。
- 钱勤张瑊张坤伏晓茅兵
- 关键词:入侵检测入侵取证
- 基于GPU加速的音频检索技术
- 2014年
- 由于数字音频数据量极大的特点,采用传统音频检索方法会导致等待时间过长。为加快音频检索时间,提出一种基于GPU加速的数字音频检索方法。利用数字音频的特征将连续的音频划分成等长的多个短时音频段,采用GPU加速算法计算每个短时音频段的特征值,将各段的特征值构成特征矩阵。使用后缀数组的变形算法找出2个特征值序列的公共特征段落集合,并将公共特征段落集合进行精化和整体匹配,从而得出检索结果。实验结果表明,该检索方法的准确率可以达到95%以上,与已有方法相比,可以大幅度地提高检索速度,加速比可以达到10倍以上。
- 金国平余宗桥郭延文蒋和
- 关键词:音频检索GPU加速后缀数组音频特征
- 面向内容的工程图识别与理解综述被引量:2
- 2012年
- 对工程图识别与理解研究现状进行深入和系统的综述。工程图识别与理解的核心在于利用知识表示、图形匹配、符号识别、几何推理、语义提取等技术,自动获取工程图中各种显式描述(如几何图元、工程符号、工程对象等)及隐式信息(如设计语义等)。分别对工程图矢量化、工程符号识别及工程对象识别进行了系统分析。在此基础上对工程图识别性能评测、基准库等进行总结。最后对现有研究的难点及进一步研究方向进行了展望。
- 路通蔡士杰
- 关键词:工程图知识表示矢量化
- 基于适应性相关测试和点斜式查表求交的圆形窗口快速裁剪方法
- 2012年
- 在智能CAD、图形识别与理解等复杂图形应用系统中,由于图元数量多、图元间关系复杂,且系统实时交互响应要求较高,现有圆形窗口裁剪算法较难满足要求。为此提出圆形窗口对线段的一种新的快速裁剪算法。该算法由基于切线分隔的圆外线段快速适应性测试方法、基于最小范围的圆内线段测试方法和基于点斜式查表的线段与窗口圆快速求交方法三部分组成。通过按端点位置选择适应的测试方法、尽量避免不必要的操作、尽量以简单操作代替复杂操作等措施,大大提高了圆形窗口对线段的裁剪速度。在图形识别及智能CAD等应用中的实验结果表明,采用文中算法可较大地提高效率。
- 路通苏丰杨若瑜
- 关键词:查表
- 基于分歧的半监督学习被引量:86
- 2013年
- 传统监督学习通常需使用大量有标记的数据样本作为训练例,而在很多现实问题中,人们虽能容易地获得大批数据样本,但为数据提供标记却需耗费很多人力物力.那么,在仅有少量有标记数据时,可否通过对大量未标记数据进行利用来提升学习性能呢?为此,半监督学习成为近十多年来机器学习的一大研究热点.基于分歧的半监督学习是该领域的主流范型之一,它通过使用多个学习器来对未标记数据进行利用,而学习器间的"分歧"对学习成效至关重要.本文将综述简介这方面的一些研究进展.
- 周志华
- 关键词:半监督学习
- 基于粗糙集方法的共指消解
- 选择合适的特征是共指消解任务中一个重要的组成部分。特征不是越多越好,反映本质的特征很重要;对于不同种类的语料,一个公共的特征集往往难以适应,为了提高特征对语料的针对性,对不同的语料应选择不同的特征。本文基于上述观点,采用...
- 贾修一张亚兵陈家骏商琳
- 关键词:共指消解粗糙集理论
- 文献传递
- 面向Windows操作系统的内存取证技术研究被引量:2
- 2014年
- 传统的计算机取证方法收集被攻击的计算机磁盘等能持久化保存数据的介质。但是随着磁盘存储能力的提升以及数据加密等技术的发展,使用原来针对硬盘的取证方法获取数据进行分析变得越来越困难。对计算机的取证开始采用其他数据源,包括计算机内存中易失性的信息。对Windows操作系统的主要内存获取、分析方法以及内存取证过程进行介绍,采用分析和对比的手段对每种方法的特点、优势和不足进行比较,得出比较结果并给出计算机犯罪内存取证领域未来需要研究的方向。
- 钱勤董步云唐哲伏晓茅兵
- 关键词:网络犯罪计算机取证内存分析
- 一种基于正则化的半监督多标记学习方法被引量:18
- 2012年
- 多标记学习主要用于解决单个样本同时属于多个类别的问题.传统的多标记学习通常假设训练数据集含有大量有标记的训练样本.然而在许多实际问题中,大量训练样本中通常只有少量有标记的训练样本.为了更好地利用丰富的未标记训练样本以提高分类性能,提出了一种基于正则化的归纳式半监督多标记学习方法——MASS.具体而言,MASS首先在最小化经验风险的基础上,引入两种正则项分别用于约束分类器的复杂度及要求相似样本拥有相似结构化多标记输出,然后通过交替优化技术给出快速解法.在网页分类和基因功能分析问题上的实验结果验证了MASS方法的有效性.
- 李宇峰黄圣君周志华
- 关键词:多标记学习半监督学习网页分类基因功能分析
- 样本驱动的半自动图像集前背景分割被引量:6
- 2013年
- 图像集的前背景分割是近年来图像处理与图形学领域的一项热点研究工作.针对图像集中的图像逐个进行交互分割会涉及大量的用户操作,导致效率低下,而联合分割方法通常局限于处理具有相似前景的图像集,且因需求解大规模的优化问题较为耗时的问题,提出一种样本驱动的半自动图像集分割方法.首先选取若干图像作为样本进行手动交互分割,训练基于样本图像超像素特征描述的支持向量机分类器;对于其余待分割图像,根据其超像素特征描述到支持向量机分隔超平面的距离计算基于双弯曲Sigmoid函数映射的前景置信度,再采用图切割的算法实现目标图像的快速自动分割.对于包含错误分割的个别图像,进一步提出一种交互式局部修正方法修复错误分割区域,并获得最终的精确分割结果.在2个标准数据集上进行算法有效性验证和对比实验的结果表明,与联合分割算法相比,文中方法能更好、更快地实现在线分割;与逐个交互分割算法相比,文中方法能以相对较小的交互量实现对目标图像集的精确分割.
- 汪粼波郭延文夏天辰金国平
- 关键词:图像分割支持向量机
- 基于查表的快速圆弧裁剪算法被引量:1
- 2011年
- 在智能CAD、图形识别与理解等复杂图形应用系统中,由于图元数量多、图元间关系复杂,且系统实时交互响应要求较高,现有圆弧裁剪算法较难满足要求.为此提出一种从2个角度大幅提高圆弧裁剪效率的快速圆弧裁剪算法.首先按圆弧与矩形裁剪窗口的位置关系,通过所在圆、圆弧、分割后的各象限圆弧段与裁剪窗口最多进行三层次适应性相关测试,以较少的操作尽可能多地排除与裁剪窗口不相交的圆弧;其次对剩余的、需通过求交操作完成裁剪的圆弧给出基于查表法的圆弧-直线交点获取方法,避免了复杂的开方操作,可快速获取裁剪结果.在图形识别及智能CAD等应用中的实验结果表明,采用文中算法可较大地提高效率.
- 路通蔡士杰
- 关键词:圆弧查表