黑龙江省自然科学基金(F200901)
- 作品数:29 被引量:236H指数:12
- 相关作者:杨静张健沛谢志强李文平张乐君更多>>
- 相关机构:哈尔滨工程大学哈尔滨理工大学福州大学更多>>
- 发文基金:国家自然科学基金黑龙江省自然科学基金国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术一般工业技术天文地球更多>>
- 虚拟样本生成技术研究被引量:16
- 2011年
- 虚拟样本生成技术主要研究如何利用待研究领域的先验知识并结合已有的训练样本构造辅助样本,扩充训练样本集,提高学习器的泛化能力。作为一种在机器学习中引入先验知识的方法,虚拟样本生成技术已经成为提高小样本学习问题泛化能力的主要手段之一,受到了国内外学者广泛研究。首先介绍了虚拟样本的概念,给出了衡量虚拟样本生成技术性能的两个指标,讨论了虚拟样本生成技术对学习器泛化能力的影响。然后根据虚拟样本生成技术的本质将其划分为3类,并针对每一类讨论了几种典型的虚拟样本生成技术,进而指出了现有虚拟样本生成技术存在的一些不足。最后进行总结并对虚拟样本生成技术的进一步发展提出了自己的看法。
- 于旭杨静谢志强
- 关键词:先验知识泛化能力
- 半监督聚类的匿名数据发布被引量:6
- 2011年
- 为增强个体与隐私信息的保护力度,提高数据效用和降低时间代价,提出半监督聚类的(α,k)匿名模型,并设计算法予以实现,分析了算法时间复杂度.针对数据集包含数值属性和分类属性的特点,把数值属性和分类属性映射到相同的度量空间进行运算,以相异矩阵表示数据集元组之间的距离,使相同或者相近的元组有效地聚集到同一个簇内.把高敏感度属性设置较高的保护度,低敏感度设置较低的保护度,实现了敏感属性的个性化保护.实验结果表明,半监督(α,k)匿名模型可安全且高效地实现隐私保护,保证了发布数据的质量.
- 杨高明杨静张健沛
- 关键词:数据发布隐私保护聚类
- 基于Johnson-Lindenstrauss转换的数据流降维方法被引量:1
- 2013年
- 为了解决高维数据流降维处理中对实时性要求较高的问题,提出了一种基于JohnsonLindenstrauss转换的数据流降维方法,并论证了在异步数据流情况下该方法的有效性。该方法通过一个去随机化的Johnson-Lindenstrauss转换,在保护任意两点数据之间距离的约束下将高维空间的数据流投影到低维空间,使用种子生成随机哈希函数,由哈希函数构造随机转换矩阵,在数据更新的同时进行降维处理。该方法有效地降低了计算复杂度,实现了亚线性时间的数据流降维处理。实验结果表明:该方法在保证了准确性的情况下提高了执行效率。
- 杨静赵家石张健沛
- 关键词:人工智能
- 利用改进遗传算法进行复杂网络社团发现被引量:8
- 2013年
- 针对使用遗传算法进行复杂网络社团发现时,存在较强随机性以及容易陷入局部最优解的缺陷,提出一种基于遗传框架的复杂网络社团发现新方法.其通过一次迭代标签传播方法进行种群初始化,针对字符串表示法交叉困难的特点提出了统一标签交叉策略,并采用有指向性的变异策略解决遗传算法随机变异的缺陷问题.实验结果表明:对典型的人工生成网络结构和真实网络结构,该方法能够较准确地发现社团结构;与经典算法进行比较,该方法具有较高的社团发现精度且收敛速度较快.
- 邓琨张健沛杨静
- 关键词:复杂网络社团发现遗传算法
- 大数据典型相关分析的云模型方法被引量:26
- 2013年
- 针对传统大数据典型相关分析(CCA,canonical correlation analysis)方法的高复杂度在面临大数据PB级数据规模时不再适应的现状,提出了一种基于云模型的大数据CCA方法。该方法在云计算架构的基础上,通过云运算将各端点云合并为中心云,并据此产生中心云滴,以中心云滴作为大数据的不确定性复原小样本,在其上施以CCA运算,中心云滴的较小数据量提高了运算效率。在真实数据集上的实验结果验证了该方法的有效性。
- 杨静李文平张健沛
- 关键词:大数据云模型云计算
- 基于秩2更新的多维数据流典型相关跟踪算法被引量:6
- 2012年
- 现存的多维数据流典型相关分析(Canonical Correlation Analysis,简称CCA)算法主要是基于近似技术的求解方法,本质上并不是持续更新的精确算法.为了能在时变的环境中持续、快速而精确地跟踪数据流之间的相关性,本文提出一种多维数据流典型相关跟踪算法TCCA.该算法基于秩2更新理论,通过并行方式持续更新样本协方差矩阵的特征子空间,进而实现多维数据流典型相关的快速跟踪.理论分析及仿真实验结果表明,TCCA具有较好的稳定性、较高的计算效率和精度,可以作为基本工具应用于数据流相关性检测、特征融合、数据降维等数据流挖掘领域.
- 杨静李文平张健沛
- 关键词:多维数据流特征子空间
- 存在设备无关延迟约束的综合柔性调度算法被引量:15
- 2011年
- 针对加工和装配综合的柔性调度中忽略工序间存在设备无关延迟约束导致调度结果不精确的问题,提出存在设备无关延迟约束的综合柔性调度算法。该算法通过将设备无关延迟时间转换为设备无关延迟工序,提出存在设备无关延迟约束的综合柔性调度工艺模型;通过将设备无关延迟约束工序转换为顺序约束工序的策略,将存在设备无关延迟约束的柔性加工问题转换为一般柔性加工问题;对一般柔性加工问题采用短用时策略和设备均衡策略确定标准工序的加工设备,将一般柔性加工问题简化为一般综合调度问题并用长路径优先策略调度;对于路径长度相等且在同一设备上加工的标准工序,提出调度前续短路径策略选择调度工序。实例表明,该算法通过考虑设备无关延迟约束时间使综合柔性调度的结果更精确并且能减少产品总的加工时间。
- 谢志强邵侠杨静
- 一种基于约束的半监督聚类查询扩展方法
- 2013年
- 针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法。该方法对初检结果的前k个文档进行人工标注,分成相关文档与不相关文档两类;并利用一种半监督聚类算法对初检结果的前n个文档进行分析,提取出与查询相关的文档作为反馈文档。该方法通过对少量标注文档与查询相关性的学习,能够较准确地估计出大量未知文档与查询的相关性,提高反馈文档的质量,从而有效提高检索的查全率和查准率。实验结果表明,该方法比传统的伪相关反馈和基于无监督聚类的伪相关反馈有更优的检索性能。
- 杨静刘宁张键沛
- 关键词:信息检索查询扩展约束聚类半监督聚类
- 数据发布中的个性化隐私匿名技术研究被引量:12
- 2012年
- 个性化隐私保护是目前数据发布中隐私泄露控制技术研究的热点问题之一。对这方面的研究现状进行综述。首先,在分析不同类型个性化服务需求的基础上,建立相应的个性化隐私匿名模型;其次,根据采用技术的不同,对已有的个性化隐私保护匿名技术进行总结,并对各类技术的基本原理、特性进行概括性的阐述。同时,根据算法所采用信息度量的差异,给出现有个性化隐私度量的方法与标准。最后,在对比分析已有研究的基础上,总结全文并展望了个性化隐私保护匿名技术的进一步研究方向。
- 王波杨静
- 关键词:数据发布个性化隐私保护
- 存在批量为2的批处理设备的综合调度算法被引量:5
- 2011年
- 提出求解存在加工批量为2的批处理设备的复杂单产品综合调度算法.该算法根据复杂产品具有的树状工艺结构的特点,先采用已有的优先级、短用时和长路径策略调度工序;当工序属于批处理设备时,再采用长路径、临界时间等待和先行工序短用时策略.理论分析和实例表明,提出的算法不仅能够解决存在加工批量为2的批处理设备的复杂单产品综合调度优化问题,而且复杂度不超过二次多项式.
- 谢志强王悦杨静
- 关键词:综合调度