浙江省自然科学基金(LR13F020001)
- 作品数:6 被引量:74H指数:4
- 相关作者:陈为陶煜波汪飞左伍衡吴斐然更多>>
- 相关机构:浙江大学浙江工业大学杭州电子科技大学更多>>
- 发文基金:浙江省自然科学基金国家自然科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于可视界面的社交媒体搜索系统被引量:2
- 2015年
- 针对社交媒体数据搜索中存在的消息文本短、不利于构建索引,排名列表形式单一、无法展现社交媒体数据的整体结构的问题,通过挖掘社交媒体数据隐含的多重语义特征,强化索引结构,提出基于可视分析方法的搜索系统,采用交互式界面可视化表达语义特征,使得搜索更准确.以推特数据为研究对象,基于时间上的语义相关性,首先抽取数据中隐含的话题和命名实体集合;在此基础上构建层次语义图模型,简化数据的内在语义关系,同时为可视化搜索提供必要的索引结构;用户浏览数据时,分裂环形图表示数据的多重语义特征,系统提供多种交互方式方便用户探索更多信息.案例分析结果表明,相对于连线和气泡图特征模式,分裂环形图更加明显,方便用户寻找关注的消息;用户调查结果反映出该方法较传统的搜索方式更容易找到想要的结果.
- 汪飞陈为陶煜波鲍虎军
- 关键词:搜索系统
- 可视化驱动的交互式数据挖掘方法综述被引量:41
- 2016年
- 数据挖掘是一种从大量数据中发现信息的过程,其大量依赖自动算法的特质,使得用户难以对数据和算法过程本身直观地进行理解、探索和优化.近年来,随着可视化领域的蓬勃发展,有很多工作开始探究如何使用可视化方法辅助数据挖掘过程,使用户更加直观地理解数据,并对数据和算法和进行探索.文中首先对数据挖掘和可视化在知识提取流程进行比较分析,并从可视化增强的通用数据挖掘方法和面向应用场景的方法 2个方面对近年相关技术进行梳理总结,并依托一些相关主题的国际会议内容指出需要进一步探索的方向.
- 马昱欣曹震东陈为
- 关键词:可视化数据挖掘
- 可视数据清洗综述被引量:19
- 2015年
- 目的数据清洗是一个长期存在并困扰人们的问题,随着可视化技术的发展,可视数据清洗必将成为数据清洗的重要方法之一。阐述数据的主要质量问题和可视数据清洗的过程,回顾可视数据清洗的研究现状(包括数据质量问题的来源、分类以及可视数据清洗方法),并根据已有文献总结可视数据清洗面临的主要挑战和机遇。方法由于数据清洗的方法和策略与具体的数据质量问题相关,因此本文以不同的数据质量问题为线索来归纳和评述可视数据清洗的方法和策略。结果根据数据质量问题的不同,将可视清洗方法归纳为直接可视清洗、可视缺失数据、可视不确定数据、可视数据转换和数据清洗资源共享等,并依据不同的数据质量问题归纳总结出相应问题所面临的挑战和可进一步研究的方向。结论对可视数据清洗的归纳、总结和展望,并指出在数据清洗领域中可视数据清洗将会是未来最有前景的研究方向之一。
- 王铭军潘巧明刘真陈为
- 关键词:数据清洗信息可视化数据分析
- 空间旋转对称场可视分析
- 2014年
- 构建旋转对称场是生成多面体网格的一个关键步骤,而空间旋转对称场的模式复杂,缺乏有效的可视化与特征分析手段.为此,提出一套基于参数化的空间旋转对称场表达、可视化与分析方法.首先对对称场进行规则化采样,再对规则化的对称场进行局部区域形状重建,以获取局部区域的近似标量场表达;进而使用Zernike描述算子将该局部标量场分解为一系列旋转无关的特征参数,逐区域地处理整个对称场,将之转化为多变量标量数据;最后采用多变量可视化方法进行可视分析和特征抽取.计算实例的应用结果表明,该方法能有效地对空间旋转对称场进行可视分析,抽取出用户感兴趣的特征.
- 丁治宇吴斐然陈海东黄劲左伍衡陈为
- 关键词:多变量特征抽取
- 多变量空间数据场可视化综述被引量:7
- 2013年
- 多变量空间数据场可视化在计算流体力学、燃烧模拟、医学影像和气象仿真等科学领域有着重要的应用,其目的是分析和表达数据场中多个属性及其相互关系,通过可视界面呈现并探索复杂空间数据中的多变量演化规律.文中先介绍多变量三维空间数据场的概念及其与传统三维空间数据场的差异,再结合多变量空间数据场可视化流水线,从多变量三维空间数据场的数据表达与分析、多变量三维空间数据场的可视化与交互2个方面总结已有研究工作,并结合当前研究现状展望潜在的发展方向.
- 丁治宇陈海东吴斐然陶煜波左伍衡陈为
- 关键词:多变量可视化特征抽取统计分析
- 用户驱动的微博可视化搜索被引量:5
- 2015年
- 目的微博作为一个社交与信息分享平台,日信息量数以亿计,如何高效地搜索用户感兴趣的信息成为亟待解决的问题。提出了一个新颖的用户驱动的可视化微博信息搜索方法。方法采用特征词及其权重来建模用户的兴趣特征,并基于此建立用户与特征词之间的相关关系。搜索微博信息时,首先定位与检索词相关的微博用户,在相关微博用户的微博中筛选与搜索相关的微博。另外,采用关注度传递算法对搜索进行扩展,将返回的特征词和微博用户进行可视化展示,并提供交互供用户查看与选定特征词或用户相关的微博。结果实验结果表明,基于本文方法,用户可以高效地定位感兴趣的微博信息。结论以用户作为桥梁,大大缩小了微博信息的搜索范围,同时采用关注度传递算法对搜索进行扩展,对结果进行可视化展示。实验表明本文方法能够使用户快速搜索出感兴趣的信息。
- 周霞娟汪飞金玲陈为王章野
- 关键词:扩展查询