孙乐 作品数:7 被引量:3 H指数:1 供职机构: 上海海洋大学 更多>> 发文基金: 国家自然科学基金 上海市自然科学基金 更多>> 相关领域: 自动化与计算机技术 环境科学与工程 更多>>
面向Tabular库的数据模型及其查询问题 信息化的发展使得数据存储及表示形式呈现出分布性、异构性的特点,不仅包括关系数据库、面向对象数据库等传统结构化数据,还包括Excel、CSV等不具有明确结构的特殊非结构化数据等,与此同时,其数据呈现了量大、更新快、可用性弱... 黄冬梅 孙乐 赵丹枫海洋环境监测数据建模及索引技术研究 近年来,随着信息技术的不断更新,尤其是信息获取技术、互联网、物联网以及社交网络等技术的突飞猛进,导致了各行业数据量的急剧增长,企业及互联网数据以每年50%的速率在增长,据保守估计,目前每年全球至少产生15亿TB的新数据,... 孙乐关键词:数据建模 数据索引 数据划分 基于ADMD融合策略的海洋大数据索引技术研究 被引量:1 2015年 海洋数据具有多源、多类、多维、海量等特点,是一种典型的大数据,海洋大数据上的快速查询是该领域各类应用的基本需求.提高查询速度的关键是建立一个完善的索引结构,为此提出了一种基于时间间隔B+-tree和HSP-tree的多层索引架构ML-index(multi-layer index),分别制定样本驱动的数据融合机制(adaptive method of data merging strategy)以确定分布式时态数据分区;并基于海洋数据特性、数据单元饱和度等,提出了一种自适应空间划分方法(adaptive space partition),在此基础上建立HSP-tree作为辅助索引.实验验证在海洋数据模式下,提出的多层索引结构保证了海洋数据的查询速度,逼近线性的时间复杂度. 黄冬梅 孙乐 赵丹枫基于Spark云网络的海洋大数据主从索引系统及方法 本发明涉及一种基于Spark云网络的海洋大数据主从索引系统及方法,尤其适用于具有空间自相关性、强相似性、实时等特点的海洋大数据;将大数据时代物联网、云计算等技术应用于分布式索引领域,以物联网作为海洋信息采集的触角,依托聚... 黄冬梅 赵丹枫 孙乐 郑小罗 徐慧芳 许琼琼基于ADMD融合策略的海洋大数据索引技术研究 海洋数据具有多源、多类、多维、海量等特点,是一种典型的大数据,海洋大数据上的快速查询是该领域各类应用的基本需求。提高查询速度的关键是建立一个完善的索引结构,本文提出了一种基于时间间隔B+-tree和HSP-tree的多层... 黄冬梅 孙乐 赵丹枫基于Spark云网络的海洋大数据主从索引系统及方法 本发明涉及一种基于Spark云网络的海洋大数据主从索引系统及方法,尤其适用于具有空间自相关性、强相似性、实时等特点的海洋大数据;将大数据时代物联网、云计算等技术应用于分布式索引领域,以物联网作为海洋信息采集的触角,依托聚... 黄冬梅 赵丹枫 孙乐 郑小罗 徐慧芳 许琼琼文献传递 面向Tabular库的数据模型及其查询问题 被引量:1 2016年 信息化的发展使得数据存储及表示形式呈现出分布性、异构性的特点,不仅包括关系数据库、面向对象数据库等传统结构化数据,还包括Excel、CSV等不具有明确结构的特殊非结构化数据等,与此同时,其数据呈现了量大、更新快、可用性弱等大数据特点.然而使用无结构和半结构化文档组织和管理Excel等表单数据,存在着数据弱可控、弱可用、及访问效率差的问题.针对该类问题,本文以Excel文本为数据源,提出了一种新的面向Tabular库的关系数据模型并讨论了其上的查询及优化问题.首先,给出了Tabular表单数据的形式化定义,其次,设计PartiPath划分树实现表格的关系划分及结构转换,在关系模型的基础上,给出其数据模型及数据模式,再者,定义了表单数据上的基本查询问题及融合用户兴趣指数改进查询相似度指标,最后给出实验分析并作出总结. 黄冬梅 孙乐 石少华 苏诚 赵丹枫关键词:查询 数据模型