国家自然科学基金(90818001)
- 作品数:9 被引量:204H指数:6
- 相关作者:李庆忠孔兰菊李晓娜史玉良丁艳辉更多>>
- 相关机构:山东大学青岛大学人力资源社会保障部更多>>
- 发文基金:国家自然科学基金山东省自然科学基金国家科技支撑计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于路径索引的XML小枝模式匹配方法
- 小枝模式匹配作为XML查询的核心操作,目前在该方面已经提出了一系列有效的实现方法.在总结分析先前各种匹配算法的基础上,提出了一种新的基于路径索引的解决方法TwigFilter,该方法是一个单阶段算法,避免了路径归并.同时...
- 胡叶洪晓光王兰野
- 关键词:XML路径索引
- 文献传递
- 基于聚类分析的Web服务分类及抽象方法研究
- 当前的Web服务注册架构缺少能够高效、准确、充分发现服务的分类管理机制,导致业务需求不能满足,造成服务资源浪费.针对某一特定领域,进行Web服务的分类管理显得格外重要.本文提出了一种基于聚类分析的方法,辅助对特定领域的W...
- 崔立真田君杰王海洋
- 关键词:WEB服务聚类
- 文献传递
- 面向SaaS应用的数据组合隐私保护机制研究被引量:38
- 2010年
- 软件即服务(SaaS)模式下,业务应用和数据库部署在非完全可信的服务运营商的平台上,租户数据的隐私保护成为SaaS模式应用和推广中一个极大的问题和挑战.基于明文状态下不同SaaS数据属性组合泄露隐私程度的不同,提出一种面向SaaS应用的数据组合隐私保护机制.该隐私保护机制支持租户自定制隐私约束,用来描述数据组合隐私保护需求,将SaaS数据属性切分到不同的数据分块中,利用可信第三方实现数据切片间关联关系的混淆和重构,并基于伪造数据,确保同一数据分块内部数据切片分布的均衡化,实现SaaS数据组合隐私保护和实用性的有效结合.通过分析,证明了隐私保护机制的合理性,并通过实验验证了该隐私保护机制的实用性.
- 张坤李庆忠史玉良
- 关键词:软件即服务隐私保护数据分块
- 一种基于证据理论和任务分配的Deep Web查询接口匹配方法被引量:2
- 2011年
- 针对已有查询接口匹配方法匹配器权重设置困难、匹配决策缺乏有效处理的局限性,提出一种基于证据理论和任务分配的DeepWeb查询接口匹配方法.该方法通过引入改进的D-S证据理论自动融合多个匹配器结果,避免手工设定匹配器权重,有效减少人工干预.通过对任务分配问题进行扩展,将查询接口的一对一匹配决策问题转化为扩展的任务分配问题,为源查询接口中的每一个属性选择合适的匹配,并在此基础上,采用树结构启发式规则进行一对多匹配决策.实验结果表明ETTA-IM方法具有较高的查准率和查全率.
- 董永权李庆忠丁艳辉张永新
- 关键词:DEEPWEB数据集成
- 基于Chunk Folding的多租户数据库缓存管理机制被引量:11
- 2011年
- Chunk Folding是SaaS模式下常用的存储架构之一,通过共享数据库共享架构来存储租户的数据以获取规模经济效益,但基于传统数据库搭建的Chunk Folding共享存储架构,其缓存管理机制缺乏良好的多租户特性,导致数据库性能恶化,租户的SLA得不到保障.为此,提出了基于Chunk Folding的自适应多租户缓存管理机制,该机制以租户的SLA需求作为驱动,依据租户当前访问模式,动态生成缓存单元集并计算缓存单元集的I/O效益,通过贪婪算法来选择缓存单元集,使得租户SLA得到满足的同时最小化缓存资源的消耗.通过实验分析证明了该缓存管理机制的有效性.
- 姚金成张世栋史玉良李庆忠
- 关键词:缓存管理SLA
- 元数据驱动的SAAS应用交付平台
- 随着SaaS的兴起,支持ISV方便快捷的构建SaaS应用的平台即服务(PaaS)理念也发展起来。本文设计并实现了一个元数据驱动的SaaS应用交付平台,该平台通过元数据驱动的映射转换机制支持ISV在传统开发环境中离线开发遵...
- 孔兰菊李庆忠郑旭旭陈维良
- 关键词:SAAS元数据驱动映射机制
- 云计算环境下面向数据密集型应用的数据布局策略与方法
- 云计算环境下面向流程的数据密集型应用已被广泛应用于多个领域.面对多数据中心的云计算环境,这类应用在数据布局方面遇到了新的挑战,主要表现在如何减少跨数据中心的数据传输、如何保持数据间的依赖性以及如何在提高效率的同时兼顾全局...
- 郑湃崔立真王海洋徐猛
- 关键词:云计算数据依赖
- 文献传递
- 云计算环境下面向数据密集型应用的数据布局策略与方法被引量:122
- 2010年
- 云计算环境下面向流程的数据密集型应用已被广泛应用于多个领域.面对多数据中心的云计算环境,这类应用在数据布局方面遇到了新的挑战,主要表现在如何减少跨数据中心的数据传输、如何保持数据间的依赖性以及如何在提高效率的同时兼顾全局的负载均衡等.针对这些挑战,文中提出一种三阶段数据布局策略,分别针对跨数据中心数据传输、数据依赖关系和全局负载均衡三个目标对数据布局方案进行求解和优化.实验显示,文中提出的数据布局策略具有良好的综合性能,特别是在降低流程执行过程中由跨数据中心数据传输所导致的时间开销方面,效果尤为明显.
- 郑湃崔立真王海洋徐猛
- 关键词:云计算数据依赖
- 基于集成学习和二维关联边条件随机场的Web数据语义标注方法被引量:6
- 2010年
- 大规模Web信息抽取需要准确、自动地从众多相关网站上抽取Web数据对象.现有的Web信息抽取方法主要针对单个网站进行处理,无法适应大规模Web信息抽取的需要.调查研究表明,有效地实现Web数据语义自动标注,结合现有的包装器生成技术,可以满足大规模Web信息抽取的要求.文中提出一种基于集成学习和二维关联边条件随机场的Web数据语义自动标注方法,首先,利用已抽取的信息和目标网站训练页面中呈现的特征构造多个分类器,使用Dempster合成法则合并分类器结果,区分训练页面中的属性标签和数据元素;然后,利用二维关联边条件随机场模型对Web数据元素间的长距离依赖联系和短距离依赖联系进行建模,实现数据元素的自动语义标注.通过在多个领域真实数据集上的实验结果表明,所提出的方法可以高效地解决Web数据语义自动标注问题,满足大规模Web信息抽取的需要.
- 丁艳辉李庆忠董永权彭朝晖
- 关键词:WEB信息抽取语义标注条件随机场
- 一种面向SaaS应用多级定制模型的缓存技术研究被引量:1
- 2011年
- 对共享架构共享存储的SaaS应用来说,如何实现SaaS应用数据低代价高速查询一直是其中的焦点问题之一。在元数据驱动的SaaS应用多级定制模型中,定制元数据存在层次关系,查询代价较高,普通的数据查询优化机制不足以实现SaaS应用的性能优势。采用元数据传递闭包策略解决该问题,针对多级定制的SaaS应用的特点,提出面向租户的两级缓存模型及查询代价最小的最近最少使用缓存替换算法(Min-QT-LRU算法),实验结果表明,该策略能支持更高效的元数据访问。
- 孙明孔兰菊李庆忠桑成良郑旭旭
- 关键词:元数据缓存替换