国家高技术研究发展计划(2009AA062803)
- 作品数:8 被引量:42H指数:3
- 相关作者:何震瀛陶岳张家琪廖松博宋道万更多>>
- 相关机构:复旦大学中国石油化工集团公司中国石油大学(北京)更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金国家科技重大专项更多>>
- 相关领域:自动化与计算机技术石油与天然气工程更多>>
- 油藏地质建模与数值模拟一体化应用技术被引量:24
- 2009年
- 油藏地质建模与数值模拟的一体化是指数据的一体化、研究过程的一体化以及人员协作的一体化,地质建模是数值模拟的基础,而数值模拟本身又是地质建模的深化。通过实例,论述了一体化的实现方法和应用效果。通过建立项目数据库,规范项目数据的标准,实现了项目数据的一体化;通过提供油藏描述各个环节及不同专业之间的良好接口,实现了研究过程的一体化;通过加强不同专业之间的交流与渗透,实现了专业技术研究人员协作的一体化。应用效果表明,油藏地质建模与数值模拟的一体化技术可提高工作效率近1倍,单井拟合率达到90%以上。
- 于金彪杨耀忠戴涛宋道万龚蔚青
- 关键词:地质建模数值模拟一体化历史拟合
- 一个分布式的短序列匹配系统
- 2011年
- CloudBurst是在MapReduce框架下实现的一种并行的序列匹配算法,旨在更快地处理由下一代DNA测序仪得到的大量的序列数据在参考基因序列上的匹配问题.然而,受限于开源的Hadoop实现框架,CloudBurst未能很好地解决负载平衡的问题,也无法在Map的同时开始Reduce的工作,造成计算资源的浪费.为此,提出了一个新的分布式短序列匹配系统D-RMAP,可以很好地解决CloudBurst的这2个问题.
- 曾劲张家琪何震瀛
- 关键词:分布式计算网络通信内存管理多线程并发
- HDCH:MapReduce平台上的音频数据聚类系统被引量:3
- 2011年
- 随着互联网上音乐数目的增长,如何对音乐进行分析、识别成为焦点问题.在音乐的识别过程中,需要对歌曲的帧数据进行聚类,数据的海量性与音乐数据本身的复杂性使得分析计算需要借助MapReduce平台多机并行完成.提出一种MapReduce平台上的音频数据聚类系统———HDCH,能够有效地对海量音频数据进行聚类.实验证明,HDCH具有很好的性能和可扩展性.除了音频数据外,HDCH还适用于所有海量高维数据的聚类分析.
- 廖松博何震瀛
- 关键词:高维数据聚类MAPREDUCE
- 基于组合分类器的地层含油情况智能决策系统
- 2011年
- 油气勘探是高风险、高投入的技术密集型、资金密集型产业.完井讨论决策是勘探决策中最重要的一步,而判断地层含油情况是其中最关键的技术之一.目前判断地层含油情况主要通过专家经验,人工进行判断.这种方法存在主观性较强,不易传承,耗时等缺点.针对这一问题,开发了一个基于组合分类器的地层含油智能决策系统:PClassifier.系统组合了决策树、支持向量机以及k最近邻分类方法等分类器,提高了分类的准确性.实验结果表明,采用组合方法能够对地层进行有效的判断,给决策人员带来极大的方便.
- 隋国华李春雷
- 关键词:油气勘探决策树
- 关系数据库上基于元组组合的关键字查询被引量:9
- 2011年
- 在传统的关系数据库上进行关键字查询已经成为近来数据库领域的研究热点,现有的工作都是以单个元组作为结果单元来返回.为了满足用户对于返回多元组的要求,提出了基于元组组合的关键字查询的概念,并通过返回元组组合来响应查询.通过对问题的分析得到了一系列启发式剪枝策略,设计了一个综合的优化算法.通过一系列真实数据集和人工数据集上的实验,验证了优化算法在绝大部分情况下比最初的算法在性能上有了显著的提高.
- 陶岳何震瀛张家琪
- 关键词:关键字查询组合查询候选集关系数据库
- 层次数据上关键字检索的结果聚合被引量:2
- 2011年
- 由于使用方便等优点,数据库上的关键字检索技术使用户可以得到所需信息而不必书写复杂的SQL语句.但大部分现有的检索方法都关注通过连接操作得到包含所有关键字的元组连接树,忽略了对于检索结果的信息整合,这从某种程度上影响了用户对于检索结果的判断.文中提出并实现一种改进的关键字检索系统框架,在具有层次结构的属性指导下对得到的元组连接树结果做聚合操作,通过寻找最低层次最小覆盖聚合将关系更为紧密的元组作为更加相关的检索结果反馈给用户.文中还提出了基本的聚合算法并对其做改进从而减少了系统的响应时间.同时,为了改善用户体验,文中定义并给出了检索结果的摘要问题及其算法,使用户最大程度地了解检索结果.实验数据表明,文中的方法能够以较高的效率和较低的计算代价有效地完成检索结果的聚合和摘要.
- 胡昊何震瀛
- 关键词:关键字检索
- GCPR:一种在MapReduce平台上基于图划分的PageRank加速方法被引量:2
- 2012年
- 随着应用的扩展,大规模图数据不断涌现,如何对拥有大量结点的图进行分析成为研究者关注的焦点问题之一.结点的海量性与分析的复杂性使得图分析任务需要借助MapReduce平台多机并行完成.在该平台上,现有的PageRank算法每轮迭代都须扫描、传输所有网页的完整状态,I/O和网络传输的开销严重影响了计算效率.为此,本文提出一种在MapReduce平台上基于图划分的PageRank加速方法:GCPR(Graph-clustering PageRank).GCPR利用图划分、数据两层压缩技术在MapReduce平台上进行PageRank迭代计算,不仅减少了Map到Reduce中间阶段I/O和网络传输的开销(MapReduce运算的主要瓶颈之一),而且平衡了计算资源.实验证明GCPR能极大提升MapReduce平台上的PageRank计算效率.
- 廖松博陶岳何震瀛汪卫
- 关键词:PAGERANKMAPREDUCE图划分
- 一种基于链接聚类的查询扩展算法被引量:2
- 2011年
- 潜在语义分析(LSA)是一种用于自动实现知识提取和表示的理论和方法,它通过对大量的文本集进行统计分析,从其中挖掘出词语之间的潜在联系.LSA有效地解决了一义多词的问题,但是,由于LSA在大矩阵的计算效率和存储上的不足,这限制了LSA在大规模数据集上的应用.另一方面,在关系数据库中,数据对象通过多种类型的链接连接到一起.这些链接中蕴藏了丰富的语义信息.数据对象之间的相似性也可以通过这些链接体现出来.针对这个特点,提出了一种基于链接聚类的查询算法:利用数据对象之间的链接对数据对象进行聚类,用聚类代替文档来进行LSA处理,有效地减少处理文档的个数;在检索的过程中,寻找与关键字序列相似度最接近的簇,然后将簇内的文档返回给用户.实验结果表明,所提出的方法能够充分利用数据对象之间的链接,聚类效果明显;利用聚类后进行LSA处理,能够成倍地提高空间和时间开销,对精确度有提高作用.
- 李珀瀚何震瀛向河林
- 关键词:潜在语义分析查询扩展
- 油藏数值模拟大模型并行运算优化技术研究
- 油藏数值模拟并行运算是提高模拟速度的主要手段,并行运算的效率和速度受多个方面因素的影响,为了提高并行运算速度,必须优化并行环境和控制条件。以埕岛油田模型为例,分别从负载平衡、输出控制、CPU个数、收敛性控制条件四个方面进...
- 于金彪吴胜和王杰胡慧芳
- 关键词:油藏数值模拟负载平衡
- 文献传递