邱越峰
- 作品数:4 被引量:187H指数:3
- 供职机构:复旦大学信息科学与工程学院计算机科学系更多>>
- 相关领域:自动化与计算机技术更多>>
- 数据库技术:回顾与展望被引量:11
- 1999年
- 数据库系统的研究和开发在其三十年的历史中取得了巨大的成功,形成了一个数百亿美元的产业。数据库技术和系统的应用已经遍及各个领域,奠定了数据库系统作为当今社会信息基础设施核心技术的地位。尽管如此,数据库的研究和发展一刻也来曾停止过,传统的研究主要集中在增强和提高数据库管理系统(DBMS)的功能和性能上。但是,DBMS作为管理大容量数据的工具无疑会受到所管理的对象和所应用的环境的影响。目前。
- 周傲英邱越峰田增平施伯乐
- 关键词:数据库DBMS数据管理数据模型数据挖掘
- 一种高效的检测相似重复记录的方法被引量:104
- 2001年
- 如何消除数据库中的重复信息是数据质量研究中的一个热门课题 .文中提出了一种高效的基于 N- Gram的检测相似重复记录的方法 ,主要工作有 :(1)提出了一种高效的基于 N - Gram的聚类算法 ,该算法能适应常见的拼写错误从而较好地聚类相似重复记录 ,复杂度仅为 O(N) ;同时提出了该算法的改进形式 ,使其在检测的同时能自动校正单词的插入、删除错误 ,提高检测精度 .(2 )采用了一种高效的应用无关的 Pair- wise比较算法 ,该算法以单词间的编辑距离为基础 ,通过计算两记录中单词间的编辑距离来判断记录的相似与否 .(3)给出了一种改进的优先队列算法来准确地聚类相似重复记录 ,该算法使用固定大小的优先队列顺序扫描已排序的记录 ,通过比较当前记录和队列中记录的距离来聚类相似重复记录 .此外 ,该文构造了合适的实验环境并作了大量的算法实验 .在此基础上 ,文中分析了大量、翔实的实验结果从而验证了算法的科学性 .
- 邱越峰田增平季文贇周傲英
- 关键词:信息集成相似重复记录聚类数据质量数据库
- 基于关系的XML数据存储被引量:73
- 2000年
- XML正成为Internet上数据表示与交换的标准 ,如何存储XML数据是一个关键问题。我们在系统实现时采用了基于关系数据库的存储方式。文章对于关系模式如何由DTD生成、XML数据如何存入、查询语句和查询的结果如何转化等问题 ,做了详细的探讨。
- 周傲英张龙梁宇奇邱越峰
- 关键词:XML数据存储关系数据库INTERNET网
- XML数据管理关键技术研究
- 该文对XML数据管理的相关技术作了全面的研究.主要包括查询语言、查询优化、索引和存储管理,其中重点研究了XML数据查询和存储技术.该文的创新点如下:归纳和总结了当前各种XML查询语言,提出了XML查询语言的要素;提出了基...
- 邱越峰
- 关键词:DTD数据模型查询语言查询优化存储管理
- 文献传递