肖军建
- 作品数:5 被引量:49H指数:3
- 供职机构:复旦大学更多>>
- 发文基金:国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术经济管理更多>>
- Web内容抽取及其数据管理方法被引量:34
- 2001年
- 随着Internet及其相关技术的飞速发展 ,WWW已成为最大的信息集散地 .无论对企业还是个人 ,Web逐渐成为最主要的信息来源 .然而由于网站数量过多以及由此带来的信息泛滥 ,使得有用信息的获取越来越困难 .搜索引擎只能提供信息的查找范围 ,而具体的内容还要靠详细搜查 .而且网页信息都是非结构化或半结构化的 ,无法直接利用分析工具进行分析 .所以有必要提供一种网页内容自动抽取及使网页数据结构化的方法 。
- 张成洪肖军建张诚
- 关键词:数据抽取INTERNETWWW数据管理
- 基于wEB的企业信息集成系统
- 在]ntranet和Internet环境中,数据结构的多样和数据分布的多样.给企业的信息综合分析和决策制定的工作带来了极大的挑战。Web的迅速普及,使这个问题翻益突出。本文以基于Web 的数据采集和分析为重点,提出了企业...
- 张成洪张诚肖军建
- 关键词:异构数据源
- 文献传递
- Web数据转换集成技术及其信息服务应用被引量:13
- 2001年
- Web的迅速普及,使获取信息比以前更加迅速与方便,但由于网站数量众多,数据又相对分散,使得获取有效信息的难度加大.Web数据转换集成技术可以自动从Web上获取数据,然后集成为用户所关心的有效信息,同时还提供查询代理服务,以更好地服务用户.该文以上海信息港的“房地产信息搜索集成系统”为实用实例,对该项技术及其在信息服务方面的应用进行详细阐述.
- 张成洪肖军建张诚
- 关键词:数据库WEB数据转换信息服务
- 基于语义网技术的web数据获取与集成研究
- 随着Internet及其相关技术的飞速发展,信息的发布与传播变得非常的简便和迅速,WWW(World Wide Web)已成为了最大的信息集散地,同时也伴随着一个重大的问题--信息泛滥.它给Web上有效信息的获取和利用带...
- 肖军建
- 关键词:数据获取RDFONTOLOGYDAML+OIL
- 文献传递
- 基于WEB的企业信息集成系统被引量:3
- 2000年
- 在Intranet和Internet环境中,数据结构的多样和数据分布的多样,给企业的信息综合分析和决策制定的工作带来了极大的挑战.Web的迅速普及,使这个问题日益突出。本文以基于Web的数据采集和分析为重点,提出了企业管理集成系统的一整套解决方案,包括网页包装工具,异构数据源的数据整合工具,数据分析工具,完成了包装非结构化数据、从不同数据源提取数据、正确完整地组织异构数据源的数据、按需求组织数据的工作,并提供对查询结果作进一步分析的功能,使企业能够用统一的界面去查询、收集和处理来自Web 和远程数据库多个数据源的信息。帮助其完成决策制定。
- 张成洪张诚肖军建
- 关键词:异构数据源