国家自然科学基金(60003014)
- 作品数:9 被引量:89H指数:5
- 相关作者:赵明生张义忠朱精南梁久祯尚彤更多>>
- 相关机构:清华大学北京大学更多>>
- 发文基金:国家自然科学基金国家教育部“985工程”国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术一般工业技术机械工程文化科学更多>>
- 一种基于CORBA的分布式全文检索系统设计被引量:3
- 2003年
- 海量信息的全文检索是人类获取信息的重要手段之一,而网络海量信息的检索使传统的全文检索技术面临新的挑战。如何改善检索系统的结构,提高检索系统的性能和效率,以加快检索速度,成为一个值得研究的课题。公用对象请求代理体系CORBA技术的出现为这一课题提供了一个有效的解决方法。该文在对WEB计算方式和CORBA体系进行详细讨论的基础上,结合实际课题的研究,给出了一种基于CORBA技术的分布式全文检索系统架构设计。
- 赵刚赵明生扈旻尚彤
- 关键词:CORBA分布式WEB计算
- 基于内容的中文网页自动分类研究被引量:12
- 2001年
- 本文主要介绍基于内容的网页自动分类系统 ,具体介绍了类别词典的建造方法 ,网页超文本类别词切分的方法 ,中文网页自动分类算法以及利用类别词与网页间的模糊关系对网页文本进行自动分类等内容 .通过对旅游网页进行测试 ,自动分类正确率可达 93.37%以上 。
- 张义忠赵明生朱精南
- 关键词:信息检索中文网页计算机网络
- 电子细胞的研究现状与展望被引量:12
- 2001年
- 电子细胞是利用计算机电子信息技术等先进手段 ,模拟再现细胞内外部生命活动的现象和过程 ,并用于探索细胞生命活动的潜在规律 .它是一种人工生命复杂系统 ,代表了生命科学和信息科学的交叉学科前沿 ,有十分重要的作用 .本文综述了电子细胞的研究发展 ,就其研究内容、实例、与其关系密切的学科领域、以及它的作用和意义进行了扼要阐述 ,最后 。
- 赵明生尚彤孙冬泳蒋景宏汤健吴佑寿
- 关键词:生物信息学电子细胞人工生命
- 基于自组织特征映射的网页分类研究被引量:2
- 2002年
- 本文提出了一种SOFM(自组织特征映射)与LVQ(学习矢量量化)相结合的分类算法,利用一种新的网页表示方法,形成特征向量并应用于网页分类中.该方法充分利用了SOFM自组织的特点,同时又利用LVQ解决聚类中测试样本的交迭问题.实验表明它不仅具有较高的训练效率,同时有比较好的查全率和查准率.
- 张义忠赵明生梁久祯
- 关键词:自组织特征映射特征提取神经网络
- 基于内容的网页信息挖掘原理和设计
- 2002年
- 本文主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取.通过对旅游类网页的实验结果显示,本文的方法和应用效果良好.
- 张义忠赵明生梁久祯
- 关键词:信息挖掘特征提取
- 基于自组织特征映射的网页分类研究被引量:13
- 2003年
- 本文提出了一种 SOFM(自组织特征映射 )与 L VQ(学习矢量量化 )相结合的分类算法 ,利用一种新的网页表示方法 ,形成特征向量并应用于网页分类中 .该方法充分利用了 SOFM自组织的特点 ,同时又利用 L VQ解决聚类中测试样本的交迭问题 .实验表明它不仅具有较高的训练效率 。
- 张义忠赵明生梁久祯
- 关键词:自组织特征映射网页分类神经网络计算机网络
- 基于内容的网页特征提取被引量:40
- 2001年
- 文章主要研究基于内容的中文网页的特征提取技术,具体介绍了分词词典的建造方法,网页正文、标记信息和超链信息的特征提取。通过对旅游类网页的实验结果显示,文中的方法和应用效果良好。
- 张义忠赵明生朱精南
- 关键词:信息检索数据库信息资源知识库
- 网页版面中区域几何信息的确定被引量:6
- 2004年
- 针对HTML网页版面中区域的形成及特点进行了分析,研究了估算元素区域在版面中的位置、形状、相互关系等几何分布信息的方法,提出了一种网页版面中区域几何信息分析子系统的实现框架。
- 朱精南赵明生
- 关键词:几何信息
- 基于CORBA核心服务的分布式并行计算的实现被引量:2
- 2002年
- 随着网络技术的发展 ,利用网上资源构建分布式并行计算系统已经成为并行计算的一个重要发展方向。在无需投入大型高速计算机的情况下 ,提出了一种简便而实用的基于CORBA核心服务技术的分布式并行计算方式 ,并应用在实际课题中 ,取得了良好的效果。
- 赵刚赵明生杨海明
- 关键词:CORBA分布式并行计算计算机网络