丁维
- 作品数:7 被引量:29H指数:3
- 供职机构:北京机械工业学校计算机与自动化系计算机及自动化系更多>>
- 发文基金:北京市教委资助项目北京市教委科技发展计划更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于校园网的搜索器技术研究与改进被引量:3
- 2007年
- 介绍通用的搜索器技术,提出适用于校园网内的搜索器技术改进方案,为以后高校教育资源的专业搜索引擎实现打下良好的基础。
- 杨娜周长胜马志强丁维
- 关键词:校园网搜索器信息采集网络爬虫
- 基于中文搜索引擎的分词词典的设计与实现被引量:5
- 2006年
- 中文分词是校园网搜索引擎项目的一个核心技术。词典又是中文自动分词的一个核心技术,词典的性能在一定程度上决定着整个系统的性能。通过该项目的开发,使用特有的索引结构,提高了分词速度;使用文本文件建立广义的词库文件,提高了系统独立性。
- 马志强周长胜杨娜丁维
- 关键词:词典
- 可支持热点查询的双索引技术被引量:2
- 2007年
- 介绍可支持热点查询的双索引技术,搜索引擎的构成,描述索引的结构及其采取的双索引机制,并介绍索引性能的优化及词语过滤机制,热点查询技术。
- 丁维周长胜马志强杨娜
- 关键词:搜索引擎索引优化
- 校园网搜索引擎核心技术—索引技术
- 搜索引擎(Search Engine)是一个对互联网上的信息资源进行搜集整理,然后供用户查询的系统。它包括信息搜集、中文分词、索引和检索四个部分。但是,面对大多数校园网是内网的情况,大型通用搜索引擎往往处理不到。并且校园...
- 丁维
- 关键词:校园网搜索引擎索引技术
- 文献传递
- 基于多级指引索引的高效技术
- 2006年
- 介绍了搜索引擎中基于多级指引索引的高效技术。包括索引压缩,置入文件阀值的方法。其中索引压缩介绍了字节对齐压缩、Elias gamma编码、Elias delta编码、Golomb编码、二元插值编码,并对其压缩效率,解压速度以及相对性能做了比较,叙述了在不同的情况下使用不同的编码,以便提高搜索效率。
- 丁维周长胜崔凌云马志强杨娜
- 关键词:搜索引擎索引压缩
- 校园网搜索引擎的研究与实现被引量:14
- 2007年
- 针对通用搜索引擎不能检索校园网内网的不足,提出建立校园网搜索引擎,实现为用户提供基于关键字进行校园内部信息检索的服务平台。通过研究,设计了具有搜索器、中文分词器、索引器和检索器的校园网搜索引擎系统。系统采用Java语言和Oracle9i数据库实现。目前,系统已实现了基于关键词的查询,但也存在着检索关键词不能进行智能转化、检索结果不能根据用户反馈进行排序的不足。
- 马志强周长胜丁维杨娜
- 关键词:校园网搜索引擎
- 自扩充中文分词词典的研究与实现被引量:7
- 2007年
- 中文分词词典是中文自动分词的一个核心技术,词条的完备率和词典的结构,在一定程度上决定着分词的正确率和查询速度。为了提高以上两方面的性能,从计算机技术层面上讨论,给出两种改进的词典组织结构和一种自动扩充词条的方法。
- 马志强周长胜丁维杨娜
- 关键词:词典