蔡岳
- 作品数:3 被引量:30H指数:3
- 供职机构:北京林业大学信息学院更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 一种应用于搜索引擎的文本聚类算法
- 随着互联网的不断延伸,信息量随着不断增加,如何从浩瀚的信息海洋中得到用户感兴趣的信息就显得尤为重要。尽管门户网站试图让目录更加合理化,提供的服务也更加多样化,但在数以亿计的信息面前,则显得杯水车薪。为了适应时代的发展,搜...
- 蔡岳
- 关键词:搜索引擎文本聚类K均值
- 用户行为聚类的搜索引擎算法与实现被引量:6
- 2010年
- 提出一种基于用户行为聚类的搜索引擎算法。该算法从用户行为日志中挖掘用户意图,并根据用户的反馈信息定位用户意图信息,提升了查询的准确率,有效地解决了传统的全文检索式搜索引擎查询具有二义性词时的不足,并通过实践验证了算法的可行性。
- 蔡岳袁津生
- 关键词:用户行为用户意图聚类搜索引擎二义性
- 基于改进DBSCAN算法的文本聚类被引量:21
- 2011年
- 目前多数聚类算法不能很好地适应文本聚类的快速自适应需求。为此,论述DBSCAN算法的基本原理和实现过程,提出一种基于改进DBSCAN算法的文本聚类算法,利用最小二乘法降低文本向量的维度,并创建一种应用于DBSCAN算法的簇关系树结构。实验结果表明,该算法能自适应地进行文本聚类,且与DBSCAN相比,准确率较高。
- 蔡岳袁津生
- 关键词:DBSCAN算法文本聚类最小二乘法