江苏省自然科学基金(BK2005046)
- 作品数:23 被引量:181H指数:6
- 相关作者:沈洁李慧张舒吴颜陈晓红更多>>
- 相关机构:扬州大学江苏科技大学淮海工学院更多>>
- 发文基金:江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术经济管理文化科学更多>>
- 基于概念格的web log分布式挖掘算法
- 2008年
- 提出一种有效的基于概念格的分布式挖掘算法,重点讨论由部分量化规则格提取的部分关联规则的合并技术,由于能对已存在关联规则的再利用,从而更有利于用概念格来挖掘关联规则.该算法根据对局部关联规则挖掘结果的分布式合成,有利于减轻网络频繁的通讯负担,体现并行计算、异步异构数据挖掘的优点.
- 陈锦禾沈洁
- 关键词:WEBLOG关联规则分布式挖掘概念格
- 基于Web日志的混合挖掘模型研究被引量:3
- 2007年
- 在电子商务环境下,提出一种基于Web日志抽取用户兴趣模式的混合挖掘模型MMA(mixed mining algorithm),该模型克服了单纯挖掘浏览模式或关联规则的不足,综合考虑用户的浏览和购买行为,能够有效捕获用户兴趣,获得潜在的商机,并为用户提供个性化的服务.
- 陈志敏沈洁
- 关键词:电子商务关联规则日志挖掘个性化
- 协同过滤推荐系统中数据稀疏问题的解决被引量:65
- 2007年
- 介绍了现有协同过滤推荐的几种主要算法。它们对数据稀疏性问题都有一定的缓和作用。通过在数据集MovieLens上的实验,分析了各个算法在不同稀疏度下的推荐质量,为针对不同数据稀疏度的系统实现提供了可靠依据。
- 吴颜沈洁顾天竺陈晓红李慧张舒
- 关键词:电子商务推荐系统协同过滤数据稀疏
- 面向Web日志的语义聚类算法被引量:2
- 2007年
- 由于现有的Web日志缺少明显语义,提出一种语义Web日志模型——SWLM,并给出基于该模型的网页和用户聚类算法。通过日志概念的语义距离定量计算来聚类网页和用户,奠定了Web个性化服务的基础。性能测试实验证明,该模型具有较好的整体性能,能有效地进行网页和用户聚类。
- 潘钧
- 关键词:WEB日志语义本体
- 面向领域知识库的“五化”本体创建被引量:6
- 2006年
- 利用本体论的方法来实现形式化、可共享领域知识库,提出了基于本体的领域知识库的架构及“五化”构建方法。解决了领域知识库的知识共享、互操作和一致性检查等问题。
- 孙茂圣
- 关键词:本体领域知识库共享一致性
- 一种新颖的CRE用户评论信息抽取技术被引量:2
- 2006年
- 准确挖掘商务网站中的用户评论对于商家进行有效的推荐具有重要意义。提出了一种新颖的用户评论抽取(CRE)算法进行评论信息的抽取。该算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。实验结果证明了该算法具有较高的查全率与查准率。
- 李慧张舒顾天竺陈晓红吴颜
- 关键词:信息抽取
- ContentRank:一种新颖的产品页面排名算法被引量:2
- 2007年
- 提出了一种新颖的ContentRank算法实现对产品页面的排名。算法不仅考虑了产品页面的链接结构,还对与产品相关的用户评论进行分类与分析,最终计算出各产品页面的得分并排名。实验结果表明,与Page- Rank相比,该算法可获得更好的排名结果,提高用户对搜索结果的满意度。
- 张舒沈洁李慧顾天竺吴颜陈晓红
- 关键词:排名链接分析信息检索
- 一种新的基于社会化标签的网页排名算法被引量:2
- 2008年
- 针对目前web2.0下网页无法进行有效排序这一问题,对社会化标签网下新的数据源"标签"的时间因素加以分析和利用,提出一种新的社会化标签的网页排名算法TagRank.该算法通过对网页上用户的标注行为进行挖掘,计算标签的"热度",从而更客观地反映标签的真实质量,以此提高网页排名的准确性.实验证明该算法是切实有效的.
- 张晖沈洁陈琛朱燕孙荣霜何堃
- 关键词:社会化标签书签排名
- 不完备信息系统的规则提取研究被引量:6
- 2007年
- 粗糙集理论和D-S证据理论都是重要的不确定性推理方法,两者各有优缺点。现实生活中,不完备信息系统广泛存在。研究了将两种理论结合用于不完备信息系统以进行规则提取,并用实例进行了验证。
- 张睿胡孔法陈崚
- 关键词:不完备信息系统决策表粗糙集证据理论
- 一种对动态网页的排名算法及其应用被引量:1
- 2006年
- 针对目前普通搜索引擎无法对动态网页的查询结果进行有效索引与排序的问题,提出了一种对动态网页的排名算法Con ten tR ank,并介绍其在商务网站中的应用.该算法通过对与动态页面相关的内容进行挖掘分析,计算页面排名得分,从而实现对此类动态网页的查询结果的排序,提高排名的准确性.
- 李慧沈洁张舒杨学凯
- 关键词:文本分类