国家教育部博士点基金(20020056047)
- 作品数:12 被引量:67H指数:5
- 相关作者:李敏强郁雪阎红灿王淑芬朱晓亮更多>>
- 相关机构:天津大学河北理工大学河北科技师范学院更多>>
- 发文基金:国家教育部博士点基金国家自然科学基金教育部“新世纪优秀人才支持计划”更多>>
- 相关领域:自动化与计算机技术经济管理社会学自然科学总论更多>>
- 基于XQuery数据模型的XUL语言的定义和实现
- 2008年
- 以W3C关于XML查询语言的推荐标准XQuery数据模型为基础,定义了XML(eXtensible Markeup Language)文档更新粒度,设计了XML文档更新语言XUL,对删除、重命名、前插入、后插入、追加和替换6种更新子操作进行XQuery语法形式的描述,并通过示例表述了更新操作的语义,同时考虑了有序和无序文档.最后提出了一种基于关系数据库存储策略的XML文档更新的实现架构,在Kweelt系统基础上实现了XUL定义的更新操作.
- 阎红灿王淑芬朱晓亮闫少宏李敏强
- 关键词:XQUERYXML文档更新触发器
- 基于局部主成分分析的协同过滤推荐模型被引量:5
- 2010年
- 根据传统协同过滤算法中用户数据的高维稀疏特点,提出一种基于局部主成分分析协同过滤推荐模型,采用基于语义分类和主成分分析的二阶段降维技术,分别对各类主题页面进行局部降维处理,以保留对某类主题真正感兴趣的用户群,加速最近邻的搜索过程。通过对真实Web日志数据的测试,证明该模型具有较高的预测精度。
- 郁雪李敏强
- 关键词:推荐系统协同过滤算法维数约简
- 基金项目评审管理中智能交互式文档检索被引量:7
- 2005年
- 讨论了非结构化文档信息的检索模型,分析了传统交互式信息检索方法,提出了面向基金项目文档查询的智能交互式信息检索过程和处理流程。基于用户评价项目文档的反馈信息,采用ID3算法、CLCC算法和SVM分类函数分别学习用户查询的潜在意图和目标,并应用所学习的规则知识或分类函数支持项目文档查询。以某基金评审管理中项目文档的查询为例进行了实验计算与分析。
- 李智李敏强
- 基于TreeMiner算法的XML文档结构相似度量方法被引量:2
- 2009年
- 提出了一种基于TreeMiner算法挖掘频繁子树的文档结构相似度量方法,解决了传统的距离编辑法计算代价高而路径匹配法无法处理重复标签的问题。该方法架构了一个新的检索模型—频繁结构向量模型,给出了文档的结构向量表示和权重函数,构造了XML文档结构相似度量计算公式;同时从数据结构和挖掘程序上对TreeMiner算法进行了改进,使其更适合大文档数据集的结构挖掘。实验结果表明,该方法具有很高的计算精度和准确率。
- 阎红灿王淑芬朱晓亮李敏强刘保相
- 关键词:频繁子树
- 基于约束聚类的一种概念学习方法被引量:5
- 2004年
- 首先定义了字符属性例子空间中合取规则的可学习性,通过将正例集合划分为多个子集,其中每个子集在全体反例集合上均是合取规则可学习的,并建立了命题规则的一般学习模型.然后,提出了三种正例集合的自动聚类和划分方法:相似性度量、差异度量和规则长度等,并设计了一种快速的合取规则学习方法.同时,基于最小覆盖率和最小错误率给出了一种克服过学习问题的后处理方法.最后,针对一组典型的学习问题进行了实验计算,并与已有算法进行了对比分析.
- 李敏强李智
- 关键词:约束聚类后处理
- 基于模式约束的XML数据存储和索引技术
- 2010年
- 对XML数据建立有效的索引,是左右XML数据处理性能的重要因素.现有的索引和存储策略,大部分以丢失结构信息为代价,不利于结构查询和更新.XMLSchema修为描述XML文档结构信息的标准,对文档和查询路径进行有效性验证提供保证,基于此提出了一种基于XMLSchema模式约束的XML文档数据索引技术SBXI,用于文档数据存储和查询的导航,提高了存储和查询效率,具有较高的空间利用率和较低的索引维护代价,并支持含有多个谓词的复杂查询.
- 王淑芬朱晓亮尤洪岭阎红灿
- 关键词:XMLSCHEMA
- 基于PCA-SOM的混合协同过滤模型被引量:13
- 2010年
- 针对推荐系统中协同过滤技术面临的数据稀疏性和推荐实时性难以保证的问题,提出一种基于主成分分析(Principle component analysis)和SOM(Self-organizing map)聚类的混合协同过滤模型.首先对原始评分数据进行全局降维,并在转换后的主成分空间上进行用户聚类,缩小了目标用户的最近邻搜索空间,减少了在线计算时间复杂度,最后对真实的电子政务门户网站Log日志数据进行了几种常用的推荐算法的比较,实验结果证明新的推荐模型具有较好的预测精度.
- 郁雪李敏强
- 关键词:推荐系统协同过滤算法主成分分析自组织映射聚类技术
- 一种结合有效降维和K-means聚类的协同过滤推荐模型被引量:15
- 2009年
- 为了克服"维灾"所带来的问题,提出一种基于主成分分析的维数约简方法,并在转换后的低维向量空间上进行K-means聚类算法,以减少目标用户的最近邻搜索范围,代替在超高维空间上逐一寻找最近邻的过程。实验结果证明了新算法的有效性,特别在目标用户的历史评价信息较少的情况下,也能有较好的预测精度。
- 郁雪李敏强
- 关键词:协同过滤主成分分析维数约简K-MEANS聚类
- 基于搜索空间信息的新型遗传算法被引量:3
- 2007年
- 针对多模态函数优化问题,提出了一种遗传算法。用正交设计法对搜索空间进行探索,用差分法确定适应函数关于各变量的灵敏性,对灵敏性较高的几个变量,按其所在维度对搜索空间进行划分。用遗传算法分别对各子空间进行单次搜索,根据各子空间当前最优解的大小依概率对其应用遗传搜索。根据情况决定是否对各子空间递归调用该算法。仿真实验证明:在同等计算量的情况下,该算法相对于其他遗传算法能明显提高全局最优解的精度,并获取更多的局部最优解和其他有效信息。
- 李航李敏强寇纪淞
- 关键词:正交设计遗传算法
- 面向协同过滤的真实偏好高斯混合模型被引量:8
- 2007年
- 针对协同过滤问题,提出了一种基于高斯混合的概率模型,称为真实偏好高斯混合模型.用户对项目的评分由三个因素决定:用户对项目主题和内容的真实偏好,用户的评分习惯,以及项目的公众评价.引入了两个隐含变量,分别用于描述用户类和项目类,用户和项目依概率可以同时属于多个类.模型包括离线建模过程和在线预测过程,在线预测可以在常数时间内完成.实验表明新模型的预测结果明显优于其他几种协同过滤算法.
- 张亮李敏强
- 关键词:协同过滤