曲文龙
- 作品数:23 被引量:134H指数:6
- 供职机构:石家庄经济学院信息工程学院更多>>
- 发文基金:国家自然科学基金北京市自然科学基金国家科技成果重点推广计划更多>>
- 相关领域:自动化与计算机技术理学文化科学更多>>
- 图像挖掘技术研究被引量:16
- 2004年
- 对目前图像挖掘的研究及应用现状进行综述,首先阐明图像数据的特点及图像挖掘的主要问题,随后分析了图像的表示模型、图像挖掘的框架模型,介绍了图像挖掘的主要技术,最后对图像挖掘应用和未来研究方向进行展望。
- 曲文龙李卫东杨炳儒
- 关键词:图像挖掘图像表示数据挖掘
- 基于广义后缀树的事件序列频繁情节挖掘算法被引量:4
- 2006年
- 为了有效地挖掘事件序列频繁情节,提出了一种广义后缀树结构发现和存储频繁情节.此结构利用广义后缀概念并且树中只包含频繁情节结点,用频繁情节发生列表逐层构建的方法提高了建树效率.该方法充分利用了事件序列的有序特点,可用于发现各类频繁情节.实验结果表明该算法性能优于Apriori-like频繁情节发现算法.
- 曲文龙杨炳儒张克君
- 关键词:频繁情节数据挖掘广义后缀树
- 基于小波和支持向量机的多尺度时间序列预测被引量:8
- 2007年
- 介绍了相空间重构和基于支持向量机的时间序列预测建模技术,提出了基于小波和支持向量机的复杂时间序列预测方法,利用小波对复杂时间序列进行多尺度分解,对重构后的近似序列和细节序列分别利用支持向量机进行回归预测并将结果融合。对股票数据进行预测,试验结果表明该方法预测精度高于单尺度支持向量机和神经网络预测方法,可用于复杂非平稳时间序列的预测。
- 曲文龙李海燕刘永伟杨炳儒
- 关键词:时间序列预测小波支持向量机多尺度数据挖掘
- 基于用户评价的查询串与搜索结果特征权重计算被引量:1
- 2007年
- 提出了利用大量用户评价结果来进行特征权重的计算方法,用于解决搜索引擎中查询串与搜索结果的相似度分析。该方法完全利用用户对搜索结果的“潜在评价”来进行。用户对输入查询串所做的点击反映了其内部的关联性,该文提出的方法可获取这种关联性,对该问题建立了数学模型,利用EM算法解决了特征权重的计算。由于模型的函数比较复杂,难于计算其收敛性,因此,使用了模拟退火算法作为EM算法的补充,用于验证算法的收敛性。实验使用百度搜索引擎在竞价广告上进行,提取的测试数据样本为100个广告和144 132个query,获得的数据结果显示,所有特征收敛到全局最优解,抽样部分数据获得检索相似准确率为93.32%,召回率为87.43%。
- 吴春尧曲文龙杨炳儒
- 关键词:网页排名EM算法模拟退火算法
- 客户端垃圾邮件过滤系统的设计
- 2011年
- 垃圾邮件不仅浪费大量的网络资源,并且给用户带来很大的不便,如何有效地防范垃圾邮件,已成为网络信息安全领域的主要课题之一。本文通过对传统垃圾邮件过滤技术的分析,提出了一种基于指纹的定量过滤方法。对白名单和黑名单过滤、定时过滤、基于指纹的定量过滤和贝叶斯过滤技术进行了整合,建立了一种客户端垃圾邮件过滤系统的模型,该系统具有较高的过滤准确性,并且能适应用户的个性化需求。
- 李瑞华李霞曲文龙
- 关键词:垃圾邮件过滤
- 一种具有双重进化空间的扩展粒子群优化算法被引量:1
- 2008年
- 为了使粒子群优化(PSO)适于求解更多类问题,提出一种由动力空间和制导空间共同进化的改进粒子群优化算法—具有双重进化空间的扩展粒子群优化算法(简记EPSO).在EPSO中,在演化转换映射的作用下,首先将动力空间中对粒子辅助位置的进化转换为制导空间中对主导位置的进化,然后基于对主导位置的择优选择操作实现算法的进化过程.EPSO克服了PSO仅适于求解连续域最优化问题的缺陷,也非常适于求解离散组合优化问题.对于随机3-SAT问题、背包问题和TSP问题,通过与PSO、ACO和GA等算法的计算对比表明:EPSO是一种继承了PSO优点的高效、扩展演化算法.
- 贺毅朝王熙照曲文龙
- 关键词:粒子群优化
- 离散数学网上考试系统的设计与实现被引量:3
- 2008年
- 介绍了基于JSP和Delphi的离散数学网上考试系统的设计和实现,该系统分为考试管理系统、网上实时考试系统和网上监控系统3个部分。《离散数学》是计算机专业的专业基础课,也属于数学类课程,因此该系统不仅对计算机专业的教学起到很大作用,对数学类其它课程的考试方式也提供了新的思路。
- 张敬敏曲文龙
- 关键词:离散数学数据库网上考试系统监控系统
- 基于广义后缀树的事件流频繁情节在线挖掘算法被引量:1
- 2007年
- 现有的事件序列频繁情节挖掘多采用Apriori-like算法,此方法无法应用于事件流数据发掘。针对采用滑动窗口的事件流频繁情节发现问题,提出一种广义后缀树结构,在新事件加入时对情节树进行动态维护;为提高时空效率,采用频繁情节发生列表逐层构建的方法实现对搜索空间的划分,通过监控边界情节以发现频繁情节的变化。实验结果表明了算法的有效性和优越性。
- 曲文龙王彦琪张敬敏杨炳儒
- 关键词:广义后缀树事件流频繁情节数据挖掘
- 基于中心词位置的VSM文本分类算法
- 本文提出了基于中心词位置信息的文本分类方法,该方法是VSM方法的一种改进模型.通过分析文章结构,可以发现不同位置的词重要程度是不一样的.科学利用这一特点,将位置信息作为参数加入到向量中,同时使用逆训练方法避免分类异常,减...
- 李卫东杨炳儒李龙星曲文龙
- 关键词:文本分类VSM位置信息智能搜索引擎
- 基于多镜像站点的分布式Web使用聚类
- 2007年
- 提出了一种适用于多镜像站点环境下的分布式Web使用聚类局部挖掘算法LUC和全局挖掘算法GUC,较好地解决了Web访问信息的异地存储、分布式算法通讯量等因素给模式分析过程带来的困难.将给出的算法用Java语言加以实现,并对算法性能进行了研究.结果证明,该算法是有效的,可以用来高效、准确地在多镜像站点环境下发现Web用户群体模式.
- 张克君杨炳儒赵耿曲文龙
- 关键词:镜像站点WEB聚类分布式数据挖掘