刘光远 作品数:18 被引量:115 H指数:6 供职机构: 吉林大学通信工程学院 更多>> 发文基金: 国家自然科学基金 吉林省自然科学基金 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 更多>>
数据挖掘技术在交通事故分析中的应用 被引量:21 2006年 结合关联规则与粗糙集的思想,提出了基于偏好信息的决策规则约简算法,并将该算法应用于长春市历年的道路交通事故数据分析中,从而找出交通事故发生的潜在规律. 董立岩 刘光远 苑森淼 李永丽 吴志辉关键词:数据挖掘 粗糙集 关联规则 可视化数据挖掘技术 被引量:6 2006年 通过对可视化数据挖掘进行分类和总结,提出将可视化数据类型和可视化与数据挖掘结合的思想。由于可视化数据挖掘的优势是用户能直接参与数据挖掘过程,通过对挖掘过程中各个阶段反馈的信息可视化结果的分析,用户可以将领域知识和数据挖掘算法有效地结合在一起,完成用户和算法的交互。因此,可视化数据挖掘技术将成为今后数据挖掘领域中研究的热点。 董立岩 刘光远 苑森淼 杨萌 耿学梅 王宝杰关键词:可视化数据挖掘 信息可视化 基于数据挖掘的移动通信用户流失研究 随着电信市场的逐渐放开,电信企业间竞争加剧,由于企业间的竞争导致的用户流失逐渐成为影响企业经营效益的主要原因。电信企业具有国内领先的数据仓库系统,为实施基于数据挖掘的用户流失分析提供了条件。用户流失预测系统作为经营分析系... 刘光远关键词:数据挖掘 序列模式挖掘 进化计算 基于数值计算的布尔表达式约简工具 2007年 运用数论理论中素数的性质和特点,将符号计算问题转化为数值计算问题,设计了一个布尔表达式化简工具。在理论上根据素数的性质重新定义了布尔函数的合取、析取以及非运算,并提供了相应的推理规则;提出基于素数性质的布尔函数约简算法。用VC++实现了布尔表达式约简工具,并为该工具在底层构建了大数据计算模块,以确保对变量个数没有局限性。该工具既可独立使用,也可以提供DLL作为其它软件、工具、算法的一部分。在移动通信用户流失分析中应用了该工具,取得较好的效果。 刘光远 苑森淼 董立岩关键词:素数 数据挖掘方法在用户流失预测分析中的应用 被引量:5 2007年 移动通信在高速发展的同时,出现了大量用户离网的现象,基于客户信息、消费行为等历史数据,进行客户离网预测分析成为各个运营商普遍关注的问题。文章基于客户的历史数据和短期偶发数据,提出了链型数据挖掘方法,并结合决策树,形成了一个综合的链型树分类器(Chain Tree Classifier,CTC)和用户行为预测模型,实验结果显示,该分类器对移动通信运营商感兴趣的单个事件发生具有良好的预测能力,可被应用到客户离网预测中,从而帮助运营商提前发现具有离网倾向的用户,进而获得更高的利润。 刘光远 苑森淼 董立岩关键词:数据挖掘 多策略数据挖掘系统的分析与设计 被引量:4 2006年 为了满足数据规模的膨胀和分析需求的增长,在对数据挖掘系统的发展史进行回顾的基础上,分析了国内外典型数据挖掘系统的特点,设计了一个多策略的数据挖掘系统。并针对数据挖掘面临的大规模海量数据的处理问题,为系统引入和设计了算法插件思想、缓冲区处理技术、基于XML(Extensib le M arkup Lan-guage)语言的配置文件和相应的并行处理技术。最后讨论了系统今后开发过程中需要注意算法更新及评估的问题。 刘光远 董立岩 苑森淼 李永丽 孙涛 关伟洲关键词:数据挖掘 海量数据处理 基于贝叶斯分类器的图像分类 被引量:35 2007年 通过对朴素贝叶斯分类器的讨论,提出将贝叶斯方法应用于医学图像分割后的图像分类思想.给出一种基于朴素贝叶斯分类器的图像分类方法,对从尿沉渣图像中识别出的微粒进行正确分割及特征提取与选择,并利用朴素贝叶斯分类器进行分类.实验结果表明,所提出的方法用于解决图像分类有效. 董立岩 苑森淼 刘光远 贾书洪关键词:贝叶斯分类器 图像分类 特征提取 基于进化理论的用户流失预测分析 被引量:1 2007年 针对移动通信公司的经营分析系统,结合数据挖掘技术,阐述了客户流失预测的过程,并探讨了进化理论和连续数据离散化的相关问题,提出了EACA(Evolutionary A lgorithm for Churning Analysis)算法,用于解决移动通信这样一个有庞大离网规则数据库中规则的发现问题. 刘光远 苑森淼 董立岩 李永丽关键词:数据挖掘 进化算法 相联规则增量算法研究 被引量:5 2002年 相联规则模型可以用于在海量数据库中发现有价值的知识 ,各种求解相联规则的算法都需要较大的计算量 .随着时间推移 ,数据库中的数据也随之发生变化 .由于原先发现的规则已经过时 ,需要重新在数据集中挖掘规则 .本文通过向数据库中不追加数据的方法研究孕育在数据库中的相联规则变化情况 .在借鉴 FUP等算法的基础上 ,充分利用前次挖掘中获得的有关信息 ,提出用于再次挖掘的相联规则增量算法 Super FU P.该算法核心思想是更多地注重新增数据集 ,有效利用前次挖掘信息 ,仅仅对整个数据库扫描一次就能达到求解更新相联规则的目的 ,提高了相联规则增量算法的效率 . 李雄飞 臧雪柏 刘光远 苑森淼关键词:数据挖掘 相联规则 数据库 基于贝叶斯方法的尿沉渣图像分割 被引量:4 2007年 通过对贝叶斯分类器的讨论,提出将贝叶斯方法应用于医学图像分割后的合并策略思想,旨在提高图像分割的准确性,为计算机自动识别医学图像中包含的各种元素提供更加可靠的依据。首先让计算机自动识别出尿沉渣图像中的红细胞、白细胞、管型细胞、上皮细胞和结晶等有形成分,其次将各细胞实体正确地分割出来。由于图像中存在着大量背景噪音,因此在分割之前需要进行去除噪音的预处理。预处理采用数学形态学的方法,依次进行边缘提取、梯度图像二值化、腐蚀、膨胀。最后,在图像分割过程中,使用最大后验概率法进行破损目标体的合并,为进一步的特征提取和分类作了基础。在目标体分类中使用朴素贝叶斯分类器进行分类。将本方法应用于尿沉渣检查自动图像分析系统中,实验结果表明这一方法效果较好。 董立岩 苑森淼 刘光远 李永丽关键词:贝叶斯方法 图像分割 贝叶斯分类器