林子雨 作品数:56 被引量:333 H指数:10 供职机构: 厦门大学 更多>> 发文基金: 国家自然科学基金 福建省自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 文化科学 电子电信 自然科学总论 更多>>
一种新的时间序列延迟相关性分析算法——三点预测探查法 被引量:10 2012年 延迟相关性分析是时间序列数据挖掘的重要研究内容,它可以在很多领域得到应用,比如股票市场分析、天气预报、网络分析、移动对象跟踪和传感器监控等;通过实验发现和验证了时间序列延迟相关性分析中存在的3个现象,即连续分布性、延迟突变和突变幅度分布特性;证明了已有研究或者在延迟位置较大时具有较大的误差,或者无法解决延迟突变问题;根据3个实验现象,提出了三点预测探查法(three points forecast-based probing,TPFP),它可以克服已有算法的缺陷,在延迟位置较大时也可以具有较小的误差,并且可以有效处理大部分延迟突变情形.大量实验证明,三点预测探查法可以比已有方法取得更好的性能. 林子雨 江弋 赖永炫 林琛关键词:时间序列 一种自动化大数据监控系统 本发明公开了一种自动化大数据监控系统,包括检测设备和报警设备,检测设备内部固定设置有摄像头检测模块和音频录制模块,报警设备内部设置有大数据信息反馈模块和警报模块,摄像头检测模块用于对所需要的画面及时进行检测,音频录制模块... 黄连福 林子雨一种基于标签邻域模型和标签矩阵分解模型的推荐算法 本发明公开了一种基于标签邻域模型和标签矩阵分解模型的推荐算法,涉及用户推荐技术领域,包括构建UTagUser‑CF算法与TagMF算法,根据构建出的UTagUser‑CF算法与TagMF算法进行构建UTagUser‑Ta... 周宗涛 陈绍纬 林子雨实时主动数据仓库中多维数据实视图的选择 被引量:14 2008年 通过基于主动决策引擎日志的数据挖掘来找到分析规则的CUBE使用模式,从而为多维数据实视图选择算法提供重要依据;在此基础上设计了3A概率模型,并给出考虑CUBE受访概率分布的视图选择贪婪算法PGreedy(probability greedy),以及结合视图挽留原则的视图动态调整算法.实验结果表明,在实时主动数据仓库环境下,PGreedy算法比BPUS(benefit per unit space)算法具有更好的性能. 林子雨 杨冬青 宋国杰 王腾蛟 唐世渭关键词:视图选择 实视图 数据仓库 联机分析处理 以平台化思维构建高校大数据课程公共服务体系 介绍了建立高校大数据课程公共服务体系的重要性,以平台化思维构建高校大数据课程公共服务体系分享了一个案例:中国高校大数据课程公共服务平台。 林子雨关键词:公共服务体系 基于替换概率的闪存数据库缓冲区替换算法 被引量:12 2013年 闪存具有和传统磁盘不同的特性,包括写前擦除、异地更新、读写延迟非对称等.传统的面向磁盘的缓冲区替换算法无法在闪存数据库系统中获得较好的性能.文中提出了一种新的面向闪存数据库的缓冲区替换算法——APB-LRU,其特点:(1)该算法将缓冲区分为冷区和热区,用来捕获数据访问频度,前者用于存放只访问过一次的数据页,后者用于存放至少访问过两次的数据页;(2)采用了其它研究所没有的概率替换机制,即以较大的概率替换冷区中的干净页,以较小的概率替换冷区中的脏页,从而避免了冷脏页长期驻留缓冲区的情况,提高了命中率,获得了较好的整体性能;(3)设计了冷、热区比例动态变化机制,可以根据工作负载的变化动态调整冷、热区所占缓冲区的比例,从而使得替换算法在不同的负载模式下都可以取得较好的性能.基于不同测试数据集的大量实验结果表明,APB-LRU算法具有比其它已有的算法更好的性能. 林子雨 赖明星 邹权 薛永生 杨思颖关键词:闪存 数据库 厦门大学大数据课程与教材体系建设经验分享 林子雨实时主动数据仓库中的变化数据捕捉研究综述 实时主动数据仓库是数据仓库的最新发展阶段和未来发展趋势,它为企业提供了对战略决策和战术决策的双重支持.实时主动数据仓库中包含两类数据,即实时数据和非实时数据,相应地,需要两种不同类型的变化数据捕捉方法,即支持实时变化数据... 林子雨 杨冬青 宋国杰 王腾蛟文献传递 一种新的基于隐Markov模型的分层时间序列聚类算法 被引量:15 2006年 针对传统的基于隐Markov模型(HMM)的聚类算法在时间序列聚类的不足,提出了一种新的基于HMM的分层时间序列聚类算法HBHCTS,旨在提高聚类质量,同时对聚类结果给出类的表示·HBHCTS算法应用HMM对时间序列进行建模,并按照“最相似”的原则得到序列所对应的初始模型集,进而对这些初始模型合并更新及迭代得到聚类结果·实验中主要研究了聚类正确率与序列长度及模型距离的关系,结果表明HBHCTS算法比传统的基于HMM的聚类算法准确性高· 段江娇 薛永生 林子雨 汪卫 施伯乐关键词:聚类 HMM 时间序列 基于关系数据库的关键词查询 被引量:50 2010年 介绍了基于关系数据库的关键词查询问题的研究背景;阐述了解决该问题的两大类方法,即基于数据图的方法和基于模式图的方法,并详细介绍了各种方法的原理以及各自的优缺点;最后展望了未来的研究方向. 林子雨 杨冬青 王腾蛟 张东站关键词:关键词查询 关系数据库 信息检索