谢昆青
- 作品数:63 被引量:573H指数:12
- 供职机构:北京大学信息科学技术学院智能科学系更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划更多>>
- 相关领域:自动化与计算机技术文化科学天文地球交通运输工程更多>>
- 基于时空邻域的多粒度轨迹相似性查询被引量:3
- 2006年
- 移动对象轨迹存储、管理和查询的研究已经具有相当基础,然而面向应用的移动对象运动模式分析乃至决策支持则更为人们所期待,提出基于时空邻域的多粒度轨迹相似性查询以支持其运动模式分析.直观地,如果两个移动对象在运动中频繁地出现在对方的时空范围附近,则认为二者轨迹相似,且出现得越频繁相似程度越高,即基于时空邻域的轨迹相似性测度.此外,实际中通常会在不同大小的时空邻域下评估轨迹相似性,以获得微观和宏观层面上的相似轨迹,即多粒度轨迹相似性查询.最后的实验分析也证明了基于时空邻域的多粒度轨迹相似性查询方法的有效性.
- 雷小锋谢昆青金星星夏征义
- 关键词:相似性查询多粒度
- 一种基于K-Means局部最优性的高效聚类算法被引量:123
- 2008年
- K-Means聚类算法只能保证收敛到局部最优,从而导致聚类结果对初始代表点的选择非常敏感.许多研究工作都着力于降低这种敏感性.然而,K-Means的局部最优和结果敏感性却构成了K-MeanSCAN聚类算法的基础.K-MeanSCAN算法对数据集进行多次采样和K-Means预聚类以产生多组不同的聚类结果,来自不同聚类结果的子簇之间必然会存在交集.算法的核心思想是,利用这些交集构造出关于子簇的加权连通图,并根据连通性合并子簇.理论和实验证明,K-MeanScan算法可以在很大程度上提高聚类结果的质量和算法的效率.
- 雷小锋谢昆青林帆夏征义
- 关键词:基于密度K-MEANS
- 基于旋转投影统计特征的手写数字识别方法被引量:2
- 2011年
- 通过抽取数字的轮廓和骨架来提取几何特征,可以有效地反映手写数字的细节,但手写数字的不规范性导致其识别率并不高。运用统计分析理论可以克服这一缺点。首先提出了基于投影间隔比率和间隔变化的特征提取方法,通过数字投影计算间隔的像素数比率和变化趋势,并将其归一化作为特征向量。进一步通过旋转投影基准线,增加特征向量之间的正交性以减少信息冗余,基于这一思路提出旋转投影的识别方法。理论分析和实验证明了旋转投影可以在相同特征数量的情况下达到更高的识别率,并给出了推荐参数。此外,通过旋转投影,直接解决了倾斜数字的识别问题。
- 庄伟雷小锋宋丰泰戴斌谢昆青
- 关键词:统计分析朴素贝叶斯手写数字识别
- 面向智能科学的机器感知实验课程建设被引量:2
- 2013年
- 介绍北京大学智能科学系面向智能科学的机器感知实验课程建设,提出实验课程应跟随技术发展,具有实用性和自主创新性等观点。
- 曲天书高源邓志鸿谢昆青
- 关键词:移动终端嵌入式系统
- 眼科图像网络信息化的实现方案与技术研究被引量:11
- 2004年
- 21世纪,社会已进入信息时代.利用计算机网络信息技术将眼科的各种检查设备,通过计算机与网络硬件设备组建局域网、城域网或广域网,再开发适用的应用软件系统,实现眼科图像网络信息化管理,已成为实现眼科临床信息化管理过程中的重要课题.笔者于2000年开始,为北京大学人民医院眼科成功组建了一套眼科图像网络信息管理系统;2001年经测试与安装,至今已稳定运行3年余.
- 汪东生黎晓新谢昆青
- 关键词:工作站服务器配置软件开发
- FP-growth算法的实现方法研究被引量:36
- 2004年
- 事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式时。JianweiHan等人提出了一种新颖的数据结构FP-tree及基于其上的FP-growth算法,用于有效的富模式与长模式挖掘。由于不同的实现方法可能会导致不同的挖掘效率,该文在讨论FP-growth算法的基础上,采用了几种不同的方法来实现它,并用几个数据库对它们的性能进行了比较。
- 王新宇杜孝平谢昆青
- 关键词:关联规则数据挖掘
- 空间Cube计算方法被引量:7
- 2002年
- 随着卫星勘测、遥感影像、GPS等系统的广泛应用,目前各行各业拥有了大量的地理空间数据。空间数据仓库技术将较为成熟的数据仓库和联机分析处理技术应用到空间信息领域,以有效地支持空间分析和决策。空间Cube的构建与维护是空间数据仓库和空间联机分析处理的一个核心问题。文章在介绍空间数据仓库模型和空间Cube的基础上,结合空间聚集计算的特点,给出了几种空间Cube计算的有效方法。
- 童云海谢昆青唐世渭
- 关键词:空间数据仓库计算方法地理信息系统
- SDML:基于空间数据库的空间数据挖掘语言被引量:11
- 2004年
- 设计了一种基于空间数据库的空间数据挖掘语言SDML。根据SDML操作的对象以及挖掘过程的不同阶段 ,SDML语言可以分为视图操纵语言和模型操纵语言 ,分别负责对于数据挖掘视图和模型的操作。详细阐述了SDML的设计思想及其设计方案 ,针对空间泛化和空间关联这两个典型的空间数据挖掘问题 。
- 高韬谢昆青马修军陈冠华
- 关键词:空间数据挖掘数据挖掘语言数据挖掘模型
- 一种具有实时和连续特性的城市交通状态预测系统及方法
- 一种具有实时和连续特性的城市交通状态预测系统,实时交通数据的预处理模块接受外界实时接受交通数据流,对其进行在线概化和特征提取预处理,并输入所述的交通状态参数的预测模块做出在线的交通参数预测。预测模型的主动监控模块实时监控...
- 宋国杰谢昆青
- 文献传递
- 机器学习课程的教学实践--以北京大学“智能科学与技术'本科专业为例
- 分析当前智能科学专业机器学习课程的教学情况,从问题导向的教学模式、以点带面的内容安排和实践导向的课程项目等几方面提出机器学习课程教学要领,以北京大学为例,具体说明教学实践过程。
- 邓志鸿谢昆青
- 关键词:智能科学与技术本科生教学教学实践