国家自然科学基金(60603092)
- 作品数:18 被引量:79H指数:5
- 相关作者:宁慧顾国昌王科俊唐立群李永华更多>>
- 相关机构:哈尔滨工程大学哈尔滨工业大学哈尔滨师范大学更多>>
- 发文基金:国家自然科学基金国家教育部博士点基金国家高技术研究发展计划更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 基于可拓学理论的汉语词义消歧被引量:1
- 2006年
- 应用可拓学原理,对歧义词进行可拓分解、可拓置换等可拓变换,为歧义词的各个词义建立相应的可拓集合,利用可拓集合中义原词语从大规模语料中自动获取歧义词的语言信息,建立无指导的词义消歧模型.该方法克服了从无词义标注语料中获取词义消歧知识的难题.实验证明,该方法用于汉语的词义消歧切实可行,平均正确率达到90.16%.
- 卢志茂刘挺李生
- 虚拟校园漫游系统优化算法研究被引量:1
- 2009年
- 虚拟校园是可视化技术需求最为迫切的领域之一,虚拟现实技术可以广泛应用在虚拟校园的各个方面,并带来切实的效益.以第2炮兵士官学校虚拟校园的建设为例,对虚拟校园实时漫游系统的建模技术、实时显示技术、渲染技术的优化方法进行了分析,给出了模型优化、场景调度、渲染加速、实时驱动的计算方法,并对可见性判定和消隐技术、细节层次模型、纹理映射技术等进行了初步研究.
- 宁慧原庆凯潘虹吴悦
- 关键词:虚拟现实实时漫游纹理映射
- Web日志中时态约束浏览模式挖掘算法研究被引量:3
- 2008年
- 为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Apriori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值.
- 宁慧李红宇吴培莲
- 关键词:WEB日志挖掘频繁访问模式
- 新的联合三角形法和经验模态分解的水下目标回波检测被引量:1
- 2011年
- 水下目标回波信号的自动检测和识别是水声装备自动化的关键任务之一。大量的混响干扰,一个脉冲周期内有多个目标或没有目标,以及目标边界的模糊性和位置的随机性,是目标检测的难点。对回波信号进行经验模态分解,目标信号的绝大部分信息将集中在某个固有模态函数上,且产生明显的边界,而各种噪声和干扰成分被分解到其他固有模态函数上。基于此,提出在固有模态函数包络上用三角形法定位目标及双阈值检测精确的目标边界的算法;提出目标回波的固有模态函数瞬时幅度方差谱特征。海上实测回波数据的实验,从检测目标个数和识别率两方面来验证算法的性能,并与其它方法进行对比。实验表明该算法能任意定位和准确检测回波中的目标,且不受脉冲噪声的影响,检测效率高。
- 聂东虎张汝波李雪耀
- 关键词:经验模态分解三角形法双阈值
- 一种新的入侵检测方法被引量:1
- 2008年
- 随着Internet网络的快速普及,针对计算机及网络基础设施的攻击已经成为了一个越来越严重的问题.针对入侵检测技术提出了一种基于敏感时间滑窗的检测算法STSW,扩展了数据挖掘在入侵检测中的应用.以KDD CUP99作为实验数据研究了参数的选取对检测效果的影响,将该算法的执行效率与基于SPADE挖掘序列模式的入侵检测算法进行了对比.结果表明:入侵检测算法可以取得比较满意的检测效果,并且执行效率要优于基于SPADE的入侵检测算法.
- 宁慧于翔吴培莲吴悦
- 关键词:入侵检测数据挖掘关联规则
- 基于矩阵谱分析的文本聚类集成算法被引量:7
- 2009年
- 聚类集成技术可有效提高单聚类算法的精度和稳定性,其中的关键问题是如何根据不同的聚类成员组合为更好的聚类结果.文中引入谱聚类算法解决文本聚类集成问题,设计基于正则化拉普拉斯矩阵的谱算法(NLM-SA).该算法基于代数变换,通过求解小规模矩阵的特征值和特征向量间接获得正则化拉普拉斯矩阵的特征向量,并用于后续聚类.进一步研究谱聚类算法的关键思想,设计基于超边转移概率矩阵的谱算法(HTMSA).该算法通过求解超边的低维嵌入间接获得文本的低维嵌入,并用于后续K均值算法.在TREC和Reuters文本集上的实验结果验证NLMSA和HTMSA的有效性,它们都获得比其它基于图划分的集成算法更为优越的结果.HTMSA获得的结果比NLMSA略差,而时间和空间需求则比NLMSA低得多.
- 徐森卢志茂顾国昌
- 关键词:聚类分析聚类集成谱聚类文本聚类
- 中文文本分类中特征选择方法的研究被引量:4
- 2007年
- 本文研究了文档频率DF、信息增益IG、互信息MI、x2分布(CHI)、期望交叉熵、优势率、文本证据权七种不同的特征选取方法。针对DF对高频词过于依赖,以及MI,IG和CHI对低频词过于依赖这一特点,试验了将它们组合起来形成DF—MI,DF-IG两种组合式特征选择方法,同时针对DF的特点提出了新的特征选取方法DFR,用KNN分类器试验了几种组合方法和DFIK方法,实验结果表明DFIK较DF—MI、DF—IG对分类效果有明显的提高,而组合特征选取方法较单个特征选取方法对分类器的分类效果有了很大的提高。
- 宁慧吕志龙
- 关键词:文本分类特征选取KNN
- 基于影子显示位图技术的GIS图形部分的实现被引量:2
- 2009年
- 在地理信息系统的开发过程中,对屏幕图形进行精确识别是一个较难解决的技术问题.在某些实际应用中,近似处理的误差已经超过了人们所能接受的程度.该文就地理信息系统中的图形识别技术提出了一种全新的方法--影子显示位图(shadow display bitmap)技术.影子显示位图技术用于精确地识别显示在屏幕上的各种简单的和复杂的图形元素.该文论述了影子显示位图技术的工作原理和实现方法,通过实验证明影子显示位图技术解决了识别图形元素时的误差问题,识别复杂图形元素的能力强,比常用图形识别技术容易实现.
- 宁慧费建刚李红宇
- 关键词:地理信息系统
- 基于粗约简的数据流增量聚类算法被引量:2
- 2009年
- 针对数据流聚类算法CluStream需预先指定微聚类数目无法准确描述数据流的变化,进而影响最终聚类结果的缺陷,提出了基于粗约简的数据流增量聚类算法RICStream(rough incremental clustering stream).该算法在保证聚类精度的前提下,对参与聚类的数据流属性进行动态调整,有效地减少了聚类时间和计算量.提出了一种可增量调整的网格结构以存储数据流,保证了聚类结果能有效反映数据流的变化情况.基于真实数据集和仿真数据集的实验结果表明,RICStream算法具有较高的效率和聚类精度.
- 印桂生于翔宁慧
- 关键词:数据挖掘聚类数据流
- 基于信息增益改进贝叶斯模型的汉语词义消歧被引量:9
- 2008年
- 词义消歧一直是自然语言处理领域的关键问题和难点之一。通常把词义消歧作为模式分类问题进行研究,其中特征选择是一个重要的环节。该文根据贝叶斯假设提出基于信息增益的特征选择方法,并以此改进贝叶斯模型。通过信息增益计算,挖掘上下文中词语的位置信息,提高贝叶斯模型知识获取的效率,从而改善词义分类效果。该文在8个歧义词上进行了实验,结果发现改进后的贝叶斯模型在消歧正确率上比改进前平均提高了3.5个百分点,改进幅度较大,效果突出,证明了该方法的有效性。
- 范冬梅卢志茂张汝波潘树燊
- 关键词:词义消歧自然语言处理信息增益贝叶斯模型