江苏省自然科学基金(BK2003030)
- 作品数:27 被引量:116H指数:7
- 相关作者:朱巧明李培峰吕强钱培德周蕾更多>>
- 相关机构:苏州大学江苏省计算机信息处理技术重点实验室常熟理工学院更多>>
- 发文基金:江苏省自然科学基金江苏省教育厅自然科学基金江苏省高技术研究计划项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 数据缺失下学习贝叶斯网的一种混合启发方法被引量:1
- 2008年
- 建立了具有数据缺失训练集下学习贝叶斯网的一种混合启发方法:SGS-EM-PACOB算法。它基于打分-搜索方法,利用GS和EM数据补全策略分别得到学习所需要的统计因子,并将两者联合起来作为PACOB算法的启发因子。实验证明,SGS-EM-PACOB算法充分保留GS和EM两者的优点,促使算法能够平稳地收敛到理想结果。相对于只具有单一数据补全策略的算法,该算法不仅在度量数据拟合程度的Logloss值上保持稳定,而且在学习到的贝叶斯网络结构上也有改进。
- 廖学清吕强
- 基于统计和规则的未登录词识别方法研究被引量:25
- 2007年
- 介绍了一种基于统计和规则的未登录词识别方法。该方法分为2个步骤:(1)对文本进行分词,对分词结果中的碎片进行全切分生成临时词典,并利用规则和频度信息给临时词典中的每个字串赋权值,利用贪心算法获得每个碎片的最长路径,从而提取未登录词;(2)在上一步骤的基础上,建立二元模型,并结合互信息来提取由若干个词组合而成的未登录词(组)。实验证明该方法开放测试的准确率达到81.25%,召回率达到82.38%。
- 周蕾朱巧明
- 关键词:未登录词识别贪心算法互信息
- 基于Pocket PC的汉字输入系统的设计与实现被引量:4
- 2006年
- PocketPC是PDA中最常用的操作系统.本文分析了PocketPC的输入机制,并在此基础上从系统构架和输入码对照表结构这两个方面设计了一个基于PocketPC的汉字输入系统,该系统具有简繁通用、检索效率高等特点.另外,本文还描述了在系统设计和实现中的一些关键技术.
- 李培峰朱巧明钱培德
- 关键词:输入接口POCKETPC
- 面向Web应用集成的统一授权平台的设计与实现被引量:6
- 2006年
- 每个应用系统都会有一个访问控制模块,分散的访问控制管理会导致访问控制策略不统一和数据冗余等问题。提出了一种基于Web服务的面向Web应用集成的统一授权平台,该平台用于实现用户信息的集中存储和分布管理,以及统一的访问控制管理。该方案不仅可以提高应用系统的安全性而且可以减轻系统维护和系统开发的工作量,是开发“一站式”信息共享平台的基础设施。
- 张苏李培峰杨季文朱巧明
- 关键词:访问控制WEB服务
- 一个面向信息处理的双向文字处理算法IBidi被引量:2
- 2007年
- 根据多文种信息处理中双向文字所存在的问题,提出了一种面向信息处理、具有自描述能力的双向文字处理算法IBidi。该算法首先对字符流进行预处理,主要对数字等特殊的字符进行标注;然后分析字符流,添加各种定义好的标签,用于描述字符的特性,供信息处理系统使用;最后,IBidi利用一个重新排序算法输出处理结果。该算法在典型测试样本上正确率达到96.7%,比Unicode的双向文字处理算法高出约17个百分点。另外,在随机样本测试中,IBidi的正确率也比Unicode的双向文字处理算法高5%左右。
- 李培峰朱巧明钱培德
- 关键词:标签
- 基于最大熵模型的邮件过滤系统研究被引量:1
- 2006年
- 将最大熵模型引入到邮件过滤中,结合邮件的半结构化特性,给出改进的特征函数定义,形成邮件特征向量。在此基础上,构造出基于最大熵模型的邮件过滤系统的基本框架。实验结果表明,这种过滤方法在召回率、准确率等方面表现出了良好的性能。
- 司广涛李培峰朱巧明李军辉
- 关键词:最大熵模型特征提取邮件过滤
- 一个应用于手持设备的汉字通用输入模型被引量:5
- 2006年
- 分析了现有汉字输入模型应用在手持设备时存在的缺点,提出了一个能适用于各种手持设备的汉字通用输入模型。该模型由通用引擎接口层、通用输入流处理层与通用数据处理接口层组成,其框架采用面向对象技术设计,能支持多种手持设备操作系统,并具有良好的通用性、透明性和可扩展性;介绍了模型各个层的功能以及具体的设计技术;说明了模型中各层之间的协作关系。
- 李培峰朱巧明钱培德
- 关键词:汉字输入
- 新蚁群算法模型在大学课程时间表问题中的应用被引量:2
- 2009年
- 分析大学课程时间表问题的特征,结合已有蚁群算法的求解策略,构建了新的问题求解模型,提出了一种基于蚁群算法和改进过程的求解算法,并在不同规模的问题实例上进行实验。结果表明,算法在目标函数解的质量上有明显改进。
- 吴小娟吕强
- 关键词:蚁群算法局部搜索
- 基于信息网格的分词服务的研究被引量:7
- 2006年
- 文章首先分析了信息网格的体系结构,然后基于开放网格服务结构的核心思想提出了一个构筑在信息网格上的中文分词服务,并重点介绍了该服务基于OGSA的架构的设计技术以及面向服务的应用。
- 郭翠珍朱巧明李培峰钱培德
- 关键词:汉语分词信息网格开放网格服务结构
- 中文邮件语料库建设及其分类研究
- 首先分析了建立中文邮件语料库的重要性和难点,在此基础上,建立了一个实用的、规范的中文邮件语料库;然后,介绍了一种时空复杂度低的、适合在线学习的Winnow算法,并通过实验验证了该算法的优良效果;最后,通过增加邮件分类系统...
- 朱巧明周志军李培峰
- 关键词:WINNOW
- 文献传递