河北省自然科学基金(602127)
- 作品数:8 被引量:49H指数:4
- 相关作者:田学东郭宝兰安艳辉杨芳湛燕更多>>
- 相关机构:河北大学河北省工业和信息化厅河北省教育考试院更多>>
- 发文基金:河北省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于纹理特征的汉字字体识别研究被引量:6
- 2002年
- 介绍了字体识别的重要性和有待解决的问题,提出了一种利用Gabor滤波器提取版面纹理特征进行字体识别的方法,着重介绍了滤波器设计、纹理特征提取和字体识别的过程。这种方法是与内容无关的,不需要局部微细特征分析,可以解决实际版面样张印刷质量差、变形多的问题。用于常见字体的识别,取得了较好的效果。
- 田学东郭宝兰
- 关键词:纹理特征GABOR滤波器计算机
- 基于Gabor变换的汉字字体识别研究被引量:7
- 2002年
- 在分析汉字字体特征的基础上,介绍了利用Gabor滤波器,通过纹理分析提取全局特征进行汉字字体识别的方法。实验结果表明,这种方法是可行的、有效的。
- 田学东郭宝兰
- 关键词:GABOR变换纹理特征模式识别汉字信息处理计算机
- 斜线表格的分析与识别
- 2003年
- 提出了一种考虑斜线分隔符的通用表格的分析方法。在表格单元结构确定后,依据表格常识,用局部多角度投影的方法对表格单元进行斜线检测,在内容提交识别核心以前,针对含有斜线分隔符的单元格进行去除斜线操作。实验证明了此方法处理斜线表格的有效性。
- 史青宣田学东郭宝兰
- 关键词:表格处理软件计算机文档
- 用于字体识别的Gabor滤波角度GA优化方法被引量:5
- 2003年
- Gabor滤波角度对字体识别结果有重要影响,由于字体纹理与自然纹理的不同,现有的Gabor滤波器角度参数不适于提取字体纹理的有效特征。基于字体纹理的多变性,该文提出使用遗传算法通过对字体纹理的学习优化滤波角度参数,使之能够适应字体纹理的特点,以提高识别率。通过对常用的4种字体899块字体纹理样本的测试表明:遗传算法能够找到适合字体识别的角度参数,使用新的角度参数减少了识别时间,提高了字体识别率。
- 杨芳田学东郭宝兰
- 关键词:字体识别纹理特征遗传算法
- 基于字符类别的识别反馈混排字符切分方法被引量:1
- 2011年
- 字符切分是影响OCR系统识别的关键因素之一。对于中英文混排文档,提出了基于字符类别的识别反馈混排字符切分方法,利用字符特征分类判别出文档中的汉字类、英文、数字和标点符号类、部件类,对汉字类和部件类借助识别技术分别进行处理。该方法结构简单,容易实现,实验结果表明该方法切分效果好,字符类别判断准确。
- 安艳辉陈韶霞刘宗敏
- 关键词:字符切分分类器设计字符识别
- 基于文本聚类的LSI文本分类模型被引量:1
- 2012年
- 文本自动分类是文本挖掘的基础,可广泛地应用于信息检索,web挖掘等领域.在分类前首先要将文本表示成计算机能处理的形式,提出了一种将隐含语义索引(LSI)与文本聚类相结合的中文文本自动分类的方法.在挖掘文本的语义信息,提高分类速度上均取得了较好的效果.通过实验验证了方法的有效性.
- 邱志宇安艳辉
- 关键词:文本分类文本聚类
- 使用遗传算法实现K-means聚类算法的K值选择被引量:29
- 2003年
- 针对无导师聚类K 均值算法中K值的选取问题 ,提出了使用遗传算法 (缩写为GA)优化K值参数的方法。通过对UCI机器学习数据库中 7类数据的实验 ,表明本方法是比较有效的。
- 杨芳湛燕田学东郭宝兰
- 关键词:遗传算法K-MEANS聚类算法数据库
- 一种改进的字体纹理识别方法
- 把不同字体文本看作不同的纹理,使用Gabor滤波器提取纹理特征,通过识别纹理来识别字体是一种简便有效的方法。但是,现有的字体纹理识别方法没有考虑字体纹理本身的特点,因此本文对原有方法在两方面加以改进以提高字体识别率:通过...
- 杨芳田学东郭宝兰
- 关键词:字体识别GABOR滤波器纹理特征字典
- 文献传递
- 粘连搭接字符切分方法研究被引量:4
- 2005年
- 字符切分是影响OCR系统识别的关键因素之一.对于中英文混排粘连搭接字符图像,提出了一种基于识别反馈的字符切分方法.该方法结构简单,容易实现,实验结果表明该方法有较好的切分效果.
- 安艳辉董五洲
- 关键词:字符切分OCR系统图像