国家自然科学基金(60772073)
- 作品数:15 被引量:76H指数:5
- 相关作者:田学东周伯生罗文劼张欣王兵更多>>
- 相关机构:河北大学北京航空航天大学华北电力大学更多>>
- 发文基金:国家自然科学基金河北省科学技术研究与发展计划项目北京市科技计划项目更多>>
- 相关领域:自动化与计算机技术电气工程建筑科学更多>>
- 基于切片技术获取系统测试用例的方法被引量:5
- 2008年
- 针对如何获取局部和全部的系统测试用例,确保其正确性和完备性以及与需求的一致性问题,提出利用先进的建模技术,建立可模拟验证的过程模型,并应用切片技术获取测试用例,并利用基于过程模型结构分析的归纳法证明了该法的正确性,根据过程模型切片准则获取系统测试用例的算法,介绍了实现工具的构成和应用实例。
- 罗文劼周伯生王慧朱令娴
- 基于最小生成树聚类的中文版面分割法被引量:2
- 2008年
- 针对中文版面多横竖混排的特点,提出一种基于最小生成树聚类的版面分割方法。对原图像进行水平和垂直游程平滑,并对平滑后所得的连通域进行预分类处理,将文本进行横排、竖排分类。对预分类后的各类文本采用最小生成树聚类算法进行聚类处理。经实验,准确率达97%。实验表明,该方法对中文文档有良好的分割效果。
- 张充苗秀芬司建辉史青宣田学东
- 关键词:版面分割
- 基于CMMI的软件过程性能模型被引量:15
- 2009年
- 在高成熟度组织的CMMI(能力成熟度模型集成)实施过程中,正确的建立并使用过程性能模型对有效的策划、预测、监督和控制组织过程有显著的作用。在分析并建立4个基本的过程性能模型之间的关系之后,以生命周期模型的定义为基础,提出了基于GQM的度量模型构建方法、资源模型构建方法以及质量模型构建方法,由于各过程性能模型的信息和数据都来源于生命周期模型,因而可以有效保证其之间信息与数据的一致。
- 王慧周伯生罗文劼
- 关键词:CMMI生命周期模型GQM资源模型
- 基于综合纠错的印刷体数学公式识别后处理被引量:2
- 2007年
- 目前印刷体数学公式识别系统的输出还存在着误识结果,进行必要的后处理是提高识别率的重要手段。介绍了一种将印刷体数学公式识别结果与公式的语义知识相结合的方法,对其误识结果进行系统的分析,给出了若干条共有的规则及基准转移等方法,进行综合纠错的后处理,从而进一步完善印刷体数学公式识别系统。实验结果表明,该方法能够有效地提高系统识别结果的正确率。
- 田学东王文姣
- 关键词:后处理
- 基于领域本体的Deep Web内容获取技术研究被引量:1
- 2011年
- 为了用户方便快速地使用Deep Web中的信息,对在线数据库中的内容进行获取是一种行之有效的方法。本文设计了一种基于领域本体的Deep Web数据库内容获取技术,利用训练数据库训练构建领域本体,通过领域本体中的有效查询项获得查询关键字集,对数据库内容进行查询,最终获得Deep Web内容。通过实验证明,该方法能有效地获取Deep Web中的大部分内容,用户可以通过搜索引擎更快更方便地查询Deep Web中的信息。
- 张明刘宇郗亚辉
- 关键词:领域本体DEEPWEB
- 基于神经网络的印刷体数学公式抽取方法被引量:1
- 2008年
- 在分析中文印刷文档版式及字符特征的基础上,提出了一种将决策树与BP神经网络相结合的数学公式抽取方法。采用决策树方法将孤立公式从文档中抽取出来,采用BP神经网络方法定位内嵌公式。实验表明,该抽取方法对中文文档的公式抽取具有较高的正确率、容错率和速率。
- 常新峰崔键刘晓蔚田学东
- 关键词:光学字符识别决策树BP神经网络
- 视觉文档图像的几何校正被引量:13
- 2007年
- 在以数码相机等数字设备拍摄文档资料时,所拍摄的图像经常会产生各种各样的几何变形,这种变形可能会导致识别软件中的版面分析和切分算法失效,从而使文档图像无法被识别。为了使普通的识别软件能够对数码相机等拍摄的文档图像进行识别,有必要对其进行几何校正。根据几何变形产生的原因对其进行了分类,并针对不同种类的变形提出了相应的校正算法。实验结果证明该分类方法和相应校正算法都有较好的效果。
- 田学东马兴杰韩磊刘海博
- 关键词:OCR视觉文档图像
- 基于神经网络的交互式炉膛火焰图像识别被引量:21
- 2008年
- 炉膛火焰燃烧状态监测的关键技术之一是炉膛火焰图像的分类和识别。由于炉膛火焰燃烧过程的复杂性,使得准确反映炉膛火焰燃烧状态的火焰图像特征参数难以确定,在用神经网络训练方法构造分类器时,神经网络的收敛速度和识别的准确性不能同时满足实际要求。文中提出了交互式火焰图像识别方法,改善神经网络的分类识别性能。在神经网络的构造过程中,将人对神经网络分类器构造结果的评价信息反馈给网络,使其根据反馈信息进一步修正分类器。由于将人工的修正信息引入到分类器构造中,加快了神经网络的收敛速度,提高了神经网络识别的准确性。对4000幅火焰图像的实验显示了此方法的有效性。
- 韩璞张欣王兵潘卫华
- 关键词:神经网络交互方式
- 基于多特征模糊模式识别的公式符号关系判定被引量:8
- 2009年
- 数学表达式的识别过程中,结构分析是非常重要的一步。而符号关系的判定又是结构分析的关键。然而符号间关系的不确定性导致数学表达式运算含义的模糊性,已经成为数学公式识别中结构分析的一大难点。通过大量的统计数据,抽取出较为明显的特征,并引入多特征模糊模式识别的方法,建立隶属函数来判断印刷体数学公式符号的关系。实验结果表明,该方法适用范围较广,准确率较高,具有较强的鲁棒性。
- 田学东吴丽红赵蕾蕾
- A Feature Extraction Method Using Base Phrase and keyword In Chinese Text
- The feature extraction is the most key technology of text categorization.The word is used as the feature in th...
- Xin-fu LI