国家自然科学基金(69362001)
- 作品数:12 被引量:49H指数:3
- 相关作者:崔荣一洪炳熔朴相范徐善针周国强更多>>
- 相关机构:延边大学哈尔滨工业大学湖南科技大学更多>>
- 发文基金:国家自然科学基金湖南省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于引文相关性排序的科技论文检索方法被引量:3
- 2011年
- 为了实现学术主题相关的科技论文检索,提出了一种基于引文相关性排序的科技论文检索方法。自动抽取科技论文的结构信息,获得论文的标题、摘要、关键词和引文;根据引文与标题的相关性,评价引文的重要性,用引文的评价得分修正引文向量特征项的权重,构造引文的词项-文档关联矩阵,并利用奇异值分解方法构造引文的潜在语义空间,计算查询论文与文档库中论文的引文语义相关性;采用信息增益方法确定了引文相关性阈值,将引文相关性超过阈值的科技论文作为检索结果返回。实验结果表明,提出的检索方法的准确率、召回率、综合性能均高于基于概括性信息(标题、摘要、关键词)的检索方法。
- 尹盼盼崔荣一
- 关键词:潜在语义索引奇异值分解信息增益文本检索
- 微机网络数据库系统中数据统计的并行处理被引量:1
- 2006年
- 以电话话费计算为例,叙述了在w indows 2000局域网中用SQL Server 2000数据库管理系统实现数据统计并行处理的设计思想,这种并行算法提高了统计效率,确保了系统数据的安全性,而且能够做到在统计过程中某工作站的撤消与插入不影响最终统计结果.
- 徐善针崔荣一洪炳熔
- 关键词:并行处理数据分解局域网
- 基于交叉熵极小化的图像边缘检测算法被引量:2
- 2006年
- 提出了一种自然图像边缘检测的算法,通过差分运算把边缘检测问题转化为目标检测问题,利用交叉熵极小化方法使背景区域和目标区域内的灰度级分布与差分图像灰度级的先验概率(广义高斯分布)相匹配,确定了背景与目标之间灰度分界阈值,检测出图像的边缘成分。实验表明,提出的方法具有良好的边缘检测性能。
- 金永镐崔荣一金小峰
- 关键词:边缘检测差分图像广义高斯分布交叉熵
- 网络数据库系统中数据统计的并行处理
- 2006年
- 以上网费计算为例,叙述在W indow s 2000局域网中用SQL Server 2000数据库管理系统实现数据统计并行处理的设计思想,这种并行算法提高了统计效率,确保了系统数据的安全性,而且能够做到在统计过程中某工作站的撤消与插入不影响最终统计结果。
- 徐善针崔荣一洪炳熔
- 关键词:并行处理数据分解局域网
- 朝鲜文字信息结构的研究被引量:1
- 2011年
- 该文研究了朝鲜文字空间结构中不同位置上的基本字母对文字结构的分类所提供的信息贡献。首先,提出了文字的结构距离的概念与计算方法,描述了不同结构之间的差异;其次,研究了文字结构的等价类划分方法以及文字结构的概率分布;最后,通过计算结构分类时不同位置上的基本字母的信息增益,刻画了文字中信息的分布结构。对实际朝鲜语文档的实验表明,c1-v2、c1-v1-c3、c1-v2-c3型结构的文字具有显著的高概率特性,v1、v2类型和c3类型字母对结构分类的影响最大。
- 崔荣一金世珍
- 关键词:信息增益
- 基于朴素贝叶斯分类器的朝鲜语文本分类的研究被引量:13
- 2011年
- 该文基于朴素贝叶斯分类器对朝鲜语文本分类进行了研究。首先,利用基于类别选择的特征选择方法对朝鲜语文本进行特征选择,并使用类TF-IDF估算方法计算权重;其次,构造朴素贝叶斯分类器;最后,利用分类器实现对朝鲜语文本的分类。实验表明,该方法在朝鲜语文本分类中具有较好的效果,为朝汉结合文本分类提供了一定的依据。
- 周国强崔荣一
- 关键词:朝鲜语朴素贝叶斯文本分类TF-IDF
- 前馈神经网络隐层评测问题的研究被引量:3
- 2004年
- 分析了隐层输出向量组生成的表示空间与期望输出向量组生成的目标空间.通过计算隐单元的误差补偿值,对以隐层生长方式构建网络时,每个隐单元的误差补偿性能以及隐单元性能最优的充分必要条件进行了研究.结果表明:表示空间与目标空闽维数、隐单元数目以及每个隐单元的误差补偿效率决定了前馈神经网络隐层的评测因素.最后定义了隐层品质因子、隐层有效系数、隐单元剩余度和隐层评价因子,并通过对典型前馈网络的考察,验证了该评测方法的合理性和有效性.
- 崔荣一洪炳熔朴相范
- 关键词:三层前馈神经网络
- 线性化朝鲜文字的歧义性研究被引量:2
- 2008年
- 该文研究了线性化朝鲜文字重构过程中存在的固有的歧义性问题,并讨论了歧义性消除方案。首先,研究了描述朝鲜文字结构的形式化方法,给出朝鲜文字组成的基本规则和相应的有限状态自动机;其次,给出文字线性化与重构的数学描述,论证了文字重构时存在歧义性的必要条件和充分条件,并分析了线性化文字序列歧义度的本质和歧义性发生的概率;最后,讨论了文字重构歧义性消除的方案,给出了基于基本字母的在线式朝鲜文字序列输入算法和核心步骤,通过仿真实验验证了该方案的可靠性和有效性。
- 蔡京哲崔荣一
- 关键词:计算机应用中文信息处理
- 基于能量空间逼近策略的三层前馈神经网络隐层训练算法被引量:1
- 2003年
- 针对基于最佳平方逼近的三层前馈神经网络讨论了隐层生长模式的一种训练策略 首先根据隐层输出行为和期望输出数据的分布特征对样本数据确定的N维空间进行了不同意义上的划分 分析表明最有效的隐单元其输出向量应该在误差空间存在投影分量 ,同时该分量应位于目标空间中的某一能量空间内 在此基础上提出了基于能量空间逼近策略的隐层生长式训练算法
- 崔荣一洪炳熔
- 关键词:三层前馈神经网络
- 基于子空间分析的前馈神经网络隐层评测方法被引量:2
- 2004年
- 针对最佳平方逼近3层前馈神经网络模型,采用子空间分析方法,讨论了隐单元的误差补偿性能,提出了隐层评测方法.研究结果表明隐单元选取策略应遵循其输出向量有效分量位于误差空间、回避耗损空间和尽可能靠近某一能量空间的原则,这一结果与隐单元采用什么激发函数无关,也允许各隐单元采用不同激发函数.网络的隐层性能评价可以通过隐层品质因子、隐层有效系数、隐单元剩余度来进行,而总体结果可采用隐层评价因子进行评测.评测实验表明,所提出的隐层评测方法是合理有效的.图1,表1,参11.
- 朴相范崔荣一洪炳熔李白雅
- 关键词:三层前馈神经网络评测方法误差补偿子空间分析