黄源
- 作品数:12 被引量:243H指数:6
- 供职机构:南京大学计算机科学与技术系更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术文化科学更多>>
- 中文文档自动分类系统的设计与实现被引量:85
- 1999年
- 文档自动分类是信息处理领域中的一项重要研究课题。本文阐述了一个中文文档自动分类系统的设计与实现,并着重介绍了系统实现中的一些主要技术问题的处理,如文本分类模型、特征提取、词典构造等。
- 邹涛王继成黄源张福炎
- 关键词:VSM特征提取中文文档文档分类自动分类系统
- 数据挖掘及其技术实现被引量:15
- 2001年
- 数据挖掘解决在信息技术发展中存在的拥有大量数据但缺乏有用信息的问题,完成从业务数据到决策信息的转换。本文论述了数据挖掘的概念及其工作流程,针对不同的功能类型对数据挖掘的技术实现进行了分析,并且阐明了数据挖掘设计和实现中的若干关键问题。
- 黄源张福炎
- 关键词:数据挖掘神经网络信息技术数据库知识发现
- TrueType汉字字形编辑器的设计与实现
- "CFont Editor"是在Windows平台上,基于TrueType字形标准且适合汉字字形特点的,具有修字、拼字、补字等多种功能的汉字字形编辑器.在文中首先以"CFont Editor"总体设计和结构设计为背景...
- 黄源
- 关键词:汉字字形编辑器
- 一种两阶段的神经网络属性选择方法被引量:3
- 2003年
- 神经网络的输入属性选择一直是一个比较困难的问题.由于神经网络反复训练的时间复杂度,Wrap-per方法是不适用的,而单纯使用Filter方法也难以获得很好的分类精度.文中提出了一种两阶段的神经网络属性选择方法,以综合Filter和Wrapper两类方法的优势.该方法首先采用基于不一致率的遗传算法GFSIC来删除属性集合中的无关属性,然后采用基于敏感性度量的属性选择算法SBFCV来删除冗余和无用的属性.研究和实验结果表明,该方法可以有效地删除原始数据中的无关和冗余属性,增强神经网络的泛化能力.
- 王继成黄源武港山张福炎
- 关键词:神经网络遗传算法
- True Type汉字字形编辑器的设计与实现被引量:9
- 1998年
- 文中介绍了一个适合汉字字形特点的、基于TrueType字形标准的汉字字形编辑器,包括该编辑器的设计思想、关键技术以及实现情况.
- 黄源王瑜张福炎
- 关键词:汉字字形TRUETYPE字形信息处理
- 基于WWW的文本信息挖掘被引量:89
- 1999年
- 基于 Internet 的信息挖掘是数据挖掘和数据仓库技术中的重要组成部分,也是网络信息处理领域中的一项新课题。本文介绍了网络信息挖掘的概念,并给出了在 World Wide Web 上针对文本信息进行信息挖掘的算法和步骤。
- 邹涛黄源张福炎
- 关键词:数据挖掘信息挖掘INTERNETWWW
- 神经网络的模糊规则提取被引量:1
- 2001年
- 神经网络的“黑箱问题”为该技术的广泛应用带来了一定限制,由于神经网络在一定条件下可与模糊系统相互转换,从神经网络中提取模糊规则为“黑箱问题”的解决提供了有效手段。本文在阐述基本概念的同时,分析了把连续值网络转化为二值网络和从神经网络到模糊系统的转换进行模糊规则提取的两类方法,通过解决Iris问题的实验结果比较了两类方法的性能。
- 黄源张福炎
- 关键词:神经网络模糊系统
- 神经网络的规则提取研究被引量:21
- 1999年
- 文中论述了作为解决神经网络“黑箱问题”有效手段的规则提取方法,分析了基于结构分解和输入输出映射的神经网络规则提取的各种算法,概括了它们的基本思想并分析了它们的优劣,在相似权值法的基础上提出 C S W 算法,有效解决了连续值输入网络的规则提取问题.将 C S W 算法应用于 I R I
- 黄源萧嵘张福炎
- 关键词:神经网络
- 基于神经网络的数据挖掘技术研究
- 黄源
- 关键词:数据挖掘神经网络
- 基于神经网络的数据挖掘工具的研究
- 适合处理非线性和含噪声数据,神经网络技术在数据挖掘过程中得到了广泛的应用。该文分析了基于神经网络的数据挖掘工具中存在的一些问题如有效集成、规则加入和提取及输入输出接口,讨论了相应的解决措施并给出了一个简要的工作流程。
- 黄源吴钊张福炎
- 关键词:数据挖掘神经网络模糊规则OLAP