谷波
- 作品数:24 被引量:64H指数:4
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家高技术研究发展计划国家自然科学基金山西省回国留学人员科研经费资助项目更多>>
- 相关领域:自动化与计算机技术文化科学自然科学总论语言文字更多>>
- 一种基于GP的中医药专利命名实体自动识别方法
- 一种基于GP的中医药专利命名实体自动识别方法,其特征是通过模型的主动学习来实现中医药专利文献特征的自动抽取,然后根据所提取特征信息实现命名实体标注。本发明将遗传规划应用于中医药专利命名实体识别任务,使算法可以进行主动学习...
- 张亚宇谷波钱宇华马国帅
- 基于粗集模型的聚类方法及其在文献过滤系统中的应用
- 信息过滤(Information Fitering)是一种个性化的、主动的信息服务机制,是对传统信息检索服务的有益的补充.信息过滤包括许多内容,如声音、图像和文本等等,在该文中,我们主要指对文献的过滤.聚类(Cluste...
- 谷波
- 关键词:信息过滤用户兴趣模型文本聚类向量空间模型
- 基于项目驱动的大学生计算思维能力培养
- 2024年
- 文章首先分析了大学生计算思维能力现状,然后提出了基于项目驱动的大学生计算思维能力培养模式,包括项目式学习模式设计、项目实施过程与方法,最后论述了基于项目驱动的大学生计算思维能力培养实践。
- 杨陟卓张虎杜航原谷波
- 关键词:大学生
- 一种汉语二分结构的句法分析方法
- 本发明公开了一种汉语二分结构的句法分析方法,从汉语成分的内部结构出发构建句法树,将句子成分的内部限定为二分结构,更加适合汉语的句法特点;使用简洁高效的哈夫曼编码来表示和描述,易将原始的句子和句法树的表示相分离,节省存储空...
- 谷波王瑞波李济洪
- 有限汉语框架语义知识库构建技术研究
- 刘开瑛由丽萍李济洪李茹郝晓燕李禄贾君枝吕国英张惠春张双喜刘建刚姜忠市刘焘刘伟王振强谷波李黎董佳蓉赵玉娟张娜
- 技术说明有限汉语框架语义知识库构建技术研究是根据当前万维网技术的发展趋势和自然语言处理的现状自选的课题。该课题研制了一个以有限词语集合为描述对象的汉语框架语义知识库(Chinese FrameNet,简称CFN),并尝试...
- 关键词:
- 关键词:汉语框架语义自然语言处理
- 一种自然语言搜索的方法和装置
- 本发明公开了一种自然语言的搜索方法和装置,该方法为:构建汉语框架知识库CFN和专业领域知识本体库,然后利用汉语框架知识库对自然语言搜索输入的查询语句进行汉语框架语义角色自动标注,并根据所述标注从查询语句中提取具有语义信息...
- 李茹刘开瑛由丽萍王文晶高俊杰王瑞波吕国英谷波李双红钟立军彭洪宝陈雪艳郭海旭宋小香邢欣刘海静郭韦昱孙占虎
- 文本数据建模中的机器学习重抽样理论与方法被引量:1
- 2023年
- 在文本数据建模中,许多研究发现目前广泛使用的神经网络大模型,在常用的hold-outCV下,难以正确评估和优化模型,学习到的模型的预测性能稳定性也较差。为此,本课题研究和开发了一种统计机器学习新的重抽样方法,内容包括数据切分、模型的超参数调优、模型评估指标的统计分布、多个模型聚合、模型比较的假设检验和置信度计算等,称为组块正则化交叉验证(mX2BCV)建模方法,并从统计机器学习的模型评估和选择的基础理论上,论证了该方法的优良性,最后,在汉语句法语义自动分析器的建模中,验证了方法的可行性和优良性,开发完成了一个高性能的汉语句法语义分析器,为基于文本数据的稳健建模开辟了新途径。
- 李济洪王钰王瑞波杨杏丽曹学飞谷波牛倩薛彦
- 关键词:文本数据
- 文本聚类算法的分析与比较被引量:27
- 2003年
- 聚类是一种重要的数据挖掘形式。介绍了常用的文本聚类算法 ,从各种聚类算法的适用范围、初始参数的影响、终止条件以及对噪声的敏感性等方面对其进行了分析比较。
- 谷波张永奎
- 关键词:中文信息处理文本聚类算法信息过滤知识发现
- 面向标注数据稀缺专利文献的科技实体抽取被引量:4
- 2021年
- 专利中的科技实体是指专利文献中富含科技信息的词汇,抽取专利中的科技实体对科研工作者提高科研效率、企业布局专利体系都至关重要。提出一种基于半监督学习框架与命名实体识别模型相结合的科技实体抽取方法,半监督学习能够利用无标记数据的优势弥补标注数据稀缺的缺陷,利用大量的专利语料在通用领域的BERT模型基础上进行预训练,得到适用于专利领域的BERT模型BERT-Patent,有效提升模型对专利中科技实体的抽取性能。在专利数据集上的实验结果表明,提出的方法在准确率、召回率、F1值指标上分别提高了6.37%、2.99%、4.63%;在人民日报数据集上准确率、召回率、F1值分别提高了2.87%、1.24%、2.07%。
- 原之安彭甫镕谷波谷波
- 关键词:半监督学习
- 基于框架语义的汉语文本知识表示方法
- 本文研究一种基于框架语义的汉语文本知识表示方法,该方法正在汉语框架网络工程(CFN)中实施应用。文章构建了表示禽流感新闻报道所需的部分框架及其关系,从已经建立好的禽流感新闻语料库中选取一篇报道,示范性地提取了文本框架语义...
- 赵园丁由丽萍张惠春谷波刘开瑛
- 关键词:知识表示文本理解框架语义