常娥 作品数:48 被引量:432 H指数:10 供职机构: 东南大学图书馆 更多>> 发文基金: 国家社会科学基金 教育部人文社会科学研究基金 国家科技基础性工作专项 更多>> 相关领域: 文化科学 自动化与计算机技术 经济管理 农业科学 更多>>
基于LSI理论的文本自动聚类研究 被引量:4 2012年 结合潜性语义索引(latent semantic index,LSI)理论和K-means聚类法,提出一种改进的文本自动聚类方法,即首先利用N-gram统计法抽取文档关键词,并应用潜性语义索引LSI对构建文档的向量空间模型进行降维,然后采用K-means算法进行文本聚类。实验表明,该算法进行文本聚类的准确度最高可达84.7%。 常娥关键词:文本聚类 古籍智能处理技术研究——农业古籍自动编纂和自动校勘的研究 我国古籍数字化工作起步于20世纪80年代初,至今已经取得了令人瞩目的成就,主要标志是一批大规模、基础性的古籍著作被开发为真正意义上的数字化产品,并成功走向市场。相关研究论文很多,其中主要对古籍数字化的现状、发展趋势及对策... 常娥关键词:农业古籍 古籍整理 专家系统 文献传递 图书馆资源组织中的数据关联特征研究 被引量:4 2016年 深刻描述和揭示馆藏资源与数据自身及其之间各种复杂语义关系是图书馆资源组织的重要问题。文章分析了馆藏资源数据化转变问题,并重新界定了馆藏资源的类型,探索从资源外部到内部所存在的各种数据关联的特征、层次和基本结构,重点研究书籍、文章,以及其他学术文献与其内部原始数据、模型、算法等知识项的关联问题。 常娥 孟祥保关键词:数据关联 知识关联 资源组织 馆藏资源 古代农业专题资料自动编纂的设计和研究 被引量:1 2007年 古代农业专题资料自动编纂是利用计算机自动从古代农业专题资料中发现并摘录与某一主题相关的农业资料,并编纂成册。本文首先阐述了古代农业专题资料自动编纂的意义,接着比较了它和自动文摘的关系,然后就其自动编纂的流程和算法进行了设计,最后总结本文的写作目的。 常娥 侯汉清关键词:自动文摘 自动分词 古籍自动校勘的研究和实现 被引量:15 2007年 古籍自动校勘是指利用计算机自动发现并标记出古籍不同版本之间的文字差异,并提供各种校勘辅助工具帮助专家勘误。本文讨论了古籍自动校勘的意义,接着详细阐述了古籍自动校勘系统的总体设计及其实现,包括选题和资料收集、自动校勘的对象和方法,最深入讨论了古代官名表、人名表、地名表等自动校勘辅助工具的建设问题。最后,设计了实验检查校勘系统的效果。实验结果表明,本系统的召回率和精确率分别达到了92.3%、95.2%。 常娥 侯汉清 曹玲关键词:计算机应用 中文信息处理 古籍整理 我国期刊版本信息著录情况调查与研究 2020年 文章在厘清期刊版本及版别的概念内涵的基础上,选择了若干种具有版本及版别关系的代表性期刊,并在中国国家图书馆、深圳图书馆、浙江大学图书馆、北京大学图书馆等10所图书馆的馆藏目录中调查、分析这些期刊的版本著录情况。研究发现,国内图书馆界对于期刊版本信息的著录与管理十分薄弱,期刊版本著录存在着版本与版别不分的尴尬现状,建议图书馆进一步明晰期刊版本项、附注项以及题名项版本信息著录内容,著录时具体问题具体分析,并由专门馆员负责期刊版本信息编目与维护。 张悦 常娥关键词:版本信息 期刊管理 农史专题资料自动编纂系统的构建与测试 被引量:4 2009年 农史专题资料自动编纂是古籍智能化整理与开发研究工作的重要组成部分。本文设计了系统的总体结构,并对各模块的主要功能和实现的关键技术进行了详细的阐述。最后以"稻"、"麦"、"豆"、"棉"、"麻"为测试主题,对包括《齐民要术》、《农政全书》等在内的10部重要的农业古籍,共2432篇文献,约93万字进行自动编纂效果测试研究。结果表明,得分良好的自动编纂结果占到了72.2%。 常娥关键词:农业古籍 古籍数字版本的权威定本问题探究——以《老子·道德经》为例 被引量:2 2021年 古籍数据库为文史研究提供了全新的技术手段,已成为文史研究的必备资源。但由于目前各种古籍数据库错漏讹误较多,存在缺少学术引用信誉的弊端,古籍版本学亟需解决古籍数字版本的权威定本问题。文章在阐释古籍数字版本基本概念和分析古籍数字版本特点的基础上,以《老子·道德经》数字版本为例,对其进行比较和评鉴,最后提出确定古籍数字版本权威定本及引用的方法和策略。 常娥 李慧芳关键词:古籍 大众媒体信息资源管理研究 被引量:1 2009年 从延长大众媒体产品使用周期和保护公民信息权的角度出发,在综合调研国内外大众媒体信息资源管理相关研究的基础上,针对目前大众媒体信息资源管理存在的垄断、管理技术和经费等问题,从确定责任人,建立分类体系等几个方面,有针对性地提出了管理措施,从而使之真正成为大众免费、自由获取的信息资源。 常娥 袁曦临关键词:大众媒体 数字资源保存 机读目录中文献版本关系识别与挖掘研究 2018年 实现同种文献不同版本数据的有效聚集,可以满足用户多重阅读与研究需求。在深入分析文献版本相关概念和常用文献版本资源聚集方法基础上,以中文机读书目数据为例,采用同一种文献不同版本数据归类与识别模型,并以Les trois mousquetaires为例,进行该文献不同版本资源的聚集与归类实验表明,所采用的文献版本资源识别模式能够较好地实现同一种文献不同版本资源的聚集,但对于题名变动较大或改换题名的同一种文献识别效果一般。 赵娅娜 常娥关键词:书目数据 机读书目