国家社会科学基金(08ATQ002)
- 作品数:15 被引量:79H指数:5
- 相关作者:侯汉清黄建年王雅戈常娥衡中青更多>>
- 相关机构:南京农业大学常熟理工学院东南大学更多>>
- 发文基金:国家社会科学基金教育部人文社会科学研究基金江苏省社会科学基金更多>>
- 相关领域:文化科学自动化与计算机技术更多>>
- 民国文献数字化整理研究——以民国农业文献数字化整理为例被引量:18
- 2009年
- 民国文献载体质量较差,收藏和保护措施不力,自然损耗和人为毁坏严重,面临着断层的危机,但是目前社会需求日益增加,因而需要迅速加以抢救、保护和开发利用。中国农业遗产数字化研究所,在普查民国农业文献的基础上,提出并试验民国农业文献数字化整理方案和技术,制订民国农业文献元数据方案、编制分类表和主题词表,建成文献数据库、知识库、主题网关,开展民国文献数据挖掘试验。
- 王雅戈侯汉清黄建年
- 关键词:民国文献农业文献知识组织
- 苏州民国文献收藏保护与开发利用研究被引量:4
- 2014年
- 文章通过对苏州民国文献收藏保护与开发利用情况的调查了解到,苏州民国文献建成了目录数据库,可供在线检索,但是数字化开发能力有限,文献利用和应用效率不高。为了促进苏州民国文献的保护开发利用,应提高保护意识,制定保护政策;开展"再生性"和"原生性"双重保护;建立联合目录,完善检索系统;开发编研产品,满足用户需求。
- 杭亚杨王雅戈陆琳
- 关键词:民国文献数字化
- 农史专题资料自动编纂系统的构建与测试被引量:4
- 2009年
- 农史专题资料自动编纂是古籍智能化整理与开发研究工作的重要组成部分。本文设计了系统的总体结构,并对各模块的主要功能和实现的关键技术进行了详细的阐述。最后以"稻"、"麦"、"豆"、"棉"、"麻"为测试主题,对包括《齐民要术》、《农政全书》等在内的10部重要的农业古籍,共2432篇文献,约93万字进行自动编纂效果测试研究。结果表明,得分良好的自动编纂结果占到了72.2%。
- 常娥
- 关键词:农业古籍
- 农业古籍断句标点模式研究被引量:27
- 2008年
- 农业古籍的整理已经引起了众多学者和专家的注意,但是,对于农业古籍的自动断句、标点模式的研究仍付之阙如。本研究探索并总结出部分农业古籍断句、标点识别模式。首先采用句法特征词断句法、同义语标志词法进行初步断句;进而利用反义复合词、引书标志、时序、数量词、重叠字词、动名结构及比较句法进一步对子句进行断句、标点;最后使用农业用语和禁用模式表进一步提高断句、标点后农业古籍的可读性和准确性。经测试表明,断句、标点的平均准确率分别达到48%和35%,证明本方法具有一定的正确性和可行性。
- 黄建年侯汉清
- 关键词:中文信息处理农业古籍古农书古籍整理断句标点
- 基于向量空间模型的古汉语词义自动消歧研究被引量:6
- 2013年
- 借鉴现代汉语词义消歧的研究成果,提出一种改进的向量空间模型词义消歧方法,即在古汉语义项词语知识库的支持下,将待消歧多义词上下文与多义词的义项映射到向量空间模型中,完成语义消歧任务。以中国农业古籍全文数据库为统计语料,对10个典型古汉语多义词,共29个义项、1 836条待消歧上下文进行义项标注的实验,消歧平均正确率达到79.5%。
- 常娥张长秀侯汉清惠富平
- 关键词:向量空间模型词义消歧古汉语
- 电子图书编纂实验--以民国文献电子图书编纂为例被引量:3
- 2009年
- 电子图书是近年来文献整理、图书出版研究的热点问题之一。在分析电子图书概念的发展变化,总结电子图书特点的基础上,以EasyCHM软件制作民国文献电子图书为例,介绍电子文档批处理、电子图书阅读、关键词表编纂方法等方面的制作经验和技巧。
- 王雅戈朱原谅何琳
- 关键词:电子图书民国文献EASY
- 地方志中基于模式匹配的物产异名别称表达方式研究被引量:3
- 2009年
- 异名别称是指同一个或同一类事物的不同名称。在古代汉语文献中,异名别称现象十分普遍,而中国地方志以记载动植物为主的物产资料中,物产的异名别称比比皆是。用模式匹配方法识别异名别称国内外研究很少,这种方法的关键在于异名别称的表达模式抽取。本文以明、清及民国时期广东方志中的有关物产门目资料为语料,全面抽取物产异名别称的表达模式,并把这些表达模式分成有别称词和无别称词两大类,分别进行较为详细的进一步分类和研究,探求其用于模式匹配的异名别称表达规则。文章最后对辑录的表达模式进行了测试,识准率为71.6%,识全率为88.6%。
- 衡中青侯汉清
- 关键词:地方志
- 民国文献主题词表编纂研究被引量:1
- 2011年
- 编纂民国文献主题词表,能保障文献标引质量,提高系统检索效率,是民国文献规范组织和有效利用的重要技术手段,是概念检索、智能检索的基础。以《农业论文索引》标题词为例,以检索为主要导向,研究民国文献主题词表编纂,重点研究民国文献主题词表的语法、词汇、词义和排序等问题。
- 常娥王雅戈王晋玲
- 关键词:民国文献主题词表编纂
- 中国地方志的著录方法被引量:1
- 2009年
- 中国地方志(旧志)的著录规范来源于普通古籍的著录规则,无论是纸本的卡片著录信息还是电子的元数据著录信息都是如此。在古籍著录规则出版以前,地方志的著录方法则来源于前人的经验。地方志的著录形式有简目、提要和考录3种。在现代信息技术条件下,方志的著录形式又出现了MARC、DC等元数据著录格式。
- 衡中青侯汉清
- 关键词:著录信息
- 苏州民国档案整理与开发利用研究被引量:3
- 2015年
- 苏州民国档案保存环境较好,注重收藏地方文献,收藏系统独具特色,近年来注重数字化技术的应用,开展了多项地方文献编研工作,在民国档案的开放展示方面也取得了一定经验。但问题也不少,这就需要采取相应措施,强化民国档案保护意识、培养专业人才、开展民国档案深加工工作、举办特色民国档案展览等,以加强民国档案的保护与利用。
- 陆琳王雅戈杭亚杨
- 关键词:民国档案