徐健
- 作品数:98 被引量:628H指数:14
- 供职机构:中山大学资讯管理学院更多>>
- 发文基金:国家社会科学基金广东省自然科学基金教育部人文社会科学研究基金更多>>
- 相关领域:文化科学自动化与计算机技术金属学及工艺医药卫生更多>>
- 文体特征在网络学术文献检索中的意义与应用被引量:4
- 2008年
- 目前网上存在大量揭载学术论文的网页,而这些学术文献尚未被加以开发、组织和保存。非主题特征指与文献的主题没有直接关联,即在标引以及检索时不以叙词或主题性关键词表述的特征。文体特征是文献的非主题特征之一,利用它对学术文献进行文体分析,提供了检索网络学术文献的新途径。本文在Google的基础上设计、开发了一个实验系统,并利用此系统检验使用文体特征检索网络学术文献的效果。实验表明,文体特征在一定程度上提高了查找网络学术文献的准确率。
- 邹永利何侃徐健
- 关键词:文体特征文体分析学术文献
- 人才网页自动识别系统研究
- 提出了人才网页自动识别系统设计,实现了对Nutch 定向采集系统抓取的高校网站页面进行人才描述网页自动识别。识别过程中使用自动获取的网页的Url特征、网页Title 标签特征、链接文字特征以及网页文本内容特征,使用人名词...
- 徐健温浩胜
- 关键词:LIBSVM
- 基于词语软匹配和修饰词权重差异化的术语相似度算法被引量:2
- 2011年
- 针对现有基于语词的术语相似度典型算法存在的问题,提出了将WordNet和编辑距离计算应用于术语词语匹配过程,并根据术语修饰词的位置赋予特征权重的术语相似度改进算法。和已有算法相比,新的算法在三个方面有所改进。首先,在术语中心词匹配过程中引入WordNet的同义词、近义词检索功能,实现中心词之间的语义匹配;其次,将术语词语的直接匹配改进为基于编辑距离计算的模糊匹配;最后,在计算过程中充分考虑了术语修饰词与中心词之间的距离对修饰词权重分配的影响因素。针对新算法提出了具体的实现步骤,并选取基因工程领域实验数据对改进算法和现有典型算法进行对比评测。实验证明,每种改进方法在单独测试时效果优于或至少不低于Nenadic算法。基于三种改进方法的综合计算方法在计算效果方面具有明显提升。
- 徐健张智雄
- 关键词:相似度计算
- 网络商品评论的特征–情感词本体构建与情感分析方法研究被引量:35
- 2014年
- 【目的】解决情感分析领域使用通用情感词典进行情感分析时,在特定领域内无法识别领域专用情感词,以及同一情感词描述不同特征时可能表达出不同情感倾向的两个问题。【方法】提出一种基于领域专用情感词的网络评论情感分析方法。该方法构建特征–情感词本体,利用本体对网络上的产品评论进行情感分析。并与基于Senti-HowNet词典的情感分析方法进行对比。【结果】本文方法在特征层的情感倾向分析的准确率和召回率都有显著提高。【局限】本文方法中的本体需要尽可能完整的特征词集和情感词集,并且情感分析结果好坏直接依赖于本体的构建是否完善;由于网络文本的不规范性,特征词和情感词抽取以及情感分析的过程都不考虑句法结构;数据分析过程对问题进行了简化,仅考虑特征粒度的情感倾向,未考虑连词等对情感倾向有影响的其他因素。【结论】对专用情感词和通用情感词进行分类管理,解决了两个问题,情感分析结果得到提高。
- 杜嘉忠徐健刘颖
- 关键词:情感分析本体网络评论
- 现代图书馆数据库建设与维护被引量:1
- 2008年
- 论述信息时代,图书馆逐步向网络化、数字化方向发展,其中数据库建设是现代图书馆发展的一个重要方面;分别从现代图书馆数据库的地位与作用、数据库建设内容、数据库的维护与安全进行阐述,重点介绍现代图书馆数据库建设内容、维护与安全。
- 王莹徐健朱捷
- 关键词:数据库建设数据库维护
- 氢对于镍基合金在高温高压水中腐蚀行为影响
- 压水堆核电站一回路水中通常加入氢气来抑制水的辐照分解以及降低材料的腐蚀电位,溶解氢(DH)浓度一般为25~50 cm/kg。目前关于DH对镍基合金腐蚀的研究有很多,但是研究切入点主要集中在DH与材料的界面作用,即DH对材...
- 徐健郭琦任潞农靖Testuo Shoji
- 关键词:核电站氢镍基合金氧化膜
- 文献传递
- 基于情感分析的网络谣言识别方法
- 目的:提出一种基于情感分析技术自动识别特定领域谣言的方法.
方法:界定高、低质量信息源,在假设高质量信息源信息更可靠的情况下,通过基于情感词典的情感分析方法,量化高质量信息源与低质量信息源对特定对象的情感差异,...
- 首欢容邓淑卿徐健
- 关键词:网络谣言自动识别情感分析情感词典
- 数字人文视域下的家谱档案资源重构:价值、逻辑及框架被引量:11
- 2022年
- 数字人文为家谱档案资源的利用与开发提供了新的思路,通过对知识组织逻辑分析与重构,提升家谱档案的知识发现深度与价值呈现维度,使家谱档案在瞬息万变的文化浪潮中维持持续生长的空间与养分。本文从数字人文视域下的家谱档案资源重构价值呈现出发,将档案内容分为记忆单元、记忆层面、记忆空间三个层级,构建其知识重构逻辑与技术实现框架。基于数字人文的多粒度知识组织逻辑和技术实现框架,为家谱档案资源的开发利用提供了新的方法和路径。
- 张钰桐徐健
- 关键词:家谱档案知识重构
- 基于Nutch的Web网站定向采集系统被引量:12
- 2009年
- 在对目前具有代表性的开源网络抓取软件Nutch、Heritrix、WCT、Web-Harvest进行比较分析的基础上,提出基于Nutch的Web网站定向采集系统,并对种子站点的选取、抓取过程管理、网页去噪、新种子站点的发现等关键问题进行重点探讨。
- 徐健张智雄
- 关键词:NUTCH网页去噪
- 数字图书馆服务登记系统的功能及应用被引量:2
- 2009年
- 数字图书馆服务登记系统允许机器或人发现可用数字图书馆服务,定位这些服务,并获取配置信息与服务进行交互。数字图书馆服务登记系统具有服务发布,服务检索、监测和评估、支持服务工作流管理等功能。对具有代表性的服务登记系统IESR、OCKHAM-DLSR、myGrid和OFSR以及相关标准ISO2146进行分析,在此基础上提出数字图书馆服务登记系统发展需要解决的问题以及相应对策,以期为我国数字图书馆界资源与服务登记系统的建设提供借鉴。
- 徐健张智雄
- 关键词:数字图书馆