丁楠 作品数:29 被引量:375 H指数:13 供职机构: 浙江大学图书馆 更多>> 发文基金: 国家自然科学基金 教育部人文社会科学研究基金 浙江省教育厅科研计划 更多>> 相关领域: 文化科学 自动化与计算机技术 政治法律 经济管理 更多>>
数据挖掘中的隐私保护:法律与技术 被引量:9 2007年 简要介绍了隐私权与隐私保护,讨论了数据挖掘与隐私权的冲突,并对目前国际上主要的隐私保护条例在数据挖掘隐私保护中的应用进行了探讨,针对我国国情提出了目前应当采取的措施。 丁楠 潘有能关键词:数据挖掘 隐私权 法律 Altmetrics视角下机构知识库学者影响力评价研究 被引量:24 2017年 [目的/意义]网络化的科学交流、数字化的出版方式要求革新学者评价方法。以机构知识库为数据源,探讨Altmetrics视角下的学者影响力评价,可以为评价遴选指标、优化模型提供借鉴,也有助于促进机构知识库建设。[方法/过程]编程获取样本机构141位学者的Altmetrics数据和被引数据,分别凭借因子分析、Altmetric.com已有指标、加权赋值法进行基于标准化Altmetrics得分、基于Altmetric Score、基于标准化被引得分的学者排序,并开展学者影响力二维评价,将学者划分为4种类型。[结果/结论]机构知识库可以作为学者评价的数据获取平台;学者的Altmetrics分值对被引分值高低有一定预见性等。[局限]基于定量数据开展评价,未能对结果进行定性评议。 杨柳 丁楠 田稷关键词:机构知识库 基于论文和专利的光纤技术发展态势分析 被引量:2 2014年 釆用可视化软件Histcite对光纤领域的文献生成可视化引文编年图,将其生成的矩阵导入Pajek描述该领域研究的主要路径,揭示其发展历程。然后基于专利情报分析理论,利用Dialog的专利检索和分析平台Innography,在对世界范围内微结构光纤产业的专利进行申请趋势年度分析、区域分析、主IPC分析、主要专利权人分析、诉讼专利和核心专利分析以及重点技术文本聚类分析的基础上,了解国内外微结构光纤产业发展态势,并尝试为温州激光与光电产业创新集群的产业规划提供有用的竞争情报参考。 余敏杰 丁楠关键词:微结构光纤 引文 HISTCITE PAJEK 文本聚类 基于概念和语义层次的领域本体评价研究 被引量:3 2009年 领域本体评价是本体论和语义网研究中的重要内容。本文提出了一种基于编辑距离对领域本体中概念之间的相似度进行计算的方法。此外,通过比较给定的领域本体和"黄金标准"之间在概念的实例的安排以及概念本身的等级安排上具有的相似性,可以在语义角度对二者做出相似性判断。本文利用一个已有的军用飞机领域的本体和《中国分类主题词表》进行比较计算。实验结果表明,该方法能较为准确地计算出两个本体的概念集的相似性,也能较好地衡量本体之间的语义关系,从而实现对领域本体的有效评价。 潘有能 金罕俊 丁楠关键词:本体评价 语义 基于流程的文献传递知识整合与知识发现——以浙江大学图书馆为例 被引量:3 2011年 在对当前文献传递相关论文研究内容和高校图书馆文献传递馆员培训情况进行调研和综述的前提下,结合当前文献传递实际工作中存在的问题,论述了文献传递知识整合与知识发现的必要性。介绍了进行文献传递知识整合与知识发现的方法:以流程为基础,将文献传递中的流程知识划分为过程、规则和经验,分别以实例进行演示。最后指出可通过建立知识库、有效利用即时通讯软件和建立应用本体等促进上述方法的实现。 丁楠 潘有能关键词:流程管理 知识整合 知识发现 基于Labeled-LDA模型的科学数据与科技文献关联识别研究——以生物医学领域为例 被引量:2 2023年 【目的/意义】在万物互联的开放科学时代,建立科学数据与科技文献之间的关联成为推动科学数据开放获取、共享和重用的重要举措。【方法/过程】本研究基于Labeled-LDA模型,辅以基于规则的识别方法,构建科学数据与科技文献关联识别模型,并以生物医学领域为例分别针对规范化引用、非规范化引用以及无引用三种关联情况进行模型训练与测试。【结果/结论】研究发现本模型在识别规范化引用测试集时识别率和F值分别为0.9和0.5左右,有比较稳定的识别效果,在识别非规范化引用和无引用的测试集时识别率分别为0.465和0.5,也展现出较强的可移植性与应用潜力。通过对非规范化引用和无引用识别结果进行人工判断,发现科学研究中确实存在数据引用不规范的现象,需要学界共同推动数据引用规范化。【创新/局限】与其他研究相比,本文构建的模型为基于语义的关联识别提供了方法层面的参考和基础,可以应用于大规模语料研究,从而促进更深层次语义关联的知识发现。 潘有能 吕晶晶 丁楠关键词:科学数据 我国数据引用研究进展评析 被引量:3 2017年 文章分析了国内数据引用领域的研究现状和研究特点,发现虽然相关文献总量不多,但是总体水平较高。数据引用研究的发展大有可为,但是重视程度不够、评价指标体系缺乏以及数据获取困难制约了数据引用研究的进一步推进,而认可数据贡献、建立科学合理的评价机制则是刺激数据引用发展的关键所在。 丁楠基于CSSCI的文科学者h指数实证研究 被引量:19 2009年 从CSSCI中选取文学、历史学、哲学、法学、经济学和图书馆、情报与文献学6个文科学科学者2002-2006年的数据,计算出学者的被引次数C、被引篇数P、篇均被引次数CPP和h指数。分析表明被引次数C与h指数的相关性最大,计算表明对文学和历史学而言Gl nzel-Schubert公式的估计值更接近实际h指数,而其余学科的h指数大多数数据落在Hirsch公式和Egghe-Rousseau公式估计值之间。在所研究的6个文科领域中,Hirsch公式估计值与实际h指数的Pearson相关性较好。 丁楠 潘有能 叶鹰关键词:H指数 引文分析 文献计量指标 学术评价 CSSCI 基于Web of Science的理科学者h指数实证研究 被引量:7 2009年 通过ESI中科学家的Citations排序和CPP排序取交集选出数学、物理、化学、生物、地球科学5个理科学科代表性学者,基于Web of Science(WoS)查出这些学者的累积被引篇数P、被引次数C、篇均被引次数CPP和h指数。分析表明被引篇数P和被引次数C与h指数都有一定相关性;计算表明所有理科学者的h指数落在Hirsch公式和Egghe-Rousseau公式估计值之间,Egghe-Rousseau公式估计值、Hirsch公式估计值和真实h指数之间存在Pearson相关性。 潘有能 丁楠 朱佳惠 钱姝洁 张柳春 来铁刚 叶鹰关键词:H指数 引文分析 文献计量指标 SCIENCE 基于本体的组织知识地图构建研究 被引量:18 2008年 知识地图是组织知识管理的重要工具,基于本体的组织知识地图不但能为用户提供知识导航和检索,还可以促进组织内知识的共享和交流,实现知识创新。其模型包括三个层次:展示层、本体层、资源层,Protégé及相关可视化插件是构建知识地图的一种可行方法。 潘有能 丁楠关键词:本体 知识地图 知识管理