沈耕宇
- 作品数:6 被引量:29H指数:2
- 供职机构:南京农业大学更多>>
- 发文基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金更多>>
- 相关领域:自动化与计算机技术生物学医药卫生文化科学更多>>
- 基于文本的基因间相互关系挖掘系统研究与实现
- 伴随着生物学医学研究中的高通量实验方法的使用和人类等物种基因组的测序工作的相继完成,与之俱来的是海量的生物信息以及广阔的的生物学医学研究前景。目前最大的生物学医学文献数据库PubMed中收录的文献数量已经达到了前所未有的...
- 沈耕宇
- 关键词:文本挖掘
- 昆虫基因组数据库InsectBase的构建与应用
- 随着测序技术的进步,大规模基因组测序数据和海量RNA-Seq数据不断涌现,昆虫学研究逐步追赶人类后基因时代研究的步伐,迎来了生物数据的大时代.目前,已有155种昆虫基因组序列可从公开数据库中获得,共发表昆虫基因组研究论文...
- 尹传林沈耕宇郭殿豪王书平马行洲肖花美刘金定张赞刘莹张艺群黄水清李飞
- 关键词:昆虫基因组转录组数据库信号通路基因家族
- 以作者合作共现为源数据的科研团队发掘方法研究被引量:26
- 2013年
- 在对个人和科研机构的评价研究中,针对难以准确、可靠地界定与识别科研团队的问题,将向量空间模型应用到作者合著关系网络的科研团队发掘研究中。在考虑论文作者署名顺序的前提下,构建论文与作者向量空间,通过计算作者向量的相似度来衡量作者之间的合作关系,再通过社会网络分析中的凝聚子群分析方法分析作者合作关系网络。最后,以某高校内某学院的所有在编教师为研究对象,准确地发掘出所有真实存在的科研团队,从而验证方法的合理性。
- 沈耕宇黄水清王东波
- 关键词:向量空间模型
- 基于汉英词性组合的短语级平行语料类别知识挖掘研究被引量:1
- 2013年
- 基于通过具体实验确定的Bisecting K-means聚类和Lemmatization形态变换算法,在汉英短语级人文社会科学平行语料基础上,尝试进行类别知识挖掘的实验。在中文社会科学引文索引(CSSCI)的类别和标题知识基础上,完成对汉英语料的预处理,并分析名词、动词和形容词的分布状况。在名词、动词和形容词等词性的组合基础上,对比不同词性组合的效果并确定最优的词性组合类别知识挖掘模型。
- 王东波韩普沈耕宇沈思
- 昆虫基因组数据库InsectBase的构建与应用
- 随着测序技术的进步,大规模基因组测序数据和海量RNA-Seq数据不断涌现,昆虫学研究逐步追赶人类后基因时代研究的步伐,迎来了生物数据的大时代.目前,已有155种昆虫基因组序列可从公开数据库中获得,共发表昆虫基因组研究论文...
- 尹传林沈耕宇郭殿豪王书平马行洲肖花美刘金定张赞刘莹张艺群黄水清李飞
- 关键词:昆虫基因组转录组数据库信号通路基因家族
- 一种通过文本挖掘发现实时定量聚合酶链式反应实验内参基因的方法研究
- 2012年
- 综合运用模式匹配、主题识别、信息抽取等多种信息处理技术,从基于文献的角度设计一种面向qRT-PCR实验的内参基因及实验环境的挖掘系统,为qRT-PCR实验提供有价值的内参基因推介参考,可以缩短内参基因筛选的时间,减少实验验证的成本,具有较高的识别正确率。初步的测试结果得到生物学领域专业人员的认可。
- 何琳何娟沈耕宇杨波黄水清
- 关键词:内参基因实验环境文本挖掘信息抽取