国家自然科学基金(31301691) 作品数:5 被引量:10 H指数:2 相关作者: 刘金定 叶锡君 曹萍 李飞 黄水清 更多>> 相关机构: 南京农业大学 更多>> 发文基金: 国家自然科学基金 中央高校基本科研业务费专项资金 更多>> 相关领域: 自动化与计算机技术 生物学 农业科学 电子电信 更多>>
ASUCF:基于平均相似度的协同过滤推荐算法 被引量:4 2014年 针对CF推荐技术依赖的评分矩阵在现实中存在的稀疏性问题,提出用户-项目平均相似度协同过滤推荐算法(ASUCF)。对评分矩阵进行充分挖掘、多次利用,引入平均相似度来惩罚用户或项目的评分或被评分的波动;综合考虑用户和项目两方面,提高预测评分的可靠性。实验结果表明,该方法可以有效提高预测的准确性及推荐质量。 叶锡君 曹萍关键词:推荐系统 协同过滤 平均绝对偏差 个性化推荐 丽蝇蛹集金小蜂P450基因家族的发现和分子进化分析 被引量:3 2013年 丽蝇蛹集金小蜂是一类重要的天敌昆虫,大量地应用于生物防治中。虽然寄生蜂不是化学农药的直接作用靶标,但其在自然环境中可能接触到化学农药。P450基因家族是昆虫产生抗药性的重要原因之一,同时也参与了昆虫激素的合成与降解。因此,研究P450基因家族对充分利用丽蝇蛹集金小蜂,以及保护其免受农药毒杀具有重要的意义。本文利用生物学信息方法从丽蝇蛹集金小蜂基因组筛选到91个P450基因。家族分析表明,丽蝇蛹集金小蜂具有15个P450基因超家族、27个亚家族。对P450基因的正选择和基因转换开展了进一步分析,研究发现5个基因族存在正选择位点,2个基因族存在基因转换,正选择和基因转换之间存在明显的关联性。各个亚家族的选择压力分析表明,CYP9P亚家族受到选择压力最大(ω=118.9355)。通过MEME程序在丽蝇蛹集金小蜂P450基因上识别到5个频率为90%以上的motif,其中"LAE[NH]P"为新发现的motif。 刘金定 李飞关键词:细胞色素P450 正选择 基因转换 基于认知语言学的自然语言语义表示方法 被引量:1 2014年 语义网对语义理解和常识推理是有效的,但粗粒度语义无法表示复杂的对象间的关系。认知语言学提供了表示复杂对象关系的方法,但由于其抽象性而难以应用于自然语言处理。文中提出一种基于认知语言学理论的自然语言语义表示方法。该方法使用意象图式表示语义网中对象节点间的关系,使用属性空间表示可以数值化的语义(如颜色)。在此基础上,将语义网和属性空间的构建和修改过程转化为语义操作序列,实现了句子语义的动态重构。相比于传统的基于语义网的语义表示方法,提出的方法能够表示动态关系,具有更强的推理能力。文中通过实例证明了这一方法的可行性。 叶锡君 尹岩关键词:认知语言学 语义网 意象图式 基于RNA-seq的木霉长链非编码RNA的生物信息学预测及其重寄生相关性分析 被引量:2 2019年 [目的]本研究旨在全基因组范围内识别木霉(Trichoderma guizhouense)NJAU4742(NJAU4742)的长链非编码RNA(long noncoding RNA,lncRNA),探究lncRNA在重寄生过程中可能参与的调控作用。[方法]用链特异性RNA-seq技术,对重寄生过程中与病原菌互作接触前、后以及独立培养的木霉菌进行转录组测序;构建生物信息学流程,识别lncRNA并用RSEM和DESeq2软件分析lncRNA在重寄生过程中的表达情况;对lncRNA的靶标预测和表达情况进行分析,探索lncRNA在重寄生过程中可能参与的调控作用。[结果]在木霉NJAU4742中识别了1676个lncRNA,其中包含1049个基因间型lncRNA,590个反义型lncRNA,32个正义型lncRNA以及5个内含子型lncRNA。与编码基因相比,lncRNA的外显子数量偏少,序列长度偏短,表达量偏低,在基因组上的跨度偏短。靶标预测结果显示:1496个lncRNA能够靶向2269个蛋白编码基因,其中1492个lncRNA以顺式作用形式靶向2262个编码基因,4个lncRNA以反式作用形式靶向7个编码基因。GO功能分类结果显示:代谢过程(metabolic process)、催化活性(catalytic activity)和细胞过程(cellular process)是lncRNA靶标分布数量较多的3个类别。KEGG通路分析结果显示:信号转导(signal transduction)、转运与分解代谢(transport and catabolism)和碳水化合物代谢(carbohydrate metabolism)是lncRNA靶标分布数量较多的3类通路。进一步分析发现:147个lncRNA靶向编码碳水化合物活性酶和蛋白酶的基因以及次生代谢物合成相关的基因,其中30个lncRNA在重寄生过程中表达水平发生显著变化,有10个lncRNA的表达和靶标基因显著相关。[结论]木霉在NJAU4742中存在长链非编码RNA,部分成员参与对病原菌重寄生过程的调控。 刘金定 刘金定 黄水清 黄水清关键词:木霉 生物信息学 长链非编码RNA 重寄生 基于RNA-seq的基因训练集构建方法 2018年 针对基因组新测序物种缺乏高质量的基因结构用于从头预测软件训练的现状,本文提出了一种以新测序物种自身RNA-seq组装为基础的可靠基因训练集构建方法(Building reliable training gene set,BRTGS)。该方法利用RNA-seq组装获得大量初始基因结构,然后根据蛋白同源证据筛选具有正确且编码区相对完整的基因结构,最后综合利用RNA-seq组装结构和蛋白同源证据统计信息确定的基因起始密码子和终止密码子位置,从而获得基因完整的编码结构。实验结果表明,该方法不仅可为各种组装水平的基因组构建高质量的基因训练集,而且从头预测软件在这些基因集上训练后能够获得很好的预测性能。 段荣静 刘金定关键词:生物信息学 基因结构 RNA-SEQ