朱云平
- 作品数:86 被引量:621H指数:11
- 供职机构:北京蛋白质组研究中心更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
- 相关领域:生物学医药卫生自动化与计算机技术理学更多>>
- 基因调控网络的模块化组织研究被引量:4
- 2008年
- 基因调控网络表现的是大量基因受到转录因子的调控而最终转录翻译为蛋白质进而实现生物功能的复杂信息,是人们理解生物过程和基因功能的重要内容。为了理解基因调控网络中的调控机理,网络的拓扑结构及其组织方式是极其重要的研究内容之一。它不仅能说明网络的局部特征,并且能揭示调控网络的构造方法,同时还能对调控信号通路进行全面系统的分析。调控网络可分为4层结构:调控元件、Motif、模块和整个网络。当前,这种层次结构受到人们越来越多的认可。文中重点讨论motif和模块两层,比较分析了近年来对网络组织结构的多方面研究内容,阐述了各个研究结果与结论具有的生物学意义,并指出了其中存在的问题。在此基础上,文中还针对这些问题提出了可能存在的研究方向,并展望了基因调控网络模块化组织的研究前景。
- 王正华刘齐军朱云平
- 关键词:基因调控网络网络模块模块化组织
- 蛋白质相互作用信息的文本挖掘研究进展被引量:2
- 2010年
- 蛋白质相互作用是生命活动中一种极其重要的生物分子关系,对此领域的研究不仅具有理论意义,还具有较强的应用价值.近年来,随着研究的深入,各种蛋白质相互作用的生物医学文献激增,挖掘其中的蛋白质相互作用关系成为人们面临的一大挑战.当前,已提出了多种文本挖掘方法,对分散于生物医学文献中的蛋白质相互作用信息进行结构化或半结构化处理.对这些工作进行分析,总结出基于生物文本挖掘蛋白质相互作用信息的一般流程,从蛋白质命名实体的识别、蛋白质相互作用关系的提取和蛋白质相互作用注释信息的提取3个子任务进行阐述,同时介绍了生物文本挖掘领域的评测会议和一些挖掘蛋白质相互作用相关信息的工具.最后,对该领域存在的一些重要问题进行分析,并预测了未来可能的发展方向,以期对该领域相关研究提供一定的参考.
- 李满生刘齐军李栋刘培磊朱云平
- 关键词:蛋白质相互作用文本挖掘命名实体识别
- 基于Attention Bi-LSTM模型构建蛋白质诱饵序列库被引量:2
- 2020年
- 利用计算机技术在海量质谱数据中鉴定蛋白质序列是蛋白质组学研究最基本且重要的任务之一,诱饵序列库构建的好坏是蛋白质鉴定质量控制成功的关键之一。发展了基于注意力机制-双向长短期记忆神经网络(Attention Bi-LSTM)的诱饵序列构建方法,整体研究基于编码-解码框架,采用双向长短期记忆神经网络在解决传统循环神经网络梯度消失问题的同时,可以捕获前向后向更多依赖信息对处理序列数据更加有优势;引入注意力机制提高模型对目标序列库和诱饵序列库相关程度的关注度;并与目前常用的随机和反转算法进行比较。结果显示,基于Attention Bi-LSTM模型构建的诱饵序列库能满足理想诱饵序列库的各项特征要求;在不同大小实验数据集以及谱图、肽段、蛋白3个层面对比分析,显示构建的诱饵序列库与其他方法比具有更好的灵敏性。因此,Attention Bi-LSTM是一种很有潜力的诱饵序列库构建方法。
- 曾祥利马洁朱云平舒坤贤
- 关键词:蛋白质鉴定
- 原核生物蛋白质基因组学研究进展被引量:3
- 2014年
- 随着基因组测序技术的不断发展,大量微生物基因组序列可以在短时间内得以准确鉴定。为了进一步探究基因组的结构与功能,基于序列特征与同源特征的基因组注释算法广泛应用于新测序物种。然而受基因组测序质量以及算法本身准确性偏低等问题的影响,现有的基因组注释存在着相当比例的假基因以及注释错误,尤其是蛋白质N端的注释错误。为了弥补基因组注释的不足,以基因芯片或RNA-seq为核心的转录组测序技术和以串联质谱为核心的蛋白质组测序技术可以高通量地对基因的转录和翻译产物进行精确测定,进而实现预测基因结构的实验验证。然而,原核生物细胞中存在的大量非编码RNA给转录组测序技术引入了污染数据,限制了其对基因组注释的应用。相对而言,以串联质谱技术为核心的蛋白质组学测序可以在短时间内鉴定到生物体内大量的蛋白质,实现注释基因的验证甚至校准。已成为基因组注释和重注释的重要依据,并因而衍生了"蛋白质基因组学"的新研究方向。文中首先介绍传统的基于序列预测和同源比对的基因组注释算法,指出其中存在的不足。在此基础上,结合转录组学与蛋白质组学的技术特点,分析蛋白质组学对于原核生物基因组注释的优势,总结现阶段大规模蛋白质基因组学研究的进展情况。最后从信息学角度指出当前蛋白质组数据进行基因组重注释存在的问题与相应的解决方案,进而探讨未来蛋白质基因组学的发展方向。
- 张成普徐平朱云平
- 关键词:原核生物基因组注释质谱
- 转录因子结合位点生物信息学研究进展被引量:31
- 2009年
- 转录因子结合位点(Transcription factor binding site,TFBS)是与转录因子结合的DNA序列,它们与转录因子相互作用调控基因的转录过程。确定TFBS是理解转录调控机制,建立转录调控网络的关键问题。随着高通量实验技术的发展,结合ChIP-chip实验以及多个基因组的序列信息来预测TFBS已成为新的研究热点。本文简要概述了用于TFBS定位的实验技术,TFBS信息相关的数据库,重点评述了描述TFBS的模型以及预测TFBS的多种软件。TFBS的生物信息学研究的发展,将与相关领域相互促进,有助于进一步揭示转录调控机制。
- 侯琳钱敏平朱云平邓明华
- 关键词:转录因子结合位点生物信息学位置权重矩阵
- Meta-analysis在多种组学领域的应用被引量:2
- 2014年
- Meta-analysis作为一种整合多特征、多数据的统计方法,上世纪90年代被引入生命科学领域。随着高通量测序技术的快速发展,以基因组学、转录组学和蛋白质组学为核心的生命组学逐渐成为生命科学研究的新热点。海量数据的快速产出推动了组学研究的发展,也引发了数据规模过大、难以系统整合等问题。针对上述情况,meta-analysis被广泛地应用于分析各组学数据,方法也不断得到改进。本文系统总结了有代表性的meta-analysis方法,考察了目前meta-analysis在多个组学领域的应用现状,最后讨论了meta-analysis尚待解决的问题并展望未来的发展方向。
- 韩明飞朱云平
- 关键词:META-ANALYSIS基因组学转录组学蛋白质组学
- 肿瘤相关生物学通路的发现和建模被引量:3
- 2011年
- 肿瘤是一种严重影响人类健康和生命的复杂疾病。某些生物学通路在肿瘤的发生、发展和转移的过程中发挥了关键作用,如何发现和研究肿瘤相关通路是人们面临的一大挑战。随着以基因芯片数据为代表的海量实验数据的产出,很多研究小组提出了一系列算法和模型通过整合和分析实验数据,鉴定和模拟肿瘤相关的生物学通路,发现了很多重要的生物学结论。文章对这些研究工作进行了综述,给出了一些常用的算法、软件和数据库资源,并讨论了该领域存在的问题和以后的发展方向。
- 郭昊朱云平李栋贺福初
- 关键词:肿瘤基因芯片
- 表达序列标签拼接及验证研究进展被引量:1
- 2004年
- 后基因组时代已经来临 ,基因组序列注释是其主要目标之一。本文就查找EST同源序列方法、各类拼接软件优缺点、现有转录组数据库和预测的蛋白质组数据库、全长cDNA判断方法及ORF选择等方面进行综述 ,并讨论基因预测方面的困难和不足及任务的长期性。
- 陈廷贵朱云平贺福初
- 关键词:表达序列标签全长CDNA基因组
- 人类蛋白质组表达谱蛋白质鉴定的分步搜索策略被引量:6
- 2005年
- 大规模蛋白质组表达谱研究的蛋白质鉴定一般采取基于数据库搜索的策略,因此数据库的选择及搜索策略在蛋白质鉴定中非常重要。现有的人类蛋白质数据库远不够完善,而从其他物种的蛋白质数据库中所能得到的补充非常有限,但人类基因组数据库中却可能存在很大的补充空间。在对国际人类蛋白质数据库充分调研、比较的基础上,提出了一种分步搜索的策略。这种策略首先利用一个质量较高、覆盖率相对较大的非冗余数据库进行基本鉴定,随后利用其他蛋白和核酸数据库进行补充鉴定和新蛋白挖掘。该策略能有效地鉴定尽可能多的高可靠蛋白,并能进一步充分利用质谱数据进行补充鉴定和新蛋白挖掘,对大规模蛋白质组表达谱研究具有重要的意义。
- 吴松锋朱云平贺福初
- 关键词:蛋白质组蛋白质鉴定蛋白质数据库
- 多维液相色谱及液相色谱-离子阱质谱法研究人胎肝线粒体蛋白质组
- 在蛋白质组学研究中,由于两维凝胶电泳在分子量、pH值和疏水性方面存在偏性,出现了多维蛋白质鉴定技术(Multi-dimensional protein identification technology,MuD-PIT)...
- 张养军石蓉孟庆芳王京兰蔡耘朱云平贺福初钱小红
- 文献传递