国家重点基础研究发展计划(2001CB510209)
- 作品数:5 被引量:137H指数:5
- 相关作者:贺福初朱云平吴松锋薛晓芳荔建琦更多>>
- 相关机构:军事医学科学院中国医学科学院放射医学研究所汕头大学更多>>
- 发文基金:北京市科技计划项目创新研究群体科学基金国家重点基础研究发展计划更多>>
- 相关领域:生物学自动化与计算机技术更多>>
- nr数据库分析及其本地化被引量:104
- 2006年
- 通过用NCBI的blastp程序对nr数据库与IPI数据库中属于人类的蛋白质序列进行比较,论证了nr数据库整合到蛋白质注释系统中的必要性。并在此基础上,设计方案实现了nr数据库的本地化,对nr数据库的记录进行了统计分析,提供了数据库的内部访问,为蛋白质注释系统整合nr数据库做好了第一步工作。
- 邓泱泱荔建琦吴松锋朱云平陈耀文贺福初
- 关键词:本地化
- 人类蛋白质组表达谱蛋白质鉴定的分步搜索策略被引量:6
- 2005年
- 大规模蛋白质组表达谱研究的蛋白质鉴定一般采取基于数据库搜索的策略,因此数据库的选择及搜索策略在蛋白质鉴定中非常重要。现有的人类蛋白质数据库远不够完善,而从其他物种的蛋白质数据库中所能得到的补充非常有限,但人类基因组数据库中却可能存在很大的补充空间。在对国际人类蛋白质数据库充分调研、比较的基础上,提出了一种分步搜索的策略。这种策略首先利用一个质量较高、覆盖率相对较大的非冗余数据库进行基本鉴定,随后利用其他蛋白和核酸数据库进行补充鉴定和新蛋白挖掘。该策略能有效地鉴定尽可能多的高可靠蛋白,并能进一步充分利用质谱数据进行补充鉴定和新蛋白挖掘,对大规模蛋白质组表达谱研究具有重要的意义。
- 吴松锋朱云平贺福初
- 关键词:蛋白质组蛋白质鉴定蛋白质数据库
- 蛋白质组学研究中的无标记定量方法被引量:10
- 2006年
- 蛋白质定量是探索疾病发生发展状况和寻找新药靶标的重要手段.该领域最常用的技术是比较染色后的二维凝胶上蛋白点的光密度值或综合同位素标记后的质谱峰强度方法.但此二者的样品处理方法都比较麻烦,不利于进行大规模蛋白质组的定量研究.最近几年出现了利用质谱数据进行无标记定量的方法,根据数据类型这些方法可以分为2类基于鉴定蛋白的肽段数的方法和基于质谱峰强度的方法,在高通量大规模蛋白组定量研究中有很大优势.本综述主要介绍了这2类无标记定量方法的模型及优缺点,并比较了2类方法的灵敏度和准确度.肽段计数方法在检测蛋白丰度变化时更灵敏,而峰面积强度在评估蛋白比率时更准确.
- 薛晓芳吴松锋朱云平贺福初
- 用EM算法改进鸟枪法蛋白质鉴定中的无标记定量方法被引量:12
- 2007年
- 蛋白质定量是探索疾病发生发展状况和寻找新药靶标的重要手段。在shotgun蛋白组学中,目前常用定量方法包括综合同位素标记后的质谱峰强度方法和无标记定量方法。根据数据类型无标记定量方法可以分为两类:基于鉴定蛋白的质谱数的方法和基于质谱峰强度的方法。本研究主要用EM算法改进基于鉴定蛋白质谱数的定量方法,并用免疫印迹实验获得的酵母全蛋白的丰度来验证EM算法改进后定量的有效性结果表明,改进后的质谱数和蛋白丰度的相关性比改进前有一定的提高。同时,利用这些数据对主要的几种基于鉴定蛋白的质谱数的模型进行了比较,发现PAI模型最好,SpS模型次之,emPAI模型最不适合于蛋白质定量。
- 薛晓芳吴松锋朱云平贺福初
- 关键词:EM算法鸟枪法
- 蛋白质家族模体(motif)的评价策略被引量:6
- 2005年
- 模体是刻画蛋白质家族组成结构和执行功能的重要部分 ,但是对于通过各种生物信息学方法识别出的模体 ,目前没有很好的办法辨别真假和优劣。文中提出一种新的模体评价策略 ,从分类器的观点出发 ,对不同方法在同一个蛋白质家族上建立的不同模体进行比较 ,从而推断出最具有生物意义的模体。本文在PROSITE数据库中选取 7个细胞因子家族 ,采用MEME和HMMER两种模体识别方法分别识别每个家族的模体 ,将每个模体看作一个分类器 ,通过计算同一家族的每个模体的敏感性和特异性并比较它们对应的接收机操作特性曲线 ,进而比较不同模体 ,确定真的模体和排除假的模体 ,从而获得每个蛋白质家族的最佳模体的模型。这种策略可以应用于对任意蛋白质家族模体识别结果的评价。此外 ,还可以利用最佳模体搜索数据库的结果预测每个家族的新成员。
- 杜春娟朱云平贺福初曾衍钧
- 关键词:MEME细胞因子模体识别