李小妹
- 作品数:9 被引量:18H指数:3
- 供职机构:华中科技大学计算机科学与技术学院更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学更多>>
- 序列拼接中重复子串屏蔽的KMP算法
- 2006年
- 在序列拼接中,为了解决重复序列这个难题,本文提出了利用KMP匹配算法来识别并屏蔽重复序列的方法.该方法利用模式序列中的失效函数计算得到失效链接值,也就是当前一位置匹配失败后,下一次匹配开始的位置.利用这一函数避免了可预见的无用搜索,将穷举搜索算法所需的计算量大大减少.通过计算机模拟,验证了对重复序列的屏蔽,该算法将穷举算法所需时间复杂度由原来的减少到了.
- 李小妹王能超
- 关键词:KMP算法
- 格子模型的快速序列搜索算法
- 2004年
- 一种快速序列穷举搜索蛋白质构像空间的算法。该算法利用二分技术将HP序列逐次分解,保存分解过程的中间结果,使搜索算法中所需的计算量大大减少。
- 李小妹王能超
- 关键词:计算量蛋白质
- DNA序列的分形结构
- <正> 1 引言分形几何创造了很多美的景象,使人类获得了美的享受,当初Mandelbrot在1986年提出分形几何学时,定义分形是其豪斯道夫维数严格大于其拓扑维数的集合。拓扑维数总是非负整数,比如点是零维,线是一维,面是...
- 李小妹王能超
- 关键词:FRACTALSIMILARITY
- 文献传递
- 蛋白质二级结构预测中的简化编码技术被引量:4
- 2004年
- 神经网络用于蛋白质二级结构预测时,通常氨基酸序列采用正交二进制编码。基于不同残基间的物理化学性质,提出了简化的编码技术,并与其他蛋白质二级结构预测的方法进行了比较。实施结果表明:这种方法更充分地利用了蛋白质一级结构的信息,有较好的效果。
- 梅启鹏王能超李小妹
- 关键词:蛋白质二级结构
- 神经网络预测蛋白质二级结构的编码技术被引量:9
- 2004年
- 考虑不同残基的物理化学性质 ,将其融入蛋白质二级结构的神经网络预测中 ,提出了一种新的归一化二进制编码技术 ,将各种残基不同的疏水值与体积大小归一化结果作为神经网络的二进制输入序列 .与其他蛋白质二级结构预测的方法进行了比较 ,结果表明 ,该方法能充分利用蛋白质的一级结构信息 ,获得了很好的预测效果 .
- 李小妹王能超
- 关键词:神经网络蛋白质二级结构编码技术
- 生物序列比对算法的简述被引量:9
- 2004年
- 基因组和蛋白质组的研究极大地依赖于数据库的搜索,寻求更快更灵敏的生物序列相似性比对算法一直是生物信息学研究的热点,文章介绍了相似性比对的得分算法和各种数据库搜索工具,并对各种算法的优缺点进行了讨论与比较.
- 李小妹王能超
- 关键词:生物序列比对生物信息学数据库搜索基因组计划
- 利用神经网络和一致结构序列预测蛋白质二级结构
- 从PDB数据库提取出441组蛋白质序列集,其中每组均含有较长的公共子序列.利用蛋白质的公共子序列作为网络的输入,一致二级结构序列作为神经网络的预期输出,对其三态的预测精度进行了研究.实验证明,该序列信息可用来提高蛋白质二...
- 李小妹王能超
- 关键词:神经网络最长公共子串蛋白质二级结构
- 文献传递
- 格子模型的序列搜索优化算法
- 2005年
- 在格子模型的穷举搜索算法中,限制大尺寸模型搜索的主要障碍在于计算规模.通过Gray码的调序,相郐的HP序列 仅有一个码位不同,利用这一相邻性特征,将原来N次的计算量减少到一次N.同时我们按熙Gray码序的二分演化特征构造 了链衰这种数据结构.经理论分析以及实验验证,该快速Gray码搜索算法利用Gray码特性可使算法达到线性加速比N,同时 也极大的减少了所需存储空间.
- 王能超李小妹
- 关键词:GRAY码
- 三角网格模型的快速树搜索算法及可设计性分析
- 2005年
- 在蛋白质折叠格子模型的可设计性特征研究中,为了克服以往方格模型具有奇偶问题这一缺点,本文利用三角网格模型来进行穷举搜索。在简化的网格模型中,序列折叠为某一结构的能量值为在结构心部疏水氨基酸的个数取负值。在蛋白质折叠模型的二维4+5+6+5+4三角网格中穷举了所有的序列和致密结构。其中序列由两类氨基酸(疏水氨基酸和亲水氨基酸)组成,排除正反对称序列共2^(12)+2^(23)=8392704种不同序列。在由24个格点组成的三角网格模型中共得到219093种简化结构串。在穷尽搜索算法中,为实现快速搜索,通过树结构将相似的结构串尽量聚类,通过计算各树结点的目标能量值以减少搜索算法中所需的计算量。经并行实验验证,利用该树结构可使快速搜索算法达到指数级加速比。最后对计算所得结果进行了统计分析。
- 李小妹王能超
- 关键词:三角网格模型蛋白质折叠聚类树