国家高技术研究发展计划(2002AA231071)
- 作品数:14 被引量:79H指数:7
- 相关作者:孙啸谢建明何洁月陆祖宏胡孔法更多>>
- 相关机构:东南大学扬州大学南京医科大学更多>>
- 发文基金:国家高技术研究发展计划江苏省自然科学基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术生物学医药卫生更多>>
- 跨平台基因表达模式分析软件系统被引量:1
- 2004年
- 构建了可在不同操作系统平台之间通用的基因表达模式分析软件系统。该软件集成了多种基因表达模式分析算法,并通过模块化设计保持了算法的可扩展性。同时具有原始数据可视化和过滤、多种相似性度量选择、聚类方法选择、表达模式匹配查询、计算结果可视化等功能。软件使用Java作为开发平台,具有良好的可移植性,为在高性能计算机上进行基因表达模式分析打下了良好的基础。
- 胡弘谢建明汪德正孙啸
- 关键词:跨平台软件系统
- 基于特征的核酸序列数据库搜索系统被引量:1
- 2006年
- 随着后基因组时代的到来,建立生物数据库并且在其上开发各种分析工具进行数据分析和挖掘,已经成为了生物学研究的一种新方法。目前国际上流行的通过序列比对搜索相似序列的方法主要是针对短的序列,将这样的方法应用于大规模基因组序列时搜索速度很慢。针对基因组序列搜索的特点,从提高序列搜索效率出发,提出了一种新的、速度更快的搜索方法,其核心是通过序列特征的分析和比较搜索相似序列。在此基础上,建立了基于特征的序列数据库搜索系统,并利用序列的碱基关联性特征搜索人类基因组序列,结果表明,新搜索方法具有较高的命中率,并且搜索速度非常快,适合于大规模基因组序列的搜索。
- 焦典顾珉傅静李石法谢建明孙啸
- 关键词:基因组数据库
- 数据仓库系统中一种改进的维层次聚集Cube存储结构被引量:8
- 2005年
- 提出利用Cube中的维层次(dimensionhierarchy)聚集技术来创建高性能的维层次聚集Cube(dimensionhierarchyaggregatecube,DHAC).充分利用DHAC已保存的维层次信息,对Cube中多维数据的查询和更新效率进行了优化,并且支持Cube的上探、下钻等语义操作.在DHAC中进行数据插入和删除等数据更新时,由下向上用更新前后的差值对受到更新结点影响的所有祖先结点进行增量更新.实现了在插入新维或维层次时不需要重新构建聚集Cube就可以实现Cube的模式更新.对维层次聚集Cube与传统Cube进行了算法性能分析和比较,理论分析和实验结果都表明,所提出的DHAC性能最佳.
- 梁作鹏胡孔法董逸生陈崚
- 关键词:数据仓库系统CUBE多维联机分析处理
- 本体驱动的半结构化Web生物数据抽取被引量:8
- 2006年
- 提出由本体驱动,并根据文档结构和特征匹配来进行信息定位和信息抽取的方法,并实现了一个用户指导的交互式信息抽取原型系统。有效地解决了信息抽取中涉及的同义词,一词多义等语义问题,以及数据项不完整和排序不固定的问题。
- 成瑜何洁月
- 关键词:信息抽取本体生物数据
- 基于内插马尔可夫模型的Gibbs改进算法识别调控元件
- 2006年
- 不同阶数插值形式的马尔可夫内插模型,可以表示在一个DNA序列中相邻核苷酸之间的前后关系的变化。本研究将内插马尔可夫模型引入Gibbs采样算法,识别基因上游序列中的调控元件。对模拟序列和10组来源于文献的酵母基因序列的测试结果表明,改进后的算法在识别保守性差的调控元件和抗噪声能力方面均优于传统的Gibbs采样算法。
- 谢雪英孙啸谢建明陆祖宏
- 关键词:GIBBS采样调控元件基因序列
- 基于信息量的调控元件预测方法被引量:5
- 2003年
- 设计基于信息含量的调控元件识别算法,对酵母的基因表达数据聚类结果进行分析,旨在预测共表达基因上游非编码区可能存在的转录因子结合位点。分析已知受相同调控因子作用的基因上游序列的结果表明,算法能正确识别具有单一保守核心序列的调控元件和具有间隔子(spacer)的保守序列。通过分析共表达基因,算法提取出的候选调控元件,部分可能具有生物学意义,这还有待于生物学实验的进一步验证。
- 谢雪英孙啸谢建明陆祖宏
- 关键词:信息含量调控元件聚类基因转录
- 基于图像投影的基因芯片图像网格定位被引量:13
- 2005年
- 对基因芯片图像进行网格定位是芯片分析的前提和关键。利用芯片图像在水平方向和竖直方向的投影,可将二维图像分析问题转化为一维信号处理问题。本文对图像的投影信号进行算术平均滤波,然后利用不同参数滤波后投影信号间的灰度偏差进行网格定位。实验表明该方法对芯片信号点的定位有很高的准确性,且算法简单易行。
- 胡园园孙啸何农跃汤建新
- 关键词:基因芯片网格信号处理芯片分析
- 基于频繁序列的新词挖掘算法
- 2006年
- 生物医学领域信息量的飞速增长,极大地促进了人们的交流和研究,同时也使人们在海量的信息面前无所适从:这就提出了对信息进行分类筛选的需求。词库对于文本分类的结果有着至关重要的作用,只有能实时更新新词的词库才能适应使用的需要。该文章提出并实现一种基于频繁序列的新词挖掘算法,能够正确提取出中文文本中的新词,从而及时更新维护词库,使文本分类更为准确。
- 周俊孙啸
- 关键词:分词文本分类
- 一种基于维层次编码的OLAP聚集查询算法被引量:21
- 2004年
- 联机分析处理 (OLAP)查询往往需在海量数据上进行即席的复杂分组聚集查询 ,在其SQL语句中通常包含多表连接和分组聚集操作 ,因而减少多表连接和压缩关键字 ,以及对查询数据进行有效地分组聚集操作 ,成为ROLAP查询处理的关键问题 提出了一种基于维层次编码的新型预分组聚集算法DHEPGA DHEPGA算法充分利用了编码长度较小的维层次编码及其前缀 ,来快速检索出与查询关键字相匹配的维层次编码 ,求得维层次属性的查询范围 ,减少了I/O开销 ,提高了OLAP查询效率 理论分析和实验结果表明 。
- 胡孔法董逸生徐立臻杨科华
- 关键词:聚集查询维层次编码
- 应用多重反转录PCR技术检测病毒性呼吸道感染被引量:8
- 2004年
- 目的为了寻求呼吸道感染病毒的快速诊断并指导治疗,建立一种多重反转录PCR体系。方法分别设计针对肠病毒、腺病毒、乙型流感病毒和甲型流感病毒标准株的特异性引物,采用多重反转录PCR检测4种病毒。结果应用此多重反转录PCR系统可以特异的同时检测到同一模板中的肠病毒、腺病毒、甲型流感病毒和乙型流感病毒。通过用多重反转录PCR和单一PCR对36份临床标本的检测相比较,结果表明多重反转录PCR的检测与单一PCR的检测结果是一致的。结论通过与单一的PCR对比,证明该多重反转录PCR系统可替代单一的PCR用于肠病毒、腺病毒、甲型流感病毒和乙型流感病毒引起的呼吸道感染的快速诊断。
- 冯东举周锋周世新孙华马春玲姚堃
- 关键词:肠病毒腺病毒甲型流感病毒乙型流感病毒