你好,游客 登录 注册 发布搜索
背景:
阅读新闻

基于Hadoop的同源性搜索GO功能注释平台的研究

[日期:2014-11-29] 来源:CNKI  作者:吴浩宇 [字体: ]

基于Hadoop的同源性搜索GO功能注释平台的研究

南京农业大学 吴浩宇

本文的研究工作主要如下: (1)研究了基因本体的相关理论基础,以及GO本体论在生物信息学尤其是基因功能注释中所得到的应用。分析了目前已有的基因数据的注释手段,以及基于同源性序列相似度的功能注释所具备的理论基础。 (2)研究了基于序列相似度比对的基因功能注释的流程。研究了打分矩阵和序列比对算法在发现同源性序列的过程中所起的作用。研究并实现了点矩阵、Needleman-Wunsch、Smith-Waterman等序列比对算法,并测试比较了它们的性能。 (3)创新性地提出了基于Hadoop的基因功能注释平台的体系架构。通过整合GO数据库以及其他生物数据库,设计了本地基因注释的数据中心,并设计了用于功能注释的概念模型,用来实现本体与注释信息的关联通路。 (4)分析了蛋白质数据库搜索算法BLASTP的算法理论,比较算法各个阶段所占的运行时间。结合Hadoop的MapReduce并行处理框架,以及在基因注释中比对算法的需求,设计了并行的蛋白质比对算法CGABlastP,通过实验证明其从本质上提高了基因注释的速度,适应了生物序列指数级增长的需求。


基于Hadoop的同源性搜索GO功能注释平台的研究

收藏 推荐 打印 | 录入:574107552 | 阅读:
本文评论   查看全部评论 (0)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款