ACLAME — A CLAssification of Mobile genetic Elements

网站:http://aclame.ulb.ac.be/

ACLAME -- A CLAssification of Mobile genetic Elements

无论是在给定的基因组内(细胞内迁移)还是细菌细胞之间(细胞间迁移),原核移动遗传元件(MGE)都是动员基因的主要角色。传统上,MGE被分类为噬菌体,质粒或转座子。随着许多嵌合元素的鉴定,这种分类变得过时了,这些嵌合元素与不同家族的元素表现出强烈的相似性。
ACLAME数据库专用于从各种来源(噬菌体基因组,质粒,转座子和其他基因组岛)收集和分类MGE。与MGE相关的所有公共可用数据均被收集,整理,最终更正并存储在ACLAME数据库中。然后,可以通过ACLAME Web界面使此类信息可供科学界使用。
从收集到的MGE数据中,我们旨在在蛋白质,基因和更高水平上对MGE的功能模块进行全面分类。分类以半自动方式生成。目前,使用基于图论的马尔可夫聚类算法MCL(van Dongen,2000)自动对标注在完整噬菌体和质粒DNA序列上的蛋白质进行分类,以产生家族(见下文)。ACLAME系列定义为一组共享一个或多个功能的相似序列。已经建立了噬菌体蛋白,质粒蛋白和噬菌体+质粒蛋白家族,它们也可以通过ACLAME网络界面访问。
蛋白质家族的手动功能注释的连续过程正在进行,并且依赖于公共数据库中可用的信息。公共数据库中的信息收集是通过使用Blast,PSI-Blast(Altschul,1997年)和Hidden Markov模型(参见下文)进行相似性搜索进行的。注释过程对愿意参加数据库管理的专业志愿者开放。
功能注释依赖于功能定义的多个来源。只要术语适合注释,就会使用经典的基因本体论(GO)。然而,目前,GO更专注于在真核生物中发现的功能。我们正在实验室中开发一种致力于移动遗传元素的本体:MeGO。MeGO中会定期添加ACLAME中的MGE注释所需的新术语。每当需要不适合MeGO的术语时,都将它们添加到ACLAME数据库的专用部分中以立即可用。MeGO和ACLAME中的条款将定期提交给GeneOntology。
ACLAME开发的下一步将是基于ACLAME蛋白质家族定义功能模块。

ACLAME数据库专用于收集,分析和分类测序的流动遗传元件(MGE,特别是噬菌体和质粒)。
除了提供有关MGE内容的信息外,还可以在组织的各个级别使用分类。
在基因/蛋白质水平上,家族将预期具有相同功能的相似序列分组。
使用GeneOntology和专用于MGE的本地开发的本体MeGO,将四个或更多蛋白质的家族手动分配一个功能注释。
在基因组水平上,进化内聚模块将MGE之间共享的蛋白质家族集合进行分组。
在群一级,网络显示了MGE之间的网状进化关系。
为了增加噬菌体序列空间的覆盖范围,ACLAME版本0.4合并了从Prophinder数据库中选择的760个高质量预测的Proh噬菌体。
扩展了用于查询数据库的BLAST界面,并添加了许多用于深入分析结果的工具。

关键词:

  • mobile genetic elements
  • MGEs
  • MGE
  • bacteriophage genomes
  • phage genomes
  • virus genomes
  • transposons
  • plasmids
  • DNA phages
  • lateral gene transfer
  • horizontal gene transfer
  • prokaryotic mobile genetic elements
  • prokaryotic MGEs
  • mobile genetic elements classification

参考文献: ACLAME: a CLAssification of Mobile genetic Elements, update 2010

如若转载,请注明出处:https://www.ouq.net/123.html

(0)
打赏 微信打赏,为服务器增加50M流量 微信打赏,为服务器增加50M流量 支付宝打赏,为服务器增加50M流量 支付宝打赏,为服务器增加50M流量
上一篇 03/17/2020 00:37
下一篇 03/18/2020 13:57

相关推荐

  • DNA和RNA数据库

    核酸序列数据库主要包括了基因组DNA序列,mRNA序列,tRNA序列,rRNA序列等核酸序列。国家上有三个主要核苷酸序列公共数据库: 位于英国剑桥的欧洲分子生物学实验室的欧洲核苷酸档案库(ENA) 位于美国的生物技术信息中心的GeneBan…

    09/12/2021
    183
  • 分子生物学数据库和数据格式

    数据库记录包括两部分: 1.原始序列数据 2.描述原始数据的生物学信息的注释 随着研究的积累,生物信息数据越来越多,且在研究中,如果仅仅知道数据的来源 而对其他方面知之甚少,研究也会变得极为困难。 所以为了研究的便利,能够对数据进行存储共享…

    09/12/2021
    243
  • 3D-footprint DNA结合蛋白数据库

    3D foot是一个可提供蛋白质数据库中所有蛋白质-DNA复合物的结合特异性估计值的数据库。 Web界面允许用户:(i)通过关键字浏览DNA结合蛋白; (ii)查找可识别相似DNA基序的蛋白质,以及(iii)BLAST相似DNA结合蛋白,突…

    04/10/2020
    182
  • IDT SciTools高级引物序列设计

    网址: http://www.idtdna.com/pages/scitools  高级的Oligo、RNAi、CRISPR、Genotyping序列、qPCR引物设计和分析。 有一套完整的生物信息学工具,可以预测天然和化学修饰的核酸的特性…

    03/19/2020
    576
  • Amplicon 在对齐的DNA序列组上设计PCR引物

    网址:http://amplicon.sourceforge.net/ 简介:用于聚合酶链反应(PCR)实验的寡核苷酸(引物)设计是成功获得所需PCR产物(扩增子)的重要阶段。PCR引物设计可通过软件来辅助,该软件可帮助用户评估寡核苷酸的特…

    03/19/2020
    193