SCENIC:cisTarget databases数据库下载

List of databases for the cisTarget family of tools (e.g. RcisTarget, SCENIC/pySCENIC, and cisTopic).

To choose the database appropiate for your analysis, start by selecting the species and ranking type (i.e. What do you want to analyze: genes or regions?).

Note that the download size is typically over 1GB (100GB for mammal region databases), we recommend downloading the files with zsync_curl (see the Help with downloads).


Related files:

  • sha256sum.txt: To confirm whether the file was succesfuly downloaded
  • TF annotation: Annotation to transcripton factors for the motifs or ChIP-seq tracks in each collection (30-100 Mb)
    • Human TFs (motif collection v8 / v9); (ChIP-seq v1 hg19 / hg38)
    • Mouse TFs (motif collection v8 / v9)
    • Fly TFs (motif collection v8 / v9); (ChIP-seq v1 dm6)

Column info:

Species:

  • Human (Homo sapiens)
  • Mouse (Mus musculus)
  • Fly (Drosophila melanogaster)

Ranking type:

  • Region: The ranking contains regions (i.e. for analyses of region-sets from ATAC-seq, ChIP-seq, …)
  • Genes: The ranking contains genes.

Distance: For gene rankings only. Indicates the search space around the TSS of gene in which the motif is scored:

  • 500bpUp: 500bp upstream of TSS
  • TSS+/-10kb: 10kb around the TSS (total: 20kb)
  • TSS+/-5kb: 5kb around the TSS (total: 10kb)
  • 5kbUp,FullTx: 5kb upstream TSS and transcript introns
  • 500bpUp100Dw: 500bp upstream of TSS, and 100bp downstream.

Motif or track collection:

  • Motifs – Version 8 (mc8nr): 20003 motifs
  • Motifs – Version 9 (mc9nr): 24453 motifs
  • TF ChIP-seq – Version 1 (tc_v1):
    • dm6: 1503 tracks
    • hg19: 3040 tracks
    • hg38: 2993 tracks

nOrt: Number of orthologous species used to select the regions based on conservation. In case of doubt of which version to use: 7 species is normally appropiate for most analyses.

Genome: Genome version used to construct the ranking. For region-based analyses it is important that this version matches your data! Gene annotation version is shown in parenthesis.

Database name: Database name (add the extensions to obtain specific file names, e.g. .feather or .feather.zsync).

Download URL: Link to the database (.feather file, and its size).


List of databases:

如若转载,请注明出处:https://www.ouq.net/sceniccistarget-databases%e6%95%b0%e6%8d%ae%e5%ba%93%e4%b8%8b%e8%bd%bd.html

(0)
打赏 微信打赏,为服务器增加100M流量 微信打赏,为服务器增加100M流量 支付宝打赏,为服务器增加100M流量 支付宝打赏,为服务器增加100M流量
上一篇 2022年3月21日 下午12:55
下一篇 2022年4月1日 下午2:38

相关推荐

  • dplyr包筛选数据

    dplyr与安装 dplyr是一个强大的R软件包,用于处理,清理和汇总非结构化数据。简而言之,它使得R中的数据探索和数据操作变得简单快捷。 最简单的方法是安装 tidyverse包…

    2020年3月17日
  • 分子伴侣蛋白简介和资源-Chaperones

    分子伴侣蛋白(Chaperones)是一个蛋白质家族,在稳定未折叠的蛋白质中起着至关重要的作用。这种稳定性有助于许多过程,例如易位、降解和折叠。 Calnexin 是一种分子伴侣,…

    2022年4月6日
  • EasyPubMed

    专为新版PubMed设计的工具条——看摘要、找全文、收藏文献都不是问题
    – 一键点击从UnpayWall、Sci-Hub、Libgen多渠道获取全文PDF,找全文如此简单
    – 一键收集PubMed文章,好文献随时收藏并支持做多种标记,如星价、旗标、贴标签、写备注
    – 展示最新(2021年)杂志影响因子、JCR分区、中科院分区及文章被引用次数
    – 获取文章10000+种参考文献引用格式,覆盖绝大多数SCI杂志
    – PubMed搜索界面展示完整摘要

    2022年4月16日
  • Pheatmap包使用

    Pheatmap简介: Pretty Heatmaps——Implementation of heatmaps that offers more control over dime…

    R 2020年3月15日
  • R:UniProt.ws包转换Accession,ENSEMBL,ENSEMBL_PROTEIN等

    UniProt.ws提供了一个通往UniProt网络服务的选择查询接口。UniProt.ws是与Bioconductor的Uniprot网络服务互动的基础包。 与Annotatio…

    R 2022年4月28日