RNAseq:mRNA表达FPKM标准话原理和计算方法

mRNA Expression HT-Seq Normalization

RNA-Seq expression level read counts produced by HT-Seq are normalized using two similar methods: FPKM and FPKM-UQ. Normalized values should be used only within the context of the entire gene set. Users are encouraged to normalize raw read count values if a subset of genes is investigated.

FPKM

The Fragments per Kilobase of transcript per Million mapped reads (FPKM) calculation normalizes read count by dividing it by the gene length and the total number of reads mapped to protein-coding genes.

Upper Quartile FPKM

The upper quartile FPKM (FPKM-UQ) is a modified FPKM calculation in which the total protein-coding read count is replaced by the 75th percentile read count value for the sample.

Calculations

Calc_FPKM_andUQ

  • RCg: Number of reads mapped to the gene
  • RCpc: Number of reads mapped to all protein-coding genes
  • RCg75: The 75th percentile read count value for genes in the sample
  • L: Length of the gene in base pairs; Calculated as the sum of all exons in a gene

Note: The read count is multiplied by a scalar (109) during normalization to account for the kilobase and ‘million mapped reads’ units.

举例

Sample 1: Gene A

  • Gene length: 3,000 bp
  • 1,000 reads mapped to Gene A
  • 1,000,000 reads mapped to all protein-coding regions
  • Read count in Sample 1 for 75th percentile gene: 2,000

FPKM for Gene A = (1,000)*(10^9)/[(3,000)*(1,000,000)] = 333.33

FPKM-UQ for Gene A = (1,000)*(10^9)/[(3,000)*(2,000)] = 166,666.67

如若转载,请注明出处:https://www.ouq.net/rnaseqmrnafpkmnormalizationprotocol.html

(0)
打赏 微信打赏,为服务器增加100M流量 微信打赏,为服务器增加100M流量 支付宝打赏,为服务器增加100M流量 支付宝打赏,为服务器增加100M流量
上一篇 2021年6月25日 下午7:11
下一篇 2021年6月30日 下午7:25

相关推荐

  • R:UniProt.ws包转换Accession,ENSEMBL,ENSEMBL_PROTEIN等

    UniProt.ws提供了一个通往UniProt网络服务的选择查询接口。UniProt.ws是与Bioconductor的Uniprot网络服务互动的基础包。 与Annotatio…

    R 2022年4月28日
  • Python学习资源总结

    前言 知乎:路人甲 微博:玩数据的路人甲 微信公众号:一个程序员的日常   在知乎分享已经有一年多了,之前一直有朋友说我的回答能整理成书籍了,一直偷懒没做,最近有空仔细整…

    2020年3月23日
  • RStudio开发环境下载安装

    RStudio是为R语言设计的一种跨平台集成开发环境。其特色包括可客制化的软件套件视觉化界面与同团队开发的一系列数据可视化与出版工具。RStudio有免费的自由软件版本及收费的专业…

    2020年3月12日
  • Short Time-series Expression Miner (STEM)高通量表达谱时辰变化分析

    Short Time-series Expression Miner (STEM) 短时间序列表达挖掘器(STEM)是一个Java程序,用于聚类,比较和可视化来自微阵列实验(约8个…

    2020年3月20日
  • rconfig:在命令行管理 R 配置

    Configuration management using files (JSON, YAML, separated text), JSON strings, and comma…

    R 2022年4月1日