RNAseq:mRNA表达FPKM标准话原理和计算方法

mRNA Expression HT-Seq Normalization

RNA-Seq expression level read counts produced by HT-Seq are normalized using two similar methods: FPKM and FPKM-UQ. Normalized values should be used only within the context of the entire gene set. Users are encouraged to normalize raw read count values if a subset of genes is investigated.

FPKM

The Fragments per Kilobase of transcript per Million mapped reads (FPKM) calculation normalizes read count by dividing it by the gene length and the total number of reads mapped to protein-coding genes.

Upper Quartile FPKM

The upper quartile FPKM (FPKM-UQ) is a modified FPKM calculation in which the total protein-coding read count is replaced by the 75th percentile read count value for the sample.

Calculations

Calc_FPKM_andUQ

  • RCg: Number of reads mapped to the gene
  • RCpc: Number of reads mapped to all protein-coding genes
  • RCg75: The 75th percentile read count value for genes in the sample
  • L: Length of the gene in base pairs; Calculated as the sum of all exons in a gene

Note: The read count is multiplied by a scalar (109) during normalization to account for the kilobase and ‘million mapped reads’ units.

举例

Sample 1: Gene A

  • Gene length: 3,000 bp
  • 1,000 reads mapped to Gene A
  • 1,000,000 reads mapped to all protein-coding regions
  • Read count in Sample 1 for 75th percentile gene: 2,000

FPKM for Gene A = (1,000)*(10^9)/[(3,000)*(1,000,000)] = 333.33

FPKM-UQ for Gene A = (1,000)*(10^9)/[(3,000)*(2,000)] = 166,666.67

如若转载,请注明出处:https://www.ouq.net/rnaseqmrnafpkmnormalizationprotocol.html

(0)
打赏 微信打赏,为服务器增加100M流量 微信打赏,为服务器增加100M流量 支付宝打赏,为服务器增加100M流量 支付宝打赏,为服务器增加100M流量
上一篇 2021年6月25日 下午7:11
下一篇 2021年6月30日 下午7:25

相关推荐

  • 序列比对

    比较是科学研究中最常见的研究方法之一,通过比较寻找研究对象可能具备的某些特征和特性。序列比较的理论基础是进化学说:如果两个序列之间具有足够高的相似性,那么两者可能是共同的进化祖先经…

    2021年9月12日
  • SCENIC:cisTarget databases数据库下载

    List of databases for the cisTarget family of tools (e.g. RcisTarget, SCENIC/pySCENIC, and…

    R 2022年3月21日
  • dplyr包筛选数据

    dplyr与安装 dplyr是一个强大的R软件包,用于处理,清理和汇总非结构化数据。简而言之,它使得R中的数据探索和数据操作变得简单快捷。 最简单的方法是安装 tidyverse包…

    2020年3月17日
  • Clustal:多序列比对分析、序列同源性分析

    Clustal是一个单机版的基于渐进比对的多序列比对工具,由Higgins D.G.等开发。有应用于多种操作系统平台的版本,包括linux版,DOS版的clustlw,clusta…

    2020年7月12日
  • R:字符大小写转换

    R:字符大小写转换 >x = “CAGGGT” #定义字符串变量x >tolower(x) [1] “caggt” #将…

    R 2021年8月10日