R:UniProt.ws包转换Accession,ENSEMBL,ENSEMBL_PROTEIN等

UniProt.ws提供了一个通往UniProt网络服务的选择查询接口。UniProt.ws是与Bioconductor的Uniprot网络服务互动的基础包。
与AnnotationDb对象允许对许多其他注释包进行选择一样,UniProt.ws旨在允许使用选择方法和其他支持方法,以便从Uniprot网络服务中轻松提取数据。
select、columns和key一起用于通过UniProt.ws对象提取数据。columns显示了UniProt.ws对象可以返回哪些类型的数据。
keytypes允许用户发现哪些keytypes可以通过keytype参数传递给select或key。
keys返回UniProt.ws对象中包含的数据库的键。默认情况下,它将返回数据库的主键,即UNIPROTKB键,但如果与keytype参数一起使用,它将返回该keytype的键。
select将根据所选键和列的参数以及keytype参数以data.frame的形式检索数据。
当你加载UniProt.ws包时,UniProt.ws将被加载。这个对象将被设置为默认检索智人的信息,但这个值可以改为Uniprot支持的任何物种。species和taxId方法允许用户查看当前正在访问的物种,taxId<-允许用户改变这个值。
species显示当前附加到UniProt.ws对象数据库的属和种标签。
taxId显示当前附加在AnnotationDb对象数据库中的NCBI分类法ID。使用等价的名称替换方法(taxId<-)可以让用户改变分类法ID,以及与之一起代表的物种。
availableUniprotSpecies是一个辅助函数,用于列出Uniprot提供的可用物种及其官方分类学ID。因为UniProt有很多物种,所以还有一个pattern参数,可以用来限制返回的东西的范围,即只有那些物种名称与搜索词相匹配的物种。请记住,在使用这个参数时,属总是大写的,而物种从来不是。
lookupUniprotSpeciesFromTaxId是另一个辅助工具,它可以查询Uniprot支持的任何税号的物种。

1.安装和加载

library(BiocManager)
BiocManager::install(“UniProt.ws”)

library(UniProt.ws)

2.Uniprot.ws支持转换的信息

[1] “AARHUS/GHENT-2DPAGE” “AGD” “ALLERGOME” [4] “ARACHNOSERVER” “BIOCYC” “CGD” [7] “CLEANEX” “CONOSERVER” “CYGD” [10] “DICTYBASE” “DIP” “DISPROT” [13] “DMDM” “DNASU” “DRUGBANK” [16] “ECHOBASE” “ECO2DBASE” “ECOGENE” [19] “EGGNOG” “EMBL/GENBANK/DDBJ” “EMBL/GENBANK/DDBJ_CDS” [22] “ENSEMBL” “ENSEMBL_GENOMES” “ENSEMBL_GENOMES PROTEIN” [25] “ENSEMBL_GENOMES TRANSCRIPT” “ENSEMBL_PROTEIN” “ENSEMBL_TRANSCRIPT” [28] “ENTREZ_GENE” “EUHCVDB” “EUPATHDB” [31] “FLYBASE” “GENECARDS” “GENEFARM” [34] “GENEID” “GENETREE” “GENOLIST” [37] “GENOMEREVIEWS” “GENOMERNAI” “GERMONLINE” [40] “GI_NUMBER*” “H-INVDB” “HGNC” [43] “HOGENOM” “HPA” “HSSP” [46] “KEGG” “KO” “LEGIOLIST” [49] “LEPROMA” “MAIZEGDB” “MEROPS” [52] “MGI” “MIM” “MINT” [55] “NEXTBIO” “NEXTPROT” “OMA” [58] “ORPHANET” “ORTHODB” “PATRIC” [61] “PDB” “PEROXIBASE” “PHARMGKB” [64] “PHOSSITE” “PIR” “POMBASE” [67] “PPTASEDB” “PROTCLUSTDB” “PSEUDOCAP” [70] “REACTOME” “REBASE” “REFSEQ_NUCLEOTIDE” [73] “REFSEQ_PROTEIN” “RGD” “SGD” [76] “TAIR” “TCDB” “TIGR” [79] “TUBERCULIST” “UCSC” “UNIPARC” [82] “UNIPATHWAY” “UNIPROTKB” “UNIREF100” [85] “UNIREF50” “UNIREF90” “VECTORBASE” [88] “WORLD-2DPAGE” “WORMBASE” “WORMBASE_PROTEIN” [91] “WORMBASE_TRANSCRIPT” “XENBASE” “ZFIN”

3.使用

up <- UniProt.ws(taxId=9606) ###此处9606为Human

columns(x)

keytypes(x)

select(x, keys, columns, keytype, …)

species(object)

taxId(x)

availableUniprotSpecies(pattern, n=Inf)

lookupUniprotSpeciesFromTaxId(taxId)

UniProt.ws(taxId, …)

 

如若转载,请注明出处:https://www.ouq.net/1761.html

(0)
打赏 微信打赏,为服务器增加50M流量 微信打赏,为服务器增加50M流量 支付宝打赏,为服务器增加50M流量 支付宝打赏,为服务器增加50M流量
上一篇 04/27/2022 18:44
下一篇 04/28/2022 23:20

相关推荐