简介

Protein sequence and functional information

包括: - UniProt Knowledgebase(UniProtKB) - UniRef - UniParc

UniProtKB

包括Swiss-Prot(人工标记过,更准确;非冗杂,即一个蛋白只有一条记录)和TrEMBL(计算生成)

UniRef

根据序列相似度合并的数据集,分别有100,90,50三类,包含了鸡、牛、果蝇等物种。

数据库结构
组成

检索

Function

介绍蛋白质基本功能

Feature

介绍一些结合位点

Disease and Variants

介绍变异已经对应产生的疾病

PTM/Processing

蛋白质翻译后的修饰

Structure

可以看3D结构,包括PDB和Alphafold

download

1
2
3
4
5
6
7
8
>sp|Q6L5H6|P2C50_ORYSJ Protein phosphatase 2C 50 OS=Oryza sativa subsp. japonica OX=39947 GN=PP2C50 PE=1 SV=1
MAAAAAAAAICGEDETAARVGCTGEWAGGIERVDLGERKEAVAAAGAGKRSVYLMDCAPV
WGCASTRGRSAEMEDASAAVPRFADVPVRLLASRRDLDALGLDADALRLPAHLFGVFDGH
GGAEVANYCRERIHVVLSEELKRLGKNLGEMGEVDMKEHWDDVFTKCFQRVDDEVSGRVT
RVVNGGGEVRSEPVTAENVGSTAVVALVCSSHVVVANCGDSRIVLCRGKEPVALSIDHKP
DRKDERARIEAQGGKVIQWNGYRVSGILAMSRSIGDRYLKPFVIPKPEVMVVPRAKDDDC
LILASDGLWDVVSNEEACKVARRQILLWHKNNGAASPLSDEGEGSTDPAAQAAADYLMRL
ALKKGSEDNITVIVVDLKPRKKLKNIS

sp|ID 号|Uniprot名称|蛋白质本身名称 OS=物种 OX=物种分类数据库的ID GN=基因名称 PE评分等级,越小越可靠