Tc02v2_t004530.1 | Cocoa Genome Hub

Overview


Name	Tc02v2_t004530.1
Unique Name	Tc02v2_t004530.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3390

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 7 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 11 samples with support for all annotated introns
Product	probable ubiquitin-conjugating enzyme E2 23, transcript variant X4
Note	Probable ubiquitin-conjugating enzyme E2 23

Cross References

External references for this mRNA


Database	Accession
GeneID	18607524
Genbank	XM_007041733.2

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc02v2_g004530	Tc02v2_g004530	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc02v2_p004530.1	Tc02v2_p004530.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto88560	auto88560	Theobroma cacao	exon
exon-auto88561	auto88561	Theobroma cacao	exon
exon-auto88562	auto88562	Theobroma cacao	exon
exon-auto88563	auto88563	Theobroma cacao	exon
exon-auto88564	auto88564	Theobroma cacao	exon
exon-auto88565	auto88565	Theobroma cacao	exon
exon-auto88566	auto88566	Theobroma cacao	exon
exon-auto88567	auto88567	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto88568	auto88568	Theobroma cacao	CDS
CDS-auto88569	auto88569	Theobroma cacao	CDS
CDS-auto88570	auto88570	Theobroma cacao	CDS
CDS-auto88571	auto88571	Theobroma cacao	CDS
CDS-auto88572	auto88572	Theobroma cacao	CDS
CDS-auto88573	auto88573	Theobroma cacao	CDS
CDS-auto88574	auto88574	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc02v2_t004530.1 ID=Tc02v2_t004530.1|Name=Tc02v2_t004530.1|organism=Theobroma cacao|type=mRNA|length=3390bp
ATGGGGATGGAGCAACATTTATTAGCTTCTGAGACTAATGAATCCACCAC
AACAAGTTTGCATGGAAGTAACACTTTGAGTCAGGGTGGTTCTTCAACAA
ATGCGTCTGTCAGTGATCAAAATGTAAATTACACTAATGTTGGAGTTAGT
AAACAAAATGAGACTTTCTGTAACTTGCATAGTGTTCCTTATATTTATCG
ACAAGATGTTGTCAGGAGTAATACAAGTGGTGCAATTGGGATTGTGAGTG
AAGTTGCTGGTGACTCAGATTCAGATGGAAGCATAACTGATGATGAAGAT
GACGAAGACGAAGATGATGAGGAGGATGGTGAAGATGAAAGCGGTAATGG
TGATGCAAATAGCAATGCTAATGAGAGTGGTGATGGGAACAAAGGTGGTA
ATTATAAGTGCGGTGATCTTCAAGCCGATCAAATTCGGGTACTCTGGATG
GATGACACTGAGCCAGTTCAAAGTATTAAGAATGTAAGTGTTGTTGATCG
GGGTTTCTTACATGGGGATTATGTTGCTGCTGCTTTAGATTCAACTGGAC
AGGTGGGTGTTGTGGTGGACGTCAATGTCTCTGTTGATCTGTTAGCTCCT
GATGGATCTATTTTAAATGATGTCTCAACTAGAGACTTGCAACGTGTGAG
GGATTTCACTGTGGGCGATTATGTGGTCCTTGGTCCCTGGCTGGGTAGAA
TAGATGATGTTTTAGATAATGTCAACGTGTTGTTTGATGATGGCTCTGTA
TGCAAAGTTACAAGGGCTGAACCATTGCGTCTTAAACCAATTACTAGAAA
TACCCTTGAAGACGATAGTAATTTTCCATACTATCCTGGTCAGCGAGTAA
GAGCAAGCTCTTCATCTGTTTTCAAGAATTCTAGGTGGTTATCTGGCTTA
TGGAAGGCAAATCGGTTGGAAGGTACAGTCACTAAAGTTACAGCTGGAGC
TGTGTTTATTTATTGGATAGCATCTGCTGGCTATGGGCCTGATTCTTCCA
CTGCCCCTGCTGAAGAGCAGAATCCAAAGAATCTAAAACTGTTGTCTTGT
TTTGCGCATGCAAATTGGCAAGTGGGTGATTGGTGTCTTCTTCCAACTTC
ATCGCAATGCATTCCTTTGGACAAGGGTTTGTCCAAACTGCAGCTTAATG
GTTCCATAAAAAATAGGGGAAATTGTGATAAGTTGGATAGTGAATGGGAT
TCCAAAGAGGTTATTCTGTATGAATCAAATGATAATAGTGAATCCATGGA
TCTTGATGCAACACCTACACCTGATGAAAACAATGCAACTATTGAAACTA
AAGACAATGGAGCTATTGGAACTAAAGCCTCACCTGAATCTAGCTCTTGT
AGTAGTTCATTATCAGTTTCAAAGGAGACTGTCCATGAACATTGGCCACA
TCACCGCAAGAAGATCCGGAAAGTTGTGATTAGGAAAGACAAGAAAGCAA
AAAAGAAAGTGGAGAATTTTGAAAGGGCACTTTTGATTGTCAATAGCAGA
ACAAGAGTTGATGTTGCATGGCAGGATGGAACAATCGAACGTGGAGTGGA
TGCAACGACATTGATCCCAATTGAAACTCCCGGTGATCATGAATTTGTTG
CAGAGCAGTATGTGGTGGAGAAGGCCTCTGATGATAGTGATGATGTATAT
GAACCCAGGCGTGTTGGGGTTGTCAAAAGTGTTAATGCAAAGGAGCGGAC
AGCTTGTATAAGGTGGATAAAGCCAGTTGCCAGGGCAGAGGACCCTCGAG
AGTTTGACAAGGAAGAAATTGTAAGTGTGTATGAGCTGGAAGGACATCCA
GATTATGATTATTGTTATGGTGATGTAGTAGTTCGATTATCCCCGGCTTC
TGTTCCCATGCAATCTGCTTCTGGTGAAGGCTTCATTGAGGAACCAAAGC
AGGAAGATGGATCAAAGGAGATAAAACGAGACTTGAAAAAGTGCTCAGGA
AGTAACAAAGTAGAAGGTGAATCACCAAATGAAGCTTCCATGGACTTCAC
GGATCTCTCTTGGGTTGGGAACATAACTGGCCTGAGAAATGGTGATATTG
AGGTTACATGGGCTGATGGGATGGTTTCAACGGTTGGACCTCAAGCAATT
TATGTTGTTGGCCGAGATGATGATGAGTCAATTGCTGCTGGGAGTGAAGA
TCTGGAACCACAAAATGCCAGCAGTATTATTTCGGACGTTGAAGAGGGTA
TGGAGAATAATTCTGGAAGGAATGCAGCATTATCACTCCCCTTAGCTGCA
TTTGATTTTGTCACCAGACTGGCCAGTGGATTTTTTTCAGGAAGACGAAA
AAATATTGATCCAATTGATTTGGATTCCAAAGGAGAAAATGAACTTCAGC
CTGAGGGAAGAGATTTCAGCCATGAGTCTAGCTCTCAAAAGTCTAATGTT
CTTGATAATTTCAGTGGGGAAAGCGTTAATGAGAAAGGAGAGGAACATGT
TGATGAAAAGGCCCACGAACTTTCACTTCCATCAGATGTTTTATGCAATG
TGAGGATTGAAGACTCAGATTCTAAAACAGGTGATGAGGATGATACTTGC
AGTTTCAAGCGGTTTGATACAGCTAAAGATCCTCTAGATCATTATTTTCT
TGGTGCAAATGGACAGAATAGTACTGGAAGAAAGTGGCTAAAGAAGGTGC
AGCAAGATTGGAACATCCTTCAGAACAACCTGCCAGATGGAATCTATGTA
CGGGTATATGAAGATCGGATGGACCTCTTGAGGGCTGTAATAGTTGGGGC
ATATGGGACACCTTATCAAGATGGTCTCTTCTTCTTTGATTTCCACCTTC
CTCCTGAGTATCCAGATGTGCCACCGTCAGCATACTATCATTCTGGCGGT
TGGAGAATAAATCCTAATTTGTATGAGGAAGGTAAGGTGTGCCTTAGCCT
TCTAAATACATGGACTGGCAGGGGAAACGAAGTTTGGGATTCATTGTCCT
CTAGCATCCTTCAAGTCCTAGTTTCACTGCAGGGGTTAGTGCTAAATTCT
AGGCCATATTTCAATGAAGCTGGGTATGATAAGCAGGTTGGAACAGCTGA
AGGAGAGAAAAATTCATTAGCATACAATGAGAATACTTTCTTACTGAACT
GCAAGTCAATGATGTATCTCATGCGGAAGCCCCCAAAGGACTTTGAAGAA
CTTGTCAGAGACCATTTCAGGAGACGTGGTTTTTACATCCTTAAAGCATG
TGATGCATACATGAAAGGCTACTTAATTGGCTCTCTAACTAAAGATGCCT
CTTATAGTGATGCAAACAATGCAAACTCCACTTCAGTTGGTTTCAAGCTG
ATGTTAGGCAAGATTGTACCTAAGCTTTTATTGGCACTTAATGAAGTTGG
AGCTGATTGTCAGGAATTTAAGCATTTCCAGCAATCATAG

protein sequence of Tc02v2_p004530.1

>Tc02v2_p004530.1 ID=Tc02v2_p004530.1|Name=Tc02v2_p004530.1|organism=Theobroma cacao|type=polypeptide|length=1130bp
MGMEQHLLASETNESTTTSLHGSNTLSQGGSSTNASVSDQNVNYTNVGVS
KQNETFCNLHSVPYIYRQDVVRSNTSGAIGIVSEVAGDSDSDGSITDDED
DEDEDDEEDGEDESGNGDANSNANESGDGNKGGNYKCGDLQADQIRVLWM
DDTEPVQSIKNVSVVDRGFLHGDYVAAALDSTGQVGVVVDVNVSVDLLAP
DGSILNDVSTRDLQRVRDFTVGDYVVLGPWLGRIDDVLDNVNVLFDDGSV
CKVTRAEPLRLKPITRNTLEDDSNFPYYPGQRVRASSSSVFKNSRWLSGL
WKANRLEGTVTKVTAGAVFIYWIASAGYGPDSSTAPAEEQNPKNLKLLSC
FAHANWQVGDWCLLPTSSQCIPLDKGLSKLQLNGSIKNRGNCDKLDSEWD
SKEVILYESNDNSESMDLDATPTPDENNATIETKDNGAIGTKASPESSSC
SSSLSVSKETVHEHWPHHRKKIRKVVIRKDKKAKKKVENFERALLIVNSR
TRVDVAWQDGTIERGVDATTLIPIETPGDHEFVAEQYVVEKASDDSDDVY
EPRRVGVVKSVNAKERTACIRWIKPVARAEDPREFDKEEIVSVYELEGHP
DYDYCYGDVVVRLSPASVPMQSASGEGFIEEPKQEDGSKEIKRDLKKCSG
SNKVEGESPNEASMDFTDLSWVGNITGLRNGDIEVTWADGMVSTVGPQAI
YVVGRDDDESIAAGSEDLEPQNASSIISDVEEGMENNSGRNAALSLPLAA
FDFVTRLASGFFSGRRKNIDPIDLDSKGENELQPEGRDFSHESSSQKSNV
LDNFSGESVNEKGEEHVDEKAHELSLPSDVLCNVRIEDSDSKTGDEDDTC
SFKRFDTAKDPLDHYFLGANGQNSTGRKWLKKVQQDWNILQNNLPDGIYV
RVYEDRMDLLRAVIVGAYGTPYQDGLFFFDFHLPPEYPDVPPSAYYHSGG
WRINPNLYEEGKVCLSLLNTWTGRGNEVWDSLSSSILQVLVSLQGLVLNS
RPYFNEAGYDKQVGTAEGEKNSLAYNENTFLLNCKSMMYLMRKPPKDFEE
LVRDHFRRRGFYILKACDAYMKGYLIGSLTKDASYSDANNANSTSVGFKL
MLGKIVPKLLLALNEVGADCQEFKHFQQS*