Tc02v2_t004530.4 | Cocoa Genome Hub

Overview


Name	Tc02v2_t004530.4
Unique Name	Tc02v2_t004530.4
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3462

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 1 EST, 12 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 16 samples with support for all annotated introns
Product	probable ubiquitin-conjugating enzyme E2 23, transcript variant X1
Note	Probable ubiquitin-conjugating enzyme E2 23

Cross References

External references for this mRNA


Database	Accession
GeneID	18607524
Genbank	XM_018116064.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc02v2_g004530	Tc02v2_g004530	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc02v2_p004530.4	Tc02v2_p004530.4	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto88597	auto88597	Theobroma cacao	exon
exon-auto88598	auto88598	Theobroma cacao	exon
exon-auto88599	auto88599	Theobroma cacao	exon
exon-auto88600	auto88600	Theobroma cacao	exon
exon-auto88601	auto88601	Theobroma cacao	exon
exon-auto88602	auto88602	Theobroma cacao	exon
exon-auto88603	auto88603	Theobroma cacao	exon
exon-auto88604	auto88604	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto88605	auto88605	Theobroma cacao	CDS
CDS-auto88606	auto88606	Theobroma cacao	CDS
CDS-auto88607	auto88607	Theobroma cacao	CDS
CDS-auto88608	auto88608	Theobroma cacao	CDS
CDS-auto88609	auto88609	Theobroma cacao	CDS
CDS-auto88610	auto88610	Theobroma cacao	CDS
CDS-auto88611	auto88611	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc02v2_t004530.4 ID=Tc02v2_t004530.4|Name=Tc02v2_t004530.4|organism=Theobroma cacao|type=mRNA|length=3462bp
ATGGGGATGGAGCAACATTTATTAGCTTCTGAGACTAATGAATCCACCAC
AACAAGTTTGCATGGAAGTAACACTTTGAGTCAGGGTGGTTCTTCAACAA
ATGCGTCTGTCAGTGATCAAAATGTAAATTACACTAATGTTGGAGTTAGT
AAACAAAATGAGACTTTCTGTAACTTGCATAGTGTTCCTTATATTTATCG
ACAAGATGTTGTCAGGAGTAATACAAGTGGTGCAATTGGGATTGTGAGTG
AAGTTGCTGGTGACTCAGATTCAGATGGAAGCATAACTGATGATGAAGAT
GACGAAGACGAAGATGATGAGGAGGATGGTGAAGATGAAAGCGGTAATGG
TGATGCAAATAGCAATGCTAATGAGAGTGGTGATGGGAACAAAGGTGGTA
ATTATAAGTGCGGTGATCTTCAAGCCGATCAAATTCGGGTACTCTGGATG
GATGACACTGAGCCAGTTCAAAGTATTAAGAATGTAAGTGTTGTTGATCG
GGGTTTCTTACATGGGGATTATGTTGCTGCTGCTTTAGATTCAACTGGAC
AGGTGGGTGTTGTGGTGGACGTCAATGTCTCTGTTGATCTGTTAGCTCCT
GATGGATCTATTTTAAATGATGTCTCAACTAGAGACTTGCAACGTGTGAG
GGATTTCACTGTGGGCGATTATGTGGTCCTTGGTCCCTGGCTGGGTAGAA
TAGATGATGTTTTAGATAATGTCAACGTGTTGTTTGATGATGGCTCTGTA
TGCAAAGTTACAAGGGCTGAACCATTGCGTCTTAAACCAATTACTAGAAA
TACCCTTGAAGACGATAGTAATTTTCCATACTATCCTGGTCAGCGAGTAA
GAGCAAGCTCTTCATCTGTTTTCAAGAATTCTAGGTGGTTATCTGGCTTA
TGGAAGGCAAATCGGTTGGAAGGTACAGTCACTAAAGTTACAGCTGGAGC
TGTGTTTATTTATTGGATAGCATCTGCTGGCTATGGGCCTGATTCTTCCA
CTGCCCCTGCTGAAGAGCAGAATCCAAAGAATCTAAAACTGTTGTCTTGT
TTTGCGCATGCAAATTGGCAAGTGGGTGATTGGTGTCTTCTTCCAACTTC
ATCGCAATGCATTCCTTTGGACAAGGGTTTGTCCAAACTGCAGCTTAATG
GTTCCATAAAAAATAGGGGAAATTGTGATAAGTTGGATAGTGAATGGGAT
TCCAAAGAGGTTATTCTGTATGAATCAAATGATAATAGTGAATCCATGGA
TCTTGATGCAACACCTACACCTGATGAAAACAATGCAACTATTGAAACTA
AAGACAATGGAGCTATTGGAACTAAAGCCTCACCTGAATCTAGCTCTTGT
AGTAGTTCATTATCAGTTTCAAAGGAGACTGTCCATGAACATTGGCCACA
TCACCGCAAGAAGATCCGGAAAGTTGTGATTAGGAAAGACAAGAAAGCAA
AAAAGAAAGTGGAGAATTTTGAAAGGGCACTTTTGATTGTCAATAGCAGA
ACAAGAGTTGATGTTGCATGGCAGGATGGAACAATCGAACGTGGAGTGGA
TGCAACGACATTGATCCCAATTGAAACTCCCGGTGATCATGAATTTGTTG
CAGAGCAGTATGTGGTGGAGAAGGCCTCTGATGATAGTGATGATGTATAT
GAACCCAGGCGTGTTGGGGTTGTCAAAAGTGTTAATGCAAAGGAGCGGAC
AGCTTGTATAAGGTGGATAAAGCCAGTTGCCAGGGCAGAGGACCCTCGAG
AGTTTGACAAGGAAGAAATTGTAAGTGTGTATGAGCTGGAAGGACATCCA
GATTATGATTATTGTTATGGTGATGTAGTAGTTCGATTATCCCCGGCTTC
TGTTCCCATGCAATCTGCTTCTGGTGAAGGCTTCATTGAGGAACCAAAGC
AGGAAGATGGATCAAAGGAGATAAAACGAGACTTGAAAAAGTGCTCAGGA
AGTAACAAAGTAGAAGGTGAATCACCAAATGAAGCTTCCATGGACTTCAC
GGATCTCTCTTGGGTTGGGAACATAACTGGCCTGAGAAATGGTGATATTG
AGGTTACATGGGCTGATGGGATGGTTTCAACGGTTGGACCTCAAGCAATT
TATGTTGTTGGCCGAGATGATGATGAGTCAATTGCTGCTGGGAGTGAAGT
AAGTGATGATGCTGCTAGTTGGGAAACGGTTAATGATGATGAGATGGATG
CTCTTGAGAATGCTCAAGAGGATCTGGAACCACAAAATGCCAGCAGTATT
ATTTCGGACGTTGAAGAGGGTATGGAGAATAATTCTGGAAGGAATGCAGC
ATTATCACTCCCCTTAGCTGCATTTGATTTTGTCACCAGACTGGCCAGTG
GATTTTTTTCAGGAAGACGAAAAAATATTGATCCAATTGATTTGGATTCC
AAAGGAGAAAATGAACTTCAGCCTGAGGGAAGAGATTTCAGCCATGAGTC
TAGCTCTCAAAAGTCTAATGTTCTTGATAATTTCAGTGGGGAAAGCGTTA
ATGAGAAAGGAGAGGAACATGTTGATGAAAAGGCCCACGAACTTTCACTT
CCATCAGATGTTTTATGCAATGTGAGGATTGAAGACTCAGATTCTAAAAC
AGGTGATGAGGATGATACTTGCAGTTTCAAGCGGTTTGATACAGCTAAAG
ATCCTCTAGATCATTATTTTCTTGGTGCAAATGGACAGAATAGTACTGGA
AGAAAGTGGCTAAAGAAGGTGCAGCAAGATTGGAACATCCTTCAGAACAA
CCTGCCAGATGGAATCTATGTACGGGTATATGAAGATCGGATGGACCTCT
TGAGGGCTGTAATAGTTGGGGCATATGGGACACCTTATCAAGATGGTCTC
TTCTTCTTTGATTTCCACCTTCCTCCTGAGTATCCAGATGTGCCACCGTC
AGCATACTATCATTCTGGCGGTTGGAGAATAAATCCTAATTTGTATGAGG
AAGGTAAGGTGTGCCTTAGCCTTCTAAATACATGGACTGGCAGGGGAAAC
GAAGTTTGGGATTCATTGTCCTCTAGCATCCTTCAAGTCCTAGTTTCACT
GCAGGGGTTAGTGCTAAATTCTAGGCCATATTTCAATGAAGCTGGGTATG
ATAAGCAGGTTGGAACAGCTGAAGGAGAGAAAAATTCATTAGCATACAAT
GAGAATACTTTCTTACTGAACTGCAAGTCAATGATGTATCTCATGCGGAA
GCCCCCAAAGGACTTTGAAGAACTTGTCAGAGACCATTTCAGGAGACGTG
GTTTTTACATCCTTAAAGCATGTGATGCATACATGAAAGGCTACTTAATT
GGCTCTCTAACTAAAGATGCCTCTTATAGTGATGCAAACAATGCAAACTC
CACTTCAGTTGGTTTCAAGCTGATGTTAGGCAAGATTGTACCTAAGCTTT
TATTGGCACTTAATGAAGTTGGAGCTGATTGTCAGGAATTTAAGCATTTC
CAGCAATCATAG

protein sequence of Tc02v2_p004530.4

>Tc02v2_p004530.4 ID=Tc02v2_p004530.4|Name=Tc02v2_p004530.4|organism=Theobroma cacao|type=polypeptide|length=1154bp
MGMEQHLLASETNESTTTSLHGSNTLSQGGSSTNASVSDQNVNYTNVGVS
KQNETFCNLHSVPYIYRQDVVRSNTSGAIGIVSEVAGDSDSDGSITDDED
DEDEDDEEDGEDESGNGDANSNANESGDGNKGGNYKCGDLQADQIRVLWM
DDTEPVQSIKNVSVVDRGFLHGDYVAAALDSTGQVGVVVDVNVSVDLLAP
DGSILNDVSTRDLQRVRDFTVGDYVVLGPWLGRIDDVLDNVNVLFDDGSV
CKVTRAEPLRLKPITRNTLEDDSNFPYYPGQRVRASSSSVFKNSRWLSGL
WKANRLEGTVTKVTAGAVFIYWIASAGYGPDSSTAPAEEQNPKNLKLLSC
FAHANWQVGDWCLLPTSSQCIPLDKGLSKLQLNGSIKNRGNCDKLDSEWD
SKEVILYESNDNSESMDLDATPTPDENNATIETKDNGAIGTKASPESSSC
SSSLSVSKETVHEHWPHHRKKIRKVVIRKDKKAKKKVENFERALLIVNSR
TRVDVAWQDGTIERGVDATTLIPIETPGDHEFVAEQYVVEKASDDSDDVY
EPRRVGVVKSVNAKERTACIRWIKPVARAEDPREFDKEEIVSVYELEGHP
DYDYCYGDVVVRLSPASVPMQSASGEGFIEEPKQEDGSKEIKRDLKKCSG
SNKVEGESPNEASMDFTDLSWVGNITGLRNGDIEVTWADGMVSTVGPQAI
YVVGRDDDESIAAGSEVSDDAASWETVNDDEMDALENAQEDLEPQNASSI
ISDVEEGMENNSGRNAALSLPLAAFDFVTRLASGFFSGRRKNIDPIDLDS
KGENELQPEGRDFSHESSSQKSNVLDNFSGESVNEKGEEHVDEKAHELSL
PSDVLCNVRIEDSDSKTGDEDDTCSFKRFDTAKDPLDHYFLGANGQNSTG
RKWLKKVQQDWNILQNNLPDGIYVRVYEDRMDLLRAVIVGAYGTPYQDGL
FFFDFHLPPEYPDVPPSAYYHSGGWRINPNLYEEGKVCLSLLNTWTGRGN
EVWDSLSSSILQVLVSLQGLVLNSRPYFNEAGYDKQVGTAEGEKNSLAYN
ENTFLLNCKSMMYLMRKPPKDFEELVRDHFRRRGFYILKACDAYMKGYLI
GSLTKDASYSDANNANSTSVGFKLMLGKIVPKLLLALNEVGADCQEFKHF
QQS*