Tc09v2_t029780.1 | Cocoa Genome Hub

Overview


Name	Tc09v2_t029780.1
Unique Name	Tc09v2_t029780.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3375

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 1 mRNA, 16 ESTs, 27 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 25 samples with support for all annotated introns
Comment	The sequence of the model RefSeq transcript was modified relative to this genomic sequence to represent the inferred CDS: inserted 1 base in 1 codon
Product	ubiquitin-activating enzyme E1 1
Note	Ubiquitin-activating enzyme E1 1

Cross References

External references for this mRNA


Database	Accession
GeneID	18591005
Genbank	XM_018127673.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc09v2_g029780	Tc09v2_g029780	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc09v2_p029780.1	Tc09v2_p029780.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto483743	auto483743	Theobroma cacao	exon
exon-auto483744	auto483744	Theobroma cacao	exon
exon-auto483745	auto483745	Theobroma cacao	exon
exon-auto483746	auto483746	Theobroma cacao	exon
exon-auto483747	auto483747	Theobroma cacao	exon
exon-auto483748	auto483748	Theobroma cacao	exon
exon-auto483749	auto483749	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto483750	auto483750	Theobroma cacao	CDS
CDS-auto483751	auto483751	Theobroma cacao	CDS
CDS-auto483752	auto483752	Theobroma cacao	CDS
CDS-auto483753	auto483753	Theobroma cacao	CDS
CDS-auto483754	auto483754	Theobroma cacao	CDS
CDS-auto483755	auto483755	Theobroma cacao	CDS
CDS-auto483756	auto483756	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc09v2_t029780.1 ID=Tc09v2_t029780.1|Name=Tc09v2_t029780.1|organism=Theobroma cacao|type=mRNA|length=3375bp
ATGTTTGGTATGGATGATAATAAGAAATTGTGTTCATTTGTGGTATTGAC
GGTAATTTTTGCGGGGTTTCGTGTTTTTGGCAGTTTACTGCACTATATGC
TTCCTAGAAAGAGAGCAGGTGAAGGAGAGGTTGTAGAAGGAGAGAGTGAA
AACAACAATAACAGCAACAACATAAAAGACGTAGCTGTCACGTCGCCGAT
CAAGAAGCATCGCTTCTCTGCCGCGGCAGCCGCCGATTTGACGGCTAATA
ACAACACTGTAGCCATAGGGAACAACAGCAGTAACCACAGTAGTGGTAGC
GTGCTCGAGCCGACGATCATGGCTCCGGGCGACGCTAACCACAATGATAT
TGATGAGGATCTGCACAGCCGGCAGCTCGCTGTGTATGGCCGTGAGACGA
TGAGGCTTCTTTTTGCCTCCAATATCCTTATCTCGGGGATGAATGGTCTC
GGTGCTGAAATTGCAAAGAATCTCATTCTTGCTGGTGTCAAGTCTGTGAC
CTTGCATGATGAAGGAGTGGTGGAGTTGTGGGATTTGTCCAGTAATTTTG
TTTTCTCTGAGAATGATGTTGGTAAGAACAGAGCACTTGCTTCTGTTCAG
AAGTTGCAGGAGCTCAACAATGCTGTTGTCATTTCCACCTTGACAACAAA
GTTGGCCAAACAACAACTTTCTCATTTCCAGGCTGTTGTATTCACTGATA
TAAGTCTTGAGAAAGCCTTTGAGTTTGATGACTACTGCCATAATCATCGG
CCTCCCATTTCCTTCATCAAGACTGAAGTAAGAGGCCTTTTTGGTTCTGT
CTTCTGTGACTTTGGTCCTGAGTTTACTGTTTTTGATGTTGATGGTGAGG
ATCCACATACGGGTATAATAGCATCCATCAGCAATGACAACCCTGCCCTA
GTATCATGTGTCGATGATGAAAGGCTTGAGTTTCAGGATGGGGATCTTGT
TGTGTTCTCTGAAGTTCATGGAATGACAGAGCTCAATGATGGAAAGCCGA
GGAAGATTAAAAGTGCAAGGCCGTACTCATTTACACTTGAGGAGGACACC
ACTAATTTTGGTACGTATTTCAAAGGTGGCATTGTCACACAAGTGAAACA
GCCCAAGGTGTTGAATTTCAAGCCATTGAGAGAAGCTCTTAAAGATCCTG
GTGATTTTCTTCTGAGTGATTTCTCAAAGTTTGACCATCCACCTATCCTA
CACATAGCATTCCAAGCATTGGATAAGTTTGTTTCTGAGTTAGGCCGCTT
CCCTGTGGCTGGATCAGAAGAAGATGCTCAGAAGCTCACATCTATTGCTG
CTAACGTCAATGAGTGCCTTGGAGAGGGAAAAATTGAAGATATTAACCCA
AAACTTCTGAGGCACTTTTCCTTTGGTTCCAGGGCAGTATTGAATCCCAT
GGCTGCCATGTTTGGAGGAATTGTGGGACAAGAGGTTGTCAAGGCATGTT
CTGGAAAATTTCACCCTCTTTTTCAGTTCTTCTATTTTGACTCAGTGGAG
TCCCTTCCTGCTGAACCGTTGGACCCCAGTGATTTTAAACCATTGAATAG
CCGATATGATGCACAAATATCGGTATTTGGCTCCAAACTTCAGAAGAAGC
TGGAGGATTCAAAAGTGTTTATAGTTGGATCTGGGGCCTTAGGCTGTGAG
TTCCTGAAAAATGTAGCATTGATGGGTGTTTCATGTGGCAGTCAAGGCAA
GCTAACTATCACTGATGATGATGTAATTGAGAAGAGCAACCTCAGCAGGC
AGTTTTTGTTCCGTGATTGGAACATTGGGCAGGCTAAATCAACTGTTGCA
GCTTCTGCTGCTGCATCTATAAATCCTCAGCTCAAGATTGAAGCTTTGCA
AAATCGTGTGGGTCCTGAAACTGAGAATGTGTTTAATGACACCTTCTGGG
AGAACCTAACAGTGGTCATTAATGCATTAGATAATGTCAATGCTAGGCTG
TATGTTGATCAGAGGTGCTTGTATTTCCAGAAACCACTTCTTGAATCAGG
AACTCTTGGTGCTAAATGCAACACCCAGATGGTGATTCCTCATCTAACTG
AGAACTATGGTGCTTCGAGAGACCCACCTGAGAAACAAGCACCCATGTGC
ACTGTGCATTCATTTCCACACAATATTGATCACTGCTTGACATGGGCTCG
ATCTGAGTTTGAGGGCTTGCTCGAGAAAACTCCTGCTGAAGTGAACGCCT
ATTTGTCCAACCCAGTTGAATATGCCGCTTCAATGAGAGATGCTGGTGAT
GCTCAGGCTAAGGATAACTTAGAGCGCATCTTGGAGTGCCTTGACCGTGA
AAAATGTGAGACATTCCAGGATTGTGTGGCATGGGCTCGCCTAAGATTTG
AGGACTATTTTGTTAATCGGGTGAAGCAGTTAATATATACATTCCCTGAA
GATGCTGCAACCAGTACTGGGGCTCCCTTCTGGTCTGCTCCAAAGCGATT
CCCGCATCCACTTCAGTTTTCATCTACTGATCCTAGCCATCTCCACTTTA
TTATGGCAGCATCTATACTTAGAGCTGAGACATTCGGTATCGCAGTCCCT
GACCAGGTCAAGAATCCGAAGATGTTGGCTGAGGCAATCGAGAATGTTAT
AGTCCCAGATTTTCAGCCAAAGGAAGGTGTTAAAATTAACACAGATGAGA
AGGATACTAGTCTCTCCACTGCCTCCGTGAATGATGAAGCCATGATTAAT
GAATTATTTTACAAGTTAGAGCTTTGCAAGAACAATCTGCCATCAGGATT
CAGGTTGAAACCAATTCAATTTGAAAAGGATGATGATACAAACTATCACA
TGGATCTTATTGCTGCGCTTGCCAACATGAGGGCAAGGAACTATAGCATT
CCTGAGGTGGATAAGCTTAAAGCCAAGTTTATAGCTGGAAGAATCATACC
AGCAATTGCCACTTCCACGGCTATGGCTACAGGCCTTGTCTGCCTTGAGC
TATATAAGGTTCTAGATGGAGCACATAAAGTGGAGGACTATCGAAATACA
TTTGCAAACTTAGCACTGCCTTTGTTCTCCATGGCTGAGCCGGTGCCCCC
CAAGGTCATGAAGCACCGGGAGATGAGCTGGACTGTATGGGACAGGTGGA
TCTTGAGAGACAATCCCACTCTGAGGGAACTCATCCAGTGGCTCAAAGAT
AAGGGGTTGAATGCTTACAGCATATCTTACGGAAGTTGCCTGCTCTTCAA
CAGCATGTTTCCCAAGCACAAAGAGCGACTGGACAAGAAGGTGGTGGATG
TGGCTCGAGAAGTTGCCAAGGCAGAATTGCCTCCCTACCGATCCCACTTG
GATGTGGTGGTGGCATGCGAGGACGATGAAGACAATGATATTGACATTCC
TCAAATTTCCATCTACTACCGTTGA

protein sequence of Tc09v2_p029780.1

>Tc09v2_p029780.1 ID=Tc09v2_p029780.1|Name=Tc09v2_p029780.1|organism=Theobroma cacao|type=polypeptide|length=1125bp
MFGMDDNKKLCSFVVLTVIFAGFRVFGSLLHYMLPRKRAGEGEVVEGESE
NNNNSNNIKDVAVTSPIKKHRFSAAAAADLTANNNTVAIGNNSSNHSSGS
VLEPTIMAPGDANHNDIDEDLHSRQLAVYGRETMRLLFASNILISGMNGL
GAEIAKNLILAGVKSVTLHDEGVVELWDLSSNFVFSENDVGKNRALASVQ
KLQELNNAVVISTLTTKLAKQQLSHFQAVVFTDISLEKAFEFDDYCHNHR
PPISFIKTEVRGLFGSVFCDFGPEFTVFDVDGEDPHTGIIASISNDNPAL
VSCVDDERLEFQDGDLVVFSEVHGMTELNDGKPRKIKSARPYSFTLEEDT
TNFGTYFKGGIVTQVKQPKVLNFKPLREALKDPGDFLLSDFSKFDHPPIL
HIAFQALDKFVSELGRFPVAGSEEDAQKLTSIAANVNECLGEGKIEDINP
KLLRHFSFGSRAVLNPMAAMFGGIVGQEVVKACSGKFHPLFQFFYFDSVE
SLPAEPLDPSDFKPLNSRYDAQISVFGSKLQKKLEDSKVFIVGSGALGCE
FLKNVALMGVSCGSQGKLTITDDDVIEKSNLSRQFLFRDWNIGQAKSTVA
ASAAASINPQLKIEALQNRVGPETENVFNDTFWENLTVVINALDNVNARL
YVDQRCLYFQKPLLESGTLGAKCNTQMVIPHLTENYGASRDPPEKQAPMC
TVHSFPHNIDHCLTWARSEFEGLLEKTPAEVNAYLSNPVEYAASMRDAGD
AQAKDNLERILECLDREKCETFQDCVAWARLRFEDYFVNRVKQLIYTFPE
DAATSTGAPFWSAPKRFPHPLQFSSTDPSHLHFIMAASILRAETFGIAVP
DQVKNPKMLAEAIENVIVPDFQPKEGVKINTDEKDTSLSTASVNDEAMIN
ELFYKLELCKNNLPSGFRLKPIQFEKDDDTNYHMDLIAALANMRARNYSI
PEVDKLKAKFIAGRIIPAIATSTAMATGLVCLELYKVLDGAHKVEDYRNT
FANLALPLFSMAEPVPPKVMKHREMSWTVWDRWILRDNPTLRELIQWLKD
KGLNAYSISYGSCLLFNSMFPKHKERLDKKVVDVAREVAKAELPPYRSHL
DVVVACEDDEDNDIDIPQISIYYR*