Tc04v2_t009540.4 | Cocoa Genome Hub

Overview


Name	Tc04v2_t009540.4
Unique Name	Tc04v2_t009540.4
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	2916

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 2 ESTs, 12 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 11 samples with support for all annotated introns
Product	valine--tRNA ligase, chloroplastic/mitochondrial 2, transcript variant X4
Note	Valine--tRNA ligase, chloroplastic/mitochondrial 2

Cross References

External references for this mRNA


Database	Accession
GeneID	18601866
Genbank	XM_018120005.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc04v2_g009540	Tc04v2_g009540	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc04v2_p009540.4	Tc04v2_p009540.4	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto216709	auto216709	Theobroma cacao	exon
exon-auto216710	auto216710	Theobroma cacao	exon
exon-auto216711	auto216711	Theobroma cacao	exon
exon-auto216712	auto216712	Theobroma cacao	exon
exon-auto216713	auto216713	Theobroma cacao	exon
exon-auto216714	auto216714	Theobroma cacao	exon
exon-auto216715	auto216715	Theobroma cacao	exon
exon-auto216716	auto216716	Theobroma cacao	exon
exon-auto216717	auto216717	Theobroma cacao	exon
exon-auto216718	auto216718	Theobroma cacao	exon
exon-auto216719	auto216719	Theobroma cacao	exon
exon-auto216720	auto216720	Theobroma cacao	exon
exon-auto216721	auto216721	Theobroma cacao	exon
exon-auto216722	auto216722	Theobroma cacao	exon
exon-auto216723	auto216723	Theobroma cacao	exon
exon-auto216724	auto216724	Theobroma cacao	exon
exon-auto216725	auto216725	Theobroma cacao	exon
exon-auto216726	auto216726	Theobroma cacao	exon
exon-auto216727	auto216727	Theobroma cacao	exon
exon-auto216728	auto216728	Theobroma cacao	exon
exon-auto216729	auto216729	Theobroma cacao	exon
exon-auto216730	auto216730	Theobroma cacao	exon
exon-auto216731	auto216731	Theobroma cacao	exon
exon-auto216732	auto216732	Theobroma cacao	exon
exon-auto216733	auto216733	Theobroma cacao	exon
exon-auto216734	auto216734	Theobroma cacao	exon
exon-auto216735	auto216735	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto216736	auto216736	Theobroma cacao	CDS
CDS-auto216737	auto216737	Theobroma cacao	CDS
CDS-auto216738	auto216738	Theobroma cacao	CDS
CDS-auto216739	auto216739	Theobroma cacao	CDS
CDS-auto216740	auto216740	Theobroma cacao	CDS
CDS-auto216741	auto216741	Theobroma cacao	CDS
CDS-auto216742	auto216742	Theobroma cacao	CDS
CDS-auto216743	auto216743	Theobroma cacao	CDS
CDS-auto216744	auto216744	Theobroma cacao	CDS
CDS-auto216745	auto216745	Theobroma cacao	CDS
CDS-auto216746	auto216746	Theobroma cacao	CDS
CDS-auto216747	auto216747	Theobroma cacao	CDS
CDS-auto216748	auto216748	Theobroma cacao	CDS
CDS-auto216749	auto216749	Theobroma cacao	CDS
CDS-auto216750	auto216750	Theobroma cacao	CDS
CDS-auto216751	auto216751	Theobroma cacao	CDS
CDS-auto216752	auto216752	Theobroma cacao	CDS
CDS-auto216753	auto216753	Theobroma cacao	CDS
CDS-auto216754	auto216754	Theobroma cacao	CDS
CDS-auto216755	auto216755	Theobroma cacao	CDS
CDS-auto216756	auto216756	Theobroma cacao	CDS
CDS-auto216757	auto216757	Theobroma cacao	CDS
CDS-auto216758	auto216758	Theobroma cacao	CDS
CDS-auto216759	auto216759	Theobroma cacao	CDS
CDS-auto216760	auto216760	Theobroma cacao	CDS
CDS-auto216761	auto216761	Theobroma cacao	CDS
CDS-auto216762	auto216762	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc04v2_t009540.4 ID=Tc04v2_t009540.4|Name=Tc04v2_t009540.4|organism=Theobroma cacao|type=mRNA|length=2916bp
ATGAGTCTCCACCAAATGGCTATCTCTCCTCCTTTTCTTTTATCTTCTCG
CTCTGCTTACACCCTCAACCCTCTTCTCTTTGCCAAACATCGCCGTTTTT
GCTTTCCTCTCTCTCAGTCTCGTTTCAGTTCGATAAAGCGTCGGAGCTTT
GCTGTTGTTGCATCAGAGAATGGCGTTTTCACTTCTCCAGAGTTGGCAAA
GTCTTTTGATTTTACTTCAGAGGAGCGGATATACAATTGGTGGCAGTCTC
AAGGGTATTTCAGGCCAAAATTTGACCGGGGAAGTGATCCTTTTGTCATA
TCAATGCCACCACCTAATGTTACTGGCTCTCTGCACATGGGACATGCAAT
GTTTGTGACTCTTGAGGATATCATGGTTAGGTACCATCGCATGAGGGGAA
GACCAACACTTTGGCTTCCTGGGACTGATCATGCTGGTATTGCGACTCAG
TTGGTTGTGGAAAGAATGTTGGCGTCTGAAGGAATAAAAAGGGCAGAACT
GGGCAGAGATGAATTTGCAAAACGAGTTTGGGAGTGGAAAGAGAAGTATG
GTGGGACCATTACAAATCAGATTAAAAGACTTGGGGCTTCTTGTGATTGG
ACTAGAGAAAGGTTCACCCTTGATGAGCAGCTAAGTCGAGCTGTTGTTGA
GGCGTTTGTTAAACTTCATGAAAAAGGTTTAATCTATCAAGGGTCTTATA
TGGTTAACTGGTCTCCCAAGTTACAGACTGCTGTTTCAGACTTGGAAGTA
GAATATTCTGAAGAGCCTGGTGCCCTATATTATATTAAGTATCGAGTTGC
TGGAGGTTCAAGGAGTGATTTCTTGACAATAGCAACGACGCGGCCTGAAA
CTTTGTTTGGTGATGTAGCTATTGCTGTGCATCCTCAGGATGAGCGATAT
TCCAAGTATGTTGGTCAAATGGCAATTGTTCCTATGACATATGGTCGTCA
TGTTCCCATTATCTCTGATAAGTTTGTTGATAAAGACTTTGGGACAGGTG
TGCTGAAGATAAGCCCTGGCCATGATCATAATGATTATCTTCTAGCTAGA
AAGCTTGGTCTTCCAATTCTTAATGTTATGAACAAGGATGGAACACTAAA
TGAGGTTGCCGGACTGTACTGTGGTCTTGATCGGTTTGAGGCACGGAAGA
AATTGTGGTGCGAACTTGAGGAGACTGACTTAGCTGTGAAAAAGGAACCT
TACACTTTACGAGTACCAAGATCCCAGCGTGGTGGAGAGGTAATAGAGCC
ATTAGTTAGCAAGCAATGGTTTGTAACAATGGAGCCCTTGGCTGAAAAGG
CCCTTCGTGCAGTTGAAAAGGGAGAACTGACGATTATGCCTGAAAGATTT
GAGAAGATTTATAATCATTGGCTATCAAATATAAAGGATTGGTGCATAAG
CAGACAGCTGTGGTGGGGACACCGCATACCTGTTTGGTACATTGTTGGAA
AAGACTGTGAAGAGGAATATATAGTTGCTAGGAGTGCTGAGGAAGCACTT
ATAAAGGCTTGTGATAAATATGGCAAAGAAATAGAAATATATCAGGATCC
AGATGTTCTTGACACTTGGTTCTCAAGTGCACTATGGCCTTTCAGTACTC
TTGGGTGGCCAGATGTGTCAGCAGAGGATTTTAAAAGGTTTTATCCAACA
ACAATGCTTGAAACTGGGCATGATATATTGTTCTTTTGGGTTGCAAGAAT
GGTTATGATGGGAATTGAATTCACAGGAACTGTTCCATTTTCGTATGTAT
ATCTTCATGGACTTATCCGCGACTCAGAAGGGCGTAAAATGTCTAAAACT
CTTGGGAATGTTATTGATCCCCTTGATACTATCGAGGAGTTTGGCACTGA
TGCCTTGCGATTCACTCTTGCTTTAGGAACTGCTGGTCAGGACCTTAATT
TATCTACTGAGAGGCTAACAGCAAACAAAGCCTTCACAAACAAATTGTGG
AATGCTGGCAAATTTGTGCTGCAGAATCTTCCTGATCGGGATAATGTTTC
TGGTTGGCAGACTATACAGGCATATAAGTTTGACATGGAGGAGTCTCTTT
TAAGGCTTCCGCTTTCAGAATGTTGGGTGGTCTCAAAACTGCATTTGCTT
ATTGATGCAGTCACTGAGAGTTATAACAAGTTTTTCTTTGGGGAAGTTGG
AAGAGAAACGTATGATTTCATTTGGGGTGATTTTGCTGACTGGTATATTG
AAGCGAGTAAAGCTCGCCTTTACCACTCTGGAGATGATTCAGTTGCTTTA
GTAGCACAGGCTGTTCTACTTTATGTGTTTGAGAGTATACTGAAACTATT
ACATCCATTCATGCCATTTGTAACTGAGGAGCTGTGGCAGGCACTTCCCA
ATCGGAAAGAAGCTCTTATAATATCTTCTTGGCCACAAATTTCTCTTCCC
AGGAACACTACTTTGGTAAAAAGATTTGAAAATTTACAAGCTCTGACTCG
AGCAATCCGGAATGCTAGAGCTGAGTATTCTGTTGAGCCAGCAAAGCGTA
TATCTGCTTCTATTGTTGCCAGTGAAGAAGTCATTCAGTATATATCTGAA
GAGAAGGAGGTTTTGGCTCTCTTATCCAGGCTAGATTTAGACAATATCCA
TTTCACTGATTCTCCTCCAGGGGATGCTAAACAATCAGTTCACCTTGTTG
CAAGTGAAGGACTAGAGGCATATCTGCCCCTCACTGATATGGTTGATATT
TCTGCTGAAGTCCAACGCCTTTCCAAGCGCCTATCTAAGATGCAAACAGA
GTATGAGGGACTTAAAGCTCGTCTCAAGTCCCCTAAATTCATAGAGAAAG
CTCCTGAGGATATTGTCCGTGGGGTTCAGCAAAAAGCAGCAGAAGCAGAA
GAGAAGATTAATTTGACCAAAAACCGTTTGGATTTCCTCAAATCAACTGT
TTTGGTTTCACAATAG

protein sequence of Tc04v2_p009540.4

>Tc04v2_p009540.4 ID=Tc04v2_p009540.4|Name=Tc04v2_p009540.4|organism=Theobroma cacao|type=polypeptide|length=972bp
MSLHQMAISPPFLLSSRSAYTLNPLLFAKHRRFCFPLSQSRFSSIKRRSF
AVVASENGVFTSPELAKSFDFTSEERIYNWWQSQGYFRPKFDRGSDPFVI
SMPPPNVTGSLHMGHAMFVTLEDIMVRYHRMRGRPTLWLPGTDHAGIATQ
LVVERMLASEGIKRAELGRDEFAKRVWEWKEKYGGTITNQIKRLGASCDW
TRERFTLDEQLSRAVVEAFVKLHEKGLIYQGSYMVNWSPKLQTAVSDLEV
EYSEEPGALYYIKYRVAGGSRSDFLTIATTRPETLFGDVAIAVHPQDERY
SKYVGQMAIVPMTYGRHVPIISDKFVDKDFGTGVLKISPGHDHNDYLLAR
KLGLPILNVMNKDGTLNEVAGLYCGLDRFEARKKLWCELEETDLAVKKEP
YTLRVPRSQRGGEVIEPLVSKQWFVTMEPLAEKALRAVEKGELTIMPERF
EKIYNHWLSNIKDWCISRQLWWGHRIPVWYIVGKDCEEEYIVARSAEEAL
IKACDKYGKEIEIYQDPDVLDTWFSSALWPFSTLGWPDVSAEDFKRFYPT
TMLETGHDILFFWVARMVMMGIEFTGTVPFSYVYLHGLIRDSEGRKMSKT
LGNVIDPLDTIEEFGTDALRFTLALGTAGQDLNLSTERLTANKAFTNKLW
NAGKFVLQNLPDRDNVSGWQTIQAYKFDMEESLLRLPLSECWVVSKLHLL
IDAVTESYNKFFFGEVGRETYDFIWGDFADWYIEASKARLYHSGDDSVAL
VAQAVLLYVFESILKLLHPFMPFVTEELWQALPNRKEALIISSWPQISLP
RNTTLVKRFENLQALTRAIRNARAEYSVEPAKRISASIVASEEVIQYISE
EKEVLALLSRLDLDNIHFTDSPPGDAKQSVHLVASEGLEAYLPLTDMVDI
SAEVQRLSKRLSKMQTEYEGLKARLKSPKFIEKAPEDIVRGVQQKAAEAE
EKINLTKNRLDFLKSTVLVSQ*