Tc03v2_t000850.2 | Cocoa Genome Hub

Overview


Name	Tc03v2_t000850.2
Unique Name	Tc03v2_t000850.2
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	4146

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 2 ESTs, 13 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 3 samples with support for all annotated introns
Product	DNA-directed RNA polymerase III subunit 1, transcript variant X2
Note	DNA-directed RNA polymerase III subunit 1

Cross References

External references for this mRNA


Database	Accession
GeneID	18603906
Genbank	XM_018117639.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc03v2_g000850	Tc03v2_g000850	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc03v2_p000850.2	Tc03v2_p000850.2	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto141975	auto141975	Theobroma cacao	exon
exon-auto141976	auto141976	Theobroma cacao	exon
exon-auto141977	auto141977	Theobroma cacao	exon
exon-auto141978	auto141978	Theobroma cacao	exon
exon-auto141979	auto141979	Theobroma cacao	exon
exon-auto141980	auto141980	Theobroma cacao	exon
exon-auto141981	auto141981	Theobroma cacao	exon
exon-auto141982	auto141982	Theobroma cacao	exon
exon-auto141983	auto141983	Theobroma cacao	exon
exon-auto141984	auto141984	Theobroma cacao	exon
exon-auto141985	auto141985	Theobroma cacao	exon
exon-auto141986	auto141986	Theobroma cacao	exon
exon-auto141987	auto141987	Theobroma cacao	exon
exon-auto141988	auto141988	Theobroma cacao	exon
exon-auto141989	auto141989	Theobroma cacao	exon
exon-auto141990	auto141990	Theobroma cacao	exon
exon-auto141991	auto141991	Theobroma cacao	exon
exon-auto141992	auto141992	Theobroma cacao	exon
exon-auto141993	auto141993	Theobroma cacao	exon
exon-auto141994	auto141994	Theobroma cacao	exon
exon-auto141995	auto141995	Theobroma cacao	exon
exon-auto141996	auto141996	Theobroma cacao	exon
exon-auto141997	auto141997	Theobroma cacao	exon
exon-auto141998	auto141998	Theobroma cacao	exon
exon-auto141999	auto141999	Theobroma cacao	exon
exon-auto142000	auto142000	Theobroma cacao	exon
exon-auto142001	auto142001	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto142002	auto142002	Theobroma cacao	CDS
CDS-auto142003	auto142003	Theobroma cacao	CDS
CDS-auto142004	auto142004	Theobroma cacao	CDS
CDS-auto142005	auto142005	Theobroma cacao	CDS
CDS-auto142006	auto142006	Theobroma cacao	CDS
CDS-auto142007	auto142007	Theobroma cacao	CDS
CDS-auto142008	auto142008	Theobroma cacao	CDS
CDS-auto142009	auto142009	Theobroma cacao	CDS
CDS-auto142010	auto142010	Theobroma cacao	CDS
CDS-auto142011	auto142011	Theobroma cacao	CDS
CDS-auto142012	auto142012	Theobroma cacao	CDS
CDS-auto142013	auto142013	Theobroma cacao	CDS
CDS-auto142014	auto142014	Theobroma cacao	CDS
CDS-auto142015	auto142015	Theobroma cacao	CDS
CDS-auto142016	auto142016	Theobroma cacao	CDS
CDS-auto142017	auto142017	Theobroma cacao	CDS
CDS-auto142018	auto142018	Theobroma cacao	CDS
CDS-auto142019	auto142019	Theobroma cacao	CDS
CDS-auto142020	auto142020	Theobroma cacao	CDS
CDS-auto142021	auto142021	Theobroma cacao	CDS
CDS-auto142022	auto142022	Theobroma cacao	CDS
CDS-auto142023	auto142023	Theobroma cacao	CDS
CDS-auto142024	auto142024	Theobroma cacao	CDS
CDS-auto142025	auto142025	Theobroma cacao	CDS
CDS-auto142026	auto142026	Theobroma cacao	CDS
CDS-auto142027	auto142027	Theobroma cacao	CDS
CDS-auto142028	auto142028	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc03v2_t000850.2 ID=Tc03v2_t000850.2|Name=Tc03v2_t000850.2|organism=Theobroma cacao|type=mRNA|length=4146bp
ATGCAGCAAAAATTTACAAAACGGCCGTACATCGAAGATGTCGGGCCGCG
AAAAATAAAAAGCATTCAATTTTCTATGTTATCAGATTCGGAGATAGCCA
AAGCTGCTGAAGTTCAAGTTTATCAAGCTCTTTACTATGATCCTAAAAGC
CGCCCCATCGAAGGCGGCTTATTGGATCCCCGAATGGGTCCTGCAAATAA
AAGCGGGAAATGTGCAACCTGCCATGGAAATTTTGCGGATTGCCCAGGCC
ATTACGGATACTTATCTCTTGCCCTTCCTGTTTATAATGTTGGATATTTA
AGTACAATTTTAGACATTTTAAAGTGCATCTGTAAGTCTTGTTCTCGTAT
AATTTTGGATGAGAAATTATGCAAAGATTATCTGAAGAGGATGAGAAGTC
CGAAGATCGATGCATTAAAGAAGGGTGATATAATGAAAAGTATCGTGAAG
AAGTGTAGTGCTATGGCTAGTAGTAAAGCTGTGAAGTGCTGGAGATGTGG
ATATGTAAATGGTACGGTGAAGAAGGCTGTGGCAATGTTGGGCATTATTC
ATGATCGTTCAAAAATTAATGACAACAGTTTGGAAGAATTTAGATCAGCA
ATTTCCCACACAAAGGAGTCCAAGGCATCCTTCAACGTTGCTACTTATGT
TCTAAACCCTGTCAAAGTGCTTTCTCTTTTTAAAAGGATGACTGATTTGG
ATTGCGAATTGCTATATCTTTCTGATAGACCTGAGAAGCTCATAATTACA
AATATTGCTGTGCCACCTATACCTATCCGACCTTCAGTCATTATGGATGG
GTCACAGAGCAACGAAAATGACATTACTGAGAGGTTGAAACGAATTATTC
AGGCAAATGCTAGCCTTCGTCAGGAATTAGTAGAAACAAATGCTGCATTC
AAATGTCTGGGTGGCTGGGAGATGCTTCAAGTTGAAGTTGCACAGTACAT
TAATAGTGATGTTCGTGGTGTTCCATTTAGTATGCAAGTGTCAAAGCCGC
TGAGTGGTTTTGTTCAGCGCATCAAAGGGAAGCACGGACGCTTTCGTGGT
AACTTATCTGGCAAACGTGTTGAATATACTGGCCGGACTGTTATATCACC
TGACCCCAATCTGAAAATTACTGAGGTGGCTATCCCAATCCATATGGCTC
GGATTTTGACTTATCCAGAACGTGTTTCCAATCACAATATAGAGAAGCTA
AGGCAGTGTGTTCGTAATGGTCCTTCGAAATACCCTGGTGCAAGGATGGT
CAGATATCCTGATGGTTCAGCTAGGCTCTTGATAGGTGATTACAGAAAGC
GTCTTGCTGATGAACTAAAATTCGGTTGTGTAGTTGATCGCCATTTAGAA
GATGGAGATATTGTTCTTTTCAATAGACAGCCAAGCTTGCATAGAATGTC
TATCATGTGCCATAGGGCGAGAATCATGCCGTGGAGAACATTGCGATTCA
ATGAGTCTGTTTGTAACCCATATAATGCTGATTTTGATGGTGATGAAATG
AACATGCATGTCCCACAAACGGAGGAGGCTCGAACAGAGGCACTCATGTT
GATGGGGGTGCAAAATAATTTATGCACGCCAAAAAATGGAGAAATTTTGG
TTGCTTCTACTCAAGATTTTTTAACATCTTCCTTTCTCATTACAAGGAAG
GATATTTTCTATGATCGTGCAGCTTTTTCTCTTATATGCTCCTATATGGG
TGATGGCATGGATCTTATAGATTTGCCGACTCCAGCATTACTTAAGCCAA
TAGAGCTTTGGACTGGTAAGCAATTGTTTAGTGTTCTATTACGCCCACAT
GCGAGTGTGAGAGTCTACTTGAATCTTATTGTTAAGGAAAGGAACTACTC
CAAGAAGATTATCAAAAGGATTGGAAATAAGGAAATAGAAGTAGAAACAA
TGTGCCCAGACGATGGATTTGTCTATATTCGGAATAGTGAGCTTATATGT
GGGCAACTGGGGAAGGCTACTTTAGGAAATGGCAACAAGGATGGACTTTA
TTCTGTTCTTCTCAGGGACTACAATGCACATGCTGCTGCTGCCTGCATGA
ATCGGTTAGCTAAACTGAGTGCTCGATGGATAGGGAATCACGGCTTTTCA
ATTGGAATTGATGATGTCCAACCGGGGAAAAGGTTGAATGATGAGAAAGC
ATTAACAATTTCAGGAGATTATAAGAAATGTGATGAAGAGATACAGACGT
TCAATGAAGGAAAACTAAAGCCTAAACCTGGTTATGATGCTGCTCAAACA
CTAGAAGCTAATGTATGCATGAAAGAACTACATTGGAGAAACAGTCCATT
GATCATGTCGCAATGTGGTTCCAAGGGTTCTGCTATAAATATAAGTCAAA
TGATTGCATGTGTTGGTCAGCAATCAGTTGGTGGTCGTCGTGCTCCTAAT
GGATTCATAGATCGTAGCCTTCCTCATTTTCATAGAGGATCAAAAACCCC
TGCTGCTAAAGGCTTTGTTGCAAATTCATTCTACAGTGGTTTGACTGCTA
CAGAGTTTTTCTTTCACACGATGGCTGGGCGAGAAGGCCTTGTGGATACA
GCTGTAAAAACAGCTGAGACAGGATACATGTCTCGTAGACTGATCAAAGC
ATTGGAAGACTTGAGCATTCATTATGATAACACCGTTCGCAATGCAAGTG
GATGTATAGTTCAATTTATTTATGGAGATGATGGCATGGATCCTGCATGT
ATGGAGGGAAAAAGTGGATTTCCTCTGAATTTTGACAGATTGTTAATGAA
AGTAAAGGCTACCTGTCCTCCAATAGAACAGAAATGCTTACACGTTGGTT
CTATCATGCCAATGTTAGAGGAGCAGCTTGCTAAACATGATCCTGCTGGG
GTTTGCTCTGAAGCCTTCAAAAAATCTCTGAAAGGGTTCCTTAAAAGTCA
GACGAACGAACTAGACAGAGTGATGAAATTGGTTAACAATTGTGCACAGA
AGAGTGAGATACTTGAGAAAGTTGGCCATAAAATATCTGGTATATCTGAC
AGGCAGTTGGAGGTTTTTGTTAGTACTTGCATTTCTCGTTATCGCTCTAA
AGTAATTGAAGCTGGAACTGCCATTGGAGCTATTGGAGCTCAGAGTATTG
GTGAACCTGGGACACAGATGACGCTGAAGACATTTCACTTTGCTGGAGTT
GCGAGCATGAATATTACACAAGGAGTTCCTCGTATCAAAGAAATCATAAA
TGCAGCCAAAAGAATTAGTACTCCCGTAATTACTGCAGAACTTGAGTTTG
ATGATAATCCGAACATTGCACAAATAGTAAAAGGTCGAATTGAGAAAACC
GTTTTAGGGCAGGTTGCTAAGAGCATCAAGATTGTAATTACTTCAAGATC
AGCATCAGTTGTTATCACCCTTGACATGGAAATAATCCTAGATGCAGAAT
TGTATATAGATGCAAATATTGTGAAAGAATCAATTTTGCAAACTCCGAAA
ATTAAACTAAAGGAGCAGCATGTGAAGGTTTTGGATGGTAGAAAATTGGA
AGTTGTTCCTCCAGCTGATAGAAGTCAAATTCATTTTGAACTTCATTCTC
TTAAAAATCTGCTTCCACTGGTTGTGGTAAAGGGGATAAAAACTGTTGAA
CGCACTGTTGTTTATGACAAGAACAAAGAGAAGAAAAATCAGAAAGAAGA
AGAGACAACGAAGCATTTCCAGTTGCTTGTAGAAGGCATGGGGCTCCAAG
CAGTTATGGGCATTGAAGGAATTGATGGACGGAGGACATGGAGTAACCAT
GTAATGGAAATGGAGCAGATATTGGGAATTGAAGCTGCAAGGAAATGCAT
AATCGATGAGATAGCACAAACTATGGAACATCATGGAATGACTATAGACA
GACGCCATATGATGCTTCTAGCAGATGTGATGACATTTAGGGGGGAAGTT
CTTGGCATCACAAGATTTGGAATCCAAAAAATGGACAAGAGTATATTGAT
GCTGGCTTCATTTGAGAGGACAGCTGATCACCTTTTCAATGCTGCTGTTA
ACGGGAGGGATGACAAGATTGAGGGAGTTACTGAGTGCATCATCATGGGC
ATCCCAATGCAGATAGGCACTGGAATACTCAAAGTTATACAGAGAGTTGA
TCCACCTCCTATGCTACGATATGGACCAGATCCAGTTTTATCTTGA

protein sequence of Tc03v2_p000850.2

>Tc03v2_p000850.2 ID=Tc03v2_p000850.2|Name=Tc03v2_p000850.2|organism=Theobroma cacao|type=polypeptide|length=1382bp
MQQKFTKRPYIEDVGPRKIKSIQFSMLSDSEIAKAAEVQVYQALYYDPKS
RPIEGGLLDPRMGPANKSGKCATCHGNFADCPGHYGYLSLALPVYNVGYL
STILDILKCICKSCSRIILDEKLCKDYLKRMRSPKIDALKKGDIMKSIVK
KCSAMASSKAVKCWRCGYVNGTVKKAVAMLGIIHDRSKINDNSLEEFRSA
ISHTKESKASFNVATYVLNPVKVLSLFKRMTDLDCELLYLSDRPEKLIIT
NIAVPPIPIRPSVIMDGSQSNENDITERLKRIIQANASLRQELVETNAAF
KCLGGWEMLQVEVAQYINSDVRGVPFSMQVSKPLSGFVQRIKGKHGRFRG
NLSGKRVEYTGRTVISPDPNLKITEVAIPIHMARILTYPERVSNHNIEKL
RQCVRNGPSKYPGARMVRYPDGSARLLIGDYRKRLADELKFGCVVDRHLE
DGDIVLFNRQPSLHRMSIMCHRARIMPWRTLRFNESVCNPYNADFDGDEM
NMHVPQTEEARTEALMLMGVQNNLCTPKNGEILVASTQDFLTSSFLITRK
DIFYDRAAFSLICSYMGDGMDLIDLPTPALLKPIELWTGKQLFSVLLRPH
ASVRVYLNLIVKERNYSKKIIKRIGNKEIEVETMCPDDGFVYIRNSELIC
GQLGKATLGNGNKDGLYSVLLRDYNAHAAAACMNRLAKLSARWIGNHGFS
IGIDDVQPGKRLNDEKALTISGDYKKCDEEIQTFNEGKLKPKPGYDAAQT
LEANVCMKELHWRNSPLIMSQCGSKGSAINISQMIACVGQQSVGGRRAPN
GFIDRSLPHFHRGSKTPAAKGFVANSFYSGLTATEFFFHTMAGREGLVDT
AVKTAETGYMSRRLIKALEDLSIHYDNTVRNASGCIVQFIYGDDGMDPAC
MEGKSGFPLNFDRLLMKVKATCPPIEQKCLHVGSIMPMLEEQLAKHDPAG
VCSEAFKKSLKGFLKSQTNELDRVMKLVNNCAQKSEILEKVGHKISGISD
RQLEVFVSTCISRYRSKVIEAGTAIGAIGAQSIGEPGTQMTLKTFHFAGV
ASMNITQGVPRIKEIINAAKRISTPVITAELEFDDNPNIAQIVKGRIEKT
VLGQVAKSIKIVITSRSASVVITLDMEIILDAELYIDANIVKESILQTPK
IKLKEQHVKVLDGRKLEVVPPADRSQIHFELHSLKNLLPLVVVKGIKTVE
RTVVYDKNKEKKNQKEEETTKHFQLLVEGMGLQAVMGIEGIDGRRTWSNH
VMEMEQILGIEAARKCIIDEIAQTMEHHGMTIDRRHMMLLADVMTFRGEV
LGITRFGIQKMDKSILMLASFERTADHLFNAAVNGRDDKIEGVTECIIMG
IPMQIGTGILKVIQRVDPPPMLRYGPDPVLS*