Tc03v2_t000850.1 | Cocoa Genome Hub

Overview


Name	Tc03v2_t000850.1
Unique Name	Tc03v2_t000850.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	4188

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 2 ESTs, 19 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 3 samples with support for all annotated introns
Product	DNA-directed RNA polymerase III subunit 1, transcript variant X1
Note	DNA-directed RNA polymerase III subunit 1

Cross References

External references for this mRNA


Database	Accession
GeneID	18603906
Genbank	XM_018117638.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc03v2_g000850	Tc03v2_g000850	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc03v2_p000850.1	Tc03v2_p000850.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto141919	auto141919	Theobroma cacao	exon
exon-auto141920	auto141920	Theobroma cacao	exon
exon-auto141921	auto141921	Theobroma cacao	exon
exon-auto141922	auto141922	Theobroma cacao	exon
exon-auto141923	auto141923	Theobroma cacao	exon
exon-auto141924	auto141924	Theobroma cacao	exon
exon-auto141925	auto141925	Theobroma cacao	exon
exon-auto141926	auto141926	Theobroma cacao	exon
exon-auto141927	auto141927	Theobroma cacao	exon
exon-auto141928	auto141928	Theobroma cacao	exon
exon-auto141929	auto141929	Theobroma cacao	exon
exon-auto141930	auto141930	Theobroma cacao	exon
exon-auto141931	auto141931	Theobroma cacao	exon
exon-auto141932	auto141932	Theobroma cacao	exon
exon-auto141933	auto141933	Theobroma cacao	exon
exon-auto141934	auto141934	Theobroma cacao	exon
exon-auto141935	auto141935	Theobroma cacao	exon
exon-auto141936	auto141936	Theobroma cacao	exon
exon-auto141937	auto141937	Theobroma cacao	exon
exon-auto141938	auto141938	Theobroma cacao	exon
exon-auto141939	auto141939	Theobroma cacao	exon
exon-auto141940	auto141940	Theobroma cacao	exon
exon-auto141941	auto141941	Theobroma cacao	exon
exon-auto141942	auto141942	Theobroma cacao	exon
exon-auto141943	auto141943	Theobroma cacao	exon
exon-auto141944	auto141944	Theobroma cacao	exon
exon-auto141945	auto141945	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto141946	auto141946	Theobroma cacao	CDS
CDS-auto141947	auto141947	Theobroma cacao	CDS
CDS-auto141948	auto141948	Theobroma cacao	CDS
CDS-auto141949	auto141949	Theobroma cacao	CDS
CDS-auto141950	auto141950	Theobroma cacao	CDS
CDS-auto141951	auto141951	Theobroma cacao	CDS
CDS-auto141952	auto141952	Theobroma cacao	CDS
CDS-auto141953	auto141953	Theobroma cacao	CDS
CDS-auto141954	auto141954	Theobroma cacao	CDS
CDS-auto141955	auto141955	Theobroma cacao	CDS
CDS-auto141956	auto141956	Theobroma cacao	CDS
CDS-auto141957	auto141957	Theobroma cacao	CDS
CDS-auto141958	auto141958	Theobroma cacao	CDS
CDS-auto141959	auto141959	Theobroma cacao	CDS
CDS-auto141960	auto141960	Theobroma cacao	CDS
CDS-auto141961	auto141961	Theobroma cacao	CDS
CDS-auto141962	auto141962	Theobroma cacao	CDS
CDS-auto141963	auto141963	Theobroma cacao	CDS
CDS-auto141964	auto141964	Theobroma cacao	CDS
CDS-auto141965	auto141965	Theobroma cacao	CDS
CDS-auto141966	auto141966	Theobroma cacao	CDS
CDS-auto141967	auto141967	Theobroma cacao	CDS
CDS-auto141968	auto141968	Theobroma cacao	CDS
CDS-auto141969	auto141969	Theobroma cacao	CDS
CDS-auto141970	auto141970	Theobroma cacao	CDS
CDS-auto141971	auto141971	Theobroma cacao	CDS
CDS-auto141972	auto141972	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc03v2_t000850.1 ID=Tc03v2_t000850.1|Name=Tc03v2_t000850.1|organism=Theobroma cacao|type=mRNA|length=4188bp
ATGCAGCAAAAATTTACAAAACGGCCGTACATCGAAGATGTCGGGCCGCG
AAAAATAAAAAGCATTCAATTTTCTATGTTATCAGATTCGGAGATAGCCA
AAGCTGCTGAAGTTCAAGTTTATCAAGCTCTTTACTATGATCCTAAAAGC
CGCCCCATCGAAGGCGGCTTATTGGATCCCCGAATGGGTCCTGCAAATAA
AAGCGGGAAATGTGCAACCTGCCATGGAAATTTTGCGGATTGCCCAGGCC
ATTACGGATACTTATCTCTTGCCCTTCCTGTTTATAATGTTGGATATTTA
AGTACAATTTTAGACATTTTAAAGTGCATCTGTAAGTCTTGTTCTCGTAT
AATTTTGGATGAGAAATTATGCAAAGATTATCTGAAGAGGATGAGAAGTC
CGAAGATCGATGCATTAAAGAAGGGTGATATAATGAAAAGTATCGTGAAG
AAGTGTAGTGCTATGGCTAGTAGTAAAGCTGTGAAGTGCTGGAGATGTGG
ATATGTAAATGGTACGGTGAAGAAGGCTGTGGCAATGTTGGGCATTATTC
ATGATCGTTCAAAAATTAATGACAACAGTTTGGAAGAATTTAGATCAGCA
ATTTCCCACACAAAGGAGTCCAAGGCATCCTTCAACGTTGCTACTTATGT
TCTAAACCCTGTCAAAGTGCTTTCTCTTTTTAAAAGGATGACTGATTTGG
ATTGCGAATTGCTATATCTTTCTGATAGACCTGAGAAGCTCATAATTACA
AATATTGCTGTGCCACCTATACCTATCCGACCTTCAGTCATTATGGATGG
GTCACAGAGCAACGAAAATGACATTACTGAGAGGTTGAAACGAATTATTC
AGGCAAATGCTAGCCTTCGTCAGGAATTAGTAGAAACAAATGCTGCATTC
AAATGTCTGGGTGGCTGGGAGATGCTTCAAGTTGAAGTTGCACAGTACAT
TAATAGTGATGTTCGTGGTGTTCCATTTAGTATGCAAGTGTCAAAGCCGC
TGAGTGGTTTTGTTCAGCGCATCAAAGGGAAGCACGGACGCTTTCGTGGT
AACTTATCTGGCAAACGTGTTGAATATACTGGCCGGACTGTTATATCACC
TGACCCCAATCTGAAAATTACTGAGGTGGCTATCCCAATCCATATGGCTC
GGATTTTGACTTATCCAGAACGTGTTTCCAATCACAATATAGAGAAGCTA
AGGCAGTGTGTTCGTAATGGTCCTTCGAAATACCCTGGTGCAAGGATGGT
CAGATATCCTGATGGTTCAGCTAGGCTCTTGATAGGTGATTACAGAAAGC
GTCTTGCTGATGAACTAAAATTCGGTTGTGTAGTTGATCGCCATTTAGAA
GATGGAGATATTGTTCTTTTCAATAGACAGCCAAGCTTGCATAGAATGTC
TATCATGTGCCATAGGGCGAGAATCATGCCGTGGAGAACATTGCGATTCA
ATGAGTCTGTTTGTAACCCATATAATGCTGATTTTGATGGTGATGAAATG
AACATGCATGTCCCACAAACGGAGGAGGCTCGAACAGAGGCACTCATGTT
GATGGGGGTGCAAAATAATTTATGCACGCCAAAAAATGGAGAAATTTTGG
TTGCTTCTACTCAAGATTTTTTAACATCTTCCTTTCTCATTACAAGGAAG
GATATTTTCTATGATCGTGCAGCTTTTTCTCTTATATGCTCCTATATGGG
TGATGGCATGGATCTTATAGATTTGCCGACTCCAGCATTACTTAAGCCAA
TAGAGCTTTGGACTGGTAAGCAATTGTTTAGTGTTCTATTACGCCCACAT
GCGAGTGTGAGAGTCTACTTGAATCTTATTGTTAAGGAAAGGAACTACTC
CAAGAAGATTATCAAAAGGATTGGAAATAAGGAAATAGAAGTAGAAACAA
TGTGCCCAGACGATGGATTTGTCTATATTCGGAATAGTGAGCTTATATGT
GGGCAACTGGGGAAGGCTACTTTAGGAAATGGCAACAAGGATGGACTTTA
TTCTGTTCTTCTCAGGGACTACAATGCACATGCTGCTGCTGCCTGCATGA
ATCGGTTAGCTAAACTGAGTGCTCGATGGATAGGGAATCACGGCTTTTCA
ATTGGAATTGATGATGTCCAACCGGGGAAAAGGTTGAATGATGAGAAAGC
ATTAACAATTTCAGGAGATTATAAGAAATGTGATGAAGAGATACAGACGT
TCAATGAAGGAAAACTAAAGCCTAAACCTGGTTATGATGCTGCTCAAACA
CTAGAAGCTAATGTAACTGCAATATTGAATAACATTCGGGACAAAACGGG
GAAGGTATGCATGAAAGAACTACATTGGAGAAACAGTCCATTGATCATGT
CGCAATGTGGTTCCAAGGGTTCTGCTATAAATATAAGTCAAATGATTGCA
TGTGTTGGTCAGCAATCAGTTGGTGGTCGTCGTGCTCCTAATGGATTCAT
AGATCGTAGCCTTCCTCATTTTCATAGAGGATCAAAAACCCCTGCTGCTA
AAGGCTTTGTTGCAAATTCATTCTACAGTGGTTTGACTGCTACAGAGTTT
TTCTTTCACACGATGGCTGGGCGAGAAGGCCTTGTGGATACAGCTGTAAA
AACAGCTGAGACAGGATACATGTCTCGTAGACTGATCAAAGCATTGGAAG
ACTTGAGCATTCATTATGATAACACCGTTCGCAATGCAAGTGGATGTATA
GTTCAATTTATTTATGGAGATGATGGCATGGATCCTGCATGTATGGAGGG
AAAAAGTGGATTTCCTCTGAATTTTGACAGATTGTTAATGAAAGTAAAGG
CTACCTGTCCTCCAATAGAACAGAAATGCTTACACGTTGGTTCTATCATG
CCAATGTTAGAGGAGCAGCTTGCTAAACATGATCCTGCTGGGGTTTGCTC
TGAAGCCTTCAAAAAATCTCTGAAAGGGTTCCTTAAAAGTCAGACGAACG
AACTAGACAGAGTGATGAAATTGGTTAACAATTGTGCACAGAAGAGTGAG
ATACTTGAGAAAGTTGGCCATAAAATATCTGGTATATCTGACAGGCAGTT
GGAGGTTTTTGTTAGTACTTGCATTTCTCGTTATCGCTCTAAAGTAATTG
AAGCTGGAACTGCCATTGGAGCTATTGGAGCTCAGAGTATTGGTGAACCT
GGGACACAGATGACGCTGAAGACATTTCACTTTGCTGGAGTTGCGAGCAT
GAATATTACACAAGGAGTTCCTCGTATCAAAGAAATCATAAATGCAGCCA
AAAGAATTAGTACTCCCGTAATTACTGCAGAACTTGAGTTTGATGATAAT
CCGAACATTGCACAAATAGTAAAAGGTCGAATTGAGAAAACCGTTTTAGG
GCAGGTTGCTAAGAGCATCAAGATTGTAATTACTTCAAGATCAGCATCAG
TTGTTATCACCCTTGACATGGAAATAATCCTAGATGCAGAATTGTATATA
GATGCAAATATTGTGAAAGAATCAATTTTGCAAACTCCGAAAATTAAACT
AAAGGAGCAGCATGTGAAGGTTTTGGATGGTAGAAAATTGGAAGTTGTTC
CTCCAGCTGATAGAAGTCAAATTCATTTTGAACTTCATTCTCTTAAAAAT
CTGCTTCCACTGGTTGTGGTAAAGGGGATAAAAACTGTTGAACGCACTGT
TGTTTATGACAAGAACAAAGAGAAGAAAAATCAGAAAGAAGAAGAGACAA
CGAAGCATTTCCAGTTGCTTGTAGAAGGCATGGGGCTCCAAGCAGTTATG
GGCATTGAAGGAATTGATGGACGGAGGACATGGAGTAACCATGTAATGGA
AATGGAGCAGATATTGGGAATTGAAGCTGCAAGGAAATGCATAATCGATG
AGATAGCACAAACTATGGAACATCATGGAATGACTATAGACAGACGCCAT
ATGATGCTTCTAGCAGATGTGATGACATTTAGGGGGGAAGTTCTTGGCAT
CACAAGATTTGGAATCCAAAAAATGGACAAGAGTATATTGATGCTGGCTT
CATTTGAGAGGACAGCTGATCACCTTTTCAATGCTGCTGTTAACGGGAGG
GATGACAAGATTGAGGGAGTTACTGAGTGCATCATCATGGGCATCCCAAT
GCAGATAGGCACTGGAATACTCAAAGTTATACAGAGAGTTGATCCACCTC
CTATGCTACGATATGGACCAGATCCAGTTTTATCTTGA

protein sequence of Tc03v2_p000850.1

>Tc03v2_p000850.1 ID=Tc03v2_p000850.1|Name=Tc03v2_p000850.1|organism=Theobroma cacao|type=polypeptide|length=1396bp
MQQKFTKRPYIEDVGPRKIKSIQFSMLSDSEIAKAAEVQVYQALYYDPKS
RPIEGGLLDPRMGPANKSGKCATCHGNFADCPGHYGYLSLALPVYNVGYL
STILDILKCICKSCSRIILDEKLCKDYLKRMRSPKIDALKKGDIMKSIVK
KCSAMASSKAVKCWRCGYVNGTVKKAVAMLGIIHDRSKINDNSLEEFRSA
ISHTKESKASFNVATYVLNPVKVLSLFKRMTDLDCELLYLSDRPEKLIIT
NIAVPPIPIRPSVIMDGSQSNENDITERLKRIIQANASLRQELVETNAAF
KCLGGWEMLQVEVAQYINSDVRGVPFSMQVSKPLSGFVQRIKGKHGRFRG
NLSGKRVEYTGRTVISPDPNLKITEVAIPIHMARILTYPERVSNHNIEKL
RQCVRNGPSKYPGARMVRYPDGSARLLIGDYRKRLADELKFGCVVDRHLE
DGDIVLFNRQPSLHRMSIMCHRARIMPWRTLRFNESVCNPYNADFDGDEM
NMHVPQTEEARTEALMLMGVQNNLCTPKNGEILVASTQDFLTSSFLITRK
DIFYDRAAFSLICSYMGDGMDLIDLPTPALLKPIELWTGKQLFSVLLRPH
ASVRVYLNLIVKERNYSKKIIKRIGNKEIEVETMCPDDGFVYIRNSELIC
GQLGKATLGNGNKDGLYSVLLRDYNAHAAAACMNRLAKLSARWIGNHGFS
IGIDDVQPGKRLNDEKALTISGDYKKCDEEIQTFNEGKLKPKPGYDAAQT
LEANVTAILNNIRDKTGKVCMKELHWRNSPLIMSQCGSKGSAINISQMIA
CVGQQSVGGRRAPNGFIDRSLPHFHRGSKTPAAKGFVANSFYSGLTATEF
FFHTMAGREGLVDTAVKTAETGYMSRRLIKALEDLSIHYDNTVRNASGCI
VQFIYGDDGMDPACMEGKSGFPLNFDRLLMKVKATCPPIEQKCLHVGSIM
PMLEEQLAKHDPAGVCSEAFKKSLKGFLKSQTNELDRVMKLVNNCAQKSE
ILEKVGHKISGISDRQLEVFVSTCISRYRSKVIEAGTAIGAIGAQSIGEP
GTQMTLKTFHFAGVASMNITQGVPRIKEIINAAKRISTPVITAELEFDDN
PNIAQIVKGRIEKTVLGQVAKSIKIVITSRSASVVITLDMEIILDAELYI
DANIVKESILQTPKIKLKEQHVKVLDGRKLEVVPPADRSQIHFELHSLKN
LLPLVVVKGIKTVERTVVYDKNKEKKNQKEEETTKHFQLLVEGMGLQAVM
GIEGIDGRRTWSNHVMEMEQILGIEAARKCIIDEIAQTMEHHGMTIDRRH
MMLLADVMTFRGEVLGITRFGIQKMDKSILMLASFERTADHLFNAAVNGR
DDKIEGVTECIIMGIPMQIGTGILKVIQRVDPPPMLRYGPDPVLS*