Tc06v2_t015520.1 | Cocoa Genome Hub

Overview


Name	Tc06v2_t015520.1
Unique Name	Tc06v2_t015520.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3570

Properties


Property Name	Value
Note	DNA-directed RNA polymerase II subunit RPB2
Model evidence	Supporting evidence includes similarity to: 8 ESTs, 14 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 18 samples with support for all annotated introns
Product	DNA-directed RNA polymerase II subunit RPB2

Cross References

External references for this mRNA


Database	Accession
GeneID	18596855
Genbank	XM_007025569.2

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc06v2_g015520	Tc06v2_g015520	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc06v2_p015520.1	Tc06v2_p015520.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto344102	auto344102	Theobroma cacao	exon
exon-auto344103	auto344103	Theobroma cacao	exon
exon-auto344104	auto344104	Theobroma cacao	exon
exon-auto344105	auto344105	Theobroma cacao	exon
exon-auto344106	auto344106	Theobroma cacao	exon
exon-auto344107	auto344107	Theobroma cacao	exon
exon-auto344108	auto344108	Theobroma cacao	exon
exon-auto344109	auto344109	Theobroma cacao	exon
exon-auto344110	auto344110	Theobroma cacao	exon
exon-auto344111	auto344111	Theobroma cacao	exon
exon-auto344112	auto344112	Theobroma cacao	exon
exon-auto344113	auto344113	Theobroma cacao	exon
exon-auto344114	auto344114	Theobroma cacao	exon
exon-auto344115	auto344115	Theobroma cacao	exon
exon-auto344116	auto344116	Theobroma cacao	exon
exon-auto344117	auto344117	Theobroma cacao	exon
exon-auto344118	auto344118	Theobroma cacao	exon
exon-auto344119	auto344119	Theobroma cacao	exon
exon-auto344120	auto344120	Theobroma cacao	exon
exon-auto344121	auto344121	Theobroma cacao	exon
exon-auto344122	auto344122	Theobroma cacao	exon
exon-auto344123	auto344123	Theobroma cacao	exon
exon-auto344124	auto344124	Theobroma cacao	exon
exon-auto344125	auto344125	Theobroma cacao	exon
exon-auto344126	auto344126	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto344127	auto344127	Theobroma cacao	CDS
CDS-auto344128	auto344128	Theobroma cacao	CDS
CDS-auto344129	auto344129	Theobroma cacao	CDS
CDS-auto344130	auto344130	Theobroma cacao	CDS
CDS-auto344131	auto344131	Theobroma cacao	CDS
CDS-auto344132	auto344132	Theobroma cacao	CDS
CDS-auto344133	auto344133	Theobroma cacao	CDS
CDS-auto344134	auto344134	Theobroma cacao	CDS
CDS-auto344135	auto344135	Theobroma cacao	CDS
CDS-auto344136	auto344136	Theobroma cacao	CDS
CDS-auto344137	auto344137	Theobroma cacao	CDS
CDS-auto344138	auto344138	Theobroma cacao	CDS
CDS-auto344139	auto344139	Theobroma cacao	CDS
CDS-auto344140	auto344140	Theobroma cacao	CDS
CDS-auto344141	auto344141	Theobroma cacao	CDS
CDS-auto344142	auto344142	Theobroma cacao	CDS
CDS-auto344143	auto344143	Theobroma cacao	CDS
CDS-auto344144	auto344144	Theobroma cacao	CDS
CDS-auto344145	auto344145	Theobroma cacao	CDS
CDS-auto344146	auto344146	Theobroma cacao	CDS
CDS-auto344147	auto344147	Theobroma cacao	CDS
CDS-auto344148	auto344148	Theobroma cacao	CDS
CDS-auto344149	auto344149	Theobroma cacao	CDS
CDS-auto344150	auto344150	Theobroma cacao	CDS
CDS-auto344151	auto344151	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc06v2_t015520.1 ID=Tc06v2_t015520.1|Name=Tc06v2_t015520.1|organism=Theobroma cacao|type=mRNA|length=3570bp
ATGGAGGACGACAGTGAGTACGATCCGCAACTTATGGACGACGAAGACGA
CGAGGAGATCACGCAGGAAGACGCGTGGGCGGTTATCTCAGCTTACTTCG
AAGAAAAAGGTCTGGTGCGTCAACAGCTCGACTCGTTCGATGAATTTATC
CAAAACACTATGCAAGAAATCGTCGACGAATCGGCCGATATTGAGATCAG
GCCAGAGTCACAGCACAATCCTGGTCACCAGTCCGACTTTGCTGAGACTA
TCTATAAGATTAGCTTTGGTCAGATCTACCTTAGTAAACCTATGATGACC
GAGTCAGATGGTGAAACTGCAACTTTATTTCCAAAAGCTGCAAGGTTGAG
GAATCTTACTTACTCAGCTCCATTGTATGTCGATGTAACTAAGAGAGTTA
TAAAGAAAGGGCATGATGGTGAAGAAGTCACTGAGACTCAGGATTTTACT
AAAGTGTTCATTGGGAAGGTTCCTATAATGCTCCGGTCAAGTTATTGCAC
ACTATATCAAAATTCAGAGAAGGATCTGACCGAGCTTGGGGAGTGTCCAT
ATGATCAAGGTGGGTATTTCATTATCAATGGGAGTGAAAAGGTTCTAATT
GCTCAGGAGAAGATGAGCACAAATCATGTCTATGTCTTCAAAAAGAGGCA
GCCGAACAAATATGCCTATGTGGCAGAAGTTCGGTCCATGGCAGAGTCCC
AGAATAGGCCACCAAGTACCATGTTTGTGCGGATGCTTTCTCGGACTAGT
GCCAAAGGGGGCTCTTCGGGGCAGTACATTCGTGCTACTCTTCCATATAT
TCGGACTGAAATTCCTATCATAATTGTCTTTCGGGCTTTGGGATTTGTTG
CTGACAAGGACATATTAGAGCATATATGCTATGACTTCTCCGACACCCAG
ATGATGGAGTTGCTTAGGCCTTCCTTAGAAGAAGCATTTGTGATTCAAAA
CCAGCAGGTTGCACTAGATTATATTGGTAAAAGAGGAGCAACTGTTGGTG
TTACCAGAGAAAAGAGGATTAAGTATGCTAAAGAGATCCTCCAAAAAGAA
ATGCTTCCTCACGTAGGTGTTGGAGATTTTTGCGAGACAAAGAAAGCTTA
TTATTTTGGATATATTATTCACCGGCTGCTTCTTTGTGCACTTGGCCGGA
GGGCGGAAGATGATAGAGATCATTATGGCAACAAGAGGTTGGACCTTGCT
GGTCCATTACTTGGAGGCCTCTTTAGAATGCTTTTTCGGAAGTTAACTAG
GGATGTGAGATCTTATGTGCAGAAGTGTGTTGATAACGGGAAGGATGTGA
ACCTGCAATTTGCTATCAAAGCGAAAACTATTACAAGTGGTCTTAAATAC
TCACTTGCTACTGGAAATTGGGGGCAAGCAAATGCAGCTGGTACTAGAGC
TGGAGTGTCACAGGTGTTAAACCGTTTGACATATGCCTCAACTTTGTCAC
ACTTGCGAAGGCTCAATTCTCCTATAGGACGTGAAGGGAAATTGGCTAAA
CCACGTCAGTTGCATAATTCACAGTGGGGAATGATGTGTCCAGCGGAAAC
ACCGGAAGGACAGGCCTGTGGACTTGTAAAGAATCTTGCCTTGATGGTAT
ACATAACTGTCGGATCAGCTGCATATCCTATTCTTGAATTTTTGGAAGAG
TGGGGTACGGAGAATTTTGAGGAAATCTCACCTGCAGTTATCCCTCAAGC
TACAAAAATTTTTGTCAATGGTTGCTGGGTTGGTGTACATCGGAATCCTG
ATATGCTTGTGACAACATTGAGACGGTTGAGAAGACGGGTTGATGTCAAT
ACTGAAGTTGGTGTTGTTAGAGATATCCGTCTAAAAGAACTTCGAATATA
TACTGACTATGGTCGTTGCAGTCGACCATTGTTCATCGTGGAGAAACAAA
GACTTCTCATAAAGAAGAAAGATATTCATGCACTGCAACAAAGAGAAAGC
CCAGAAGACGGTGGCTGGCATGATCTTGTAGCAAAGGGATTTATAGAATA
CATTGACACGGAAGAAGAGGAGACAACAATGATTTCCATGACCATCAATG
ATCTTGTACAAGCGAGAGTCAATCCAGAGGAAGCTTATTCTGAAACTTAT
ACCCATTGTGAGATCCACCCTTCATTGATTTTGGGTGTTTGTGCTTCAAT
TATACCATTTCCTGATCATAATCAGTCCCCGCGTAATACCTATCAATCTG
CTATGGGTAAGCAAGCAATGGGAATATATGTTACCAACTACCAATTTCGA
ATGGATACATTGGCCTATGTTCTCTATTATCCCCAAAAGCCACTTGTTAC
TACACGAGCTATGGAACATCTCCACTTTCGGCAGCTTCCAGCTGGCATTA
ATGCTATTGTTGCTATCGCCTGCTATTCTGGATATAACCAAGAAGATTCT
GTTATTATGAATCAATCATCAATAGACCGTGGATTCTTCCGATCACTTTT
CTTCCGCTCTTACCGAGATGAGGAGAAAAAAATGGGGACCCTTGTTAAAG
AAGATTTTGGTCGACCAGATAGGGCTAATACTATGGGAATGAGGCATGGC
TCTTATGATAAATTGGATGATGATGGTCTTGCACCTCCTGGAACAAGAGT
TTCAGGTGAGGATGTAATCATCGGAAAGACCACCCCGATTTCTCAGGAAG
AAGCTCAGGGACAAGCATCACGCTATTCAAGACGTGATCATAGCATAAGC
TTACGTCACAGTGAAACAGGCATAGTGGACCAAGTTCTATTGACAACTAA
TGCTGATGGGTTGAGATTTGTGAAAGTAAGGGTAAGATCTGTTCGCATTC
CCCAGATTGGGGACAAGTTTAGCAGTAGACATGGTCAAAAGGGGACAGTG
GGCATGACATACACGCAGGAAGACATGCCTTGGACTGTGGAAGGCATCAC
ACCCGATATCATTGTGAACCCACATGCTATTCCTTCTCGAATGACAATTG
GTCAGCTTATTGAATGTATCATGGGGAAAGTTGCAGCTCACATGGGCAAG
GAAGGGGATGCCACTCCTTTTACAGATGTCACCGTGGACAATATCAGCAG
AGCTCTTCATAAATGTGGATATCAAATGCGTGGTTTTGAGACCATGTATA
ATGGGCACACAGGCAGGCGCCTTTCTGCTATGATATTTTTGGGGCCCACA
TATTACCAAAGACTAAAGCACATGGTTGATGATAAGATCCATTCTCGTGG
TCGGGGCCCTGTGCAGATCCTGACAAGGCAGCCTGCAGAGGGACGATCCC
GTGATGGTGGTCTCCGTTTCGGAGAGATGGAAAGAGATTGCATGATTGCG
CATGGTGCTGCTCATTTCCTTAAAGAGAGATTGTTTGACCAAAGTGATGC
ATACAGGGTCCATGTGTGCGAGCGTTGTGGGTTGATTGCTATTGCAAATC
TAAAGAAGAACTCATTTGAGTGCAGAGGATGCAAGAATAAAACTGATATT
GTTCAGGTATACATTCCTTACGCCTGTAAGCTGCTCTTCCAAGAGCTTAT
GGCCATGGCAATTGCTCCAAGAATGCTCACAAAGGAACCTCCCAAAGACC
AAAAGAAGAAAGGAGCCTGA

protein sequence of Tc06v2_p015520.1

>Tc06v2_p015520.1 ID=Tc06v2_p015520.1|Name=Tc06v2_p015520.1|organism=Theobroma cacao|type=polypeptide|length=1190bp
MEDDSEYDPQLMDDEDDEEITQEDAWAVISAYFEEKGLVRQQLDSFDEFI
QNTMQEIVDESADIEIRPESQHNPGHQSDFAETIYKISFGQIYLSKPMMT
ESDGETATLFPKAARLRNLTYSAPLYVDVTKRVIKKGHDGEEVTETQDFT
KVFIGKVPIMLRSSYCTLYQNSEKDLTELGECPYDQGGYFIINGSEKVLI
AQEKMSTNHVYVFKKRQPNKYAYVAEVRSMAESQNRPPSTMFVRMLSRTS
AKGGSSGQYIRATLPYIRTEIPIIIVFRALGFVADKDILEHICYDFSDTQ
MMELLRPSLEEAFVIQNQQVALDYIGKRGATVGVTREKRIKYAKEILQKE
MLPHVGVGDFCETKKAYYFGYIIHRLLLCALGRRAEDDRDHYGNKRLDLA
GPLLGGLFRMLFRKLTRDVRSYVQKCVDNGKDVNLQFAIKAKTITSGLKY
SLATGNWGQANAAGTRAGVSQVLNRLTYASTLSHLRRLNSPIGREGKLAK
PRQLHNSQWGMMCPAETPEGQACGLVKNLALMVYITVGSAAYPILEFLEE
WGTENFEEISPAVIPQATKIFVNGCWVGVHRNPDMLVTTLRRLRRRVDVN
TEVGVVRDIRLKELRIYTDYGRCSRPLFIVEKQRLLIKKKDIHALQQRES
PEDGGWHDLVAKGFIEYIDTEEEETTMISMTINDLVQARVNPEEAYSETY
THCEIHPSLILGVCASIIPFPDHNQSPRNTYQSAMGKQAMGIYVTNYQFR
MDTLAYVLYYPQKPLVTTRAMEHLHFRQLPAGINAIVAIACYSGYNQEDS
VIMNQSSIDRGFFRSLFFRSYRDEEKKMGTLVKEDFGRPDRANTMGMRHG
SYDKLDDDGLAPPGTRVSGEDVIIGKTTPISQEEAQGQASRYSRRDHSIS
LRHSETGIVDQVLLTTNADGLRFVKVRVRSVRIPQIGDKFSSRHGQKGTV
GMTYTQEDMPWTVEGITPDIIVNPHAIPSRMTIGQLIECIMGKVAAHMGK
EGDATPFTDVTVDNISRALHKCGYQMRGFETMYNGHTGRRLSAMIFLGPT
YYQRLKHMVDDKIHSRGRGPVQILTRQPAEGRSRDGGLRFGEMERDCMIA
HGAAHFLKERLFDQSDAYRVHVCERCGLIAIANLKKNSFECRGCKNKTDI
VQVYIPYACKLLFQELMAMAIAPRMLTKEPPKDQKKKGA*