Tc04v2_t011400.1 | Cocoa Genome Hub

Overview


Name	Tc04v2_t011400.1
Unique Name	Tc04v2_t011400.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	4386

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 1 EST, 23 Proteins, and 99% coverage of the annotated genomic feature by RNAseq alignments, including 1 sample with support for all annotated introns
Product	histone acetyltransferase HAC12
Note	Histone acetyltransferase of the CBP family 1, putative

Cross References

External references for this mRNA


Database	Accession
GeneID	18602114
Genbank	XM_007033300.2

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc04v2_g011400	Tc04v2_g011400	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc04v2_p011400.1	Tc04v2_p011400.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto220254	auto220254	Theobroma cacao	exon
exon-auto220255	auto220255	Theobroma cacao	exon
exon-auto220256	auto220256	Theobroma cacao	exon
exon-auto220257	auto220257	Theobroma cacao	exon
exon-auto220258	auto220258	Theobroma cacao	exon
exon-auto220259	auto220259	Theobroma cacao	exon
exon-auto220260	auto220260	Theobroma cacao	exon
exon-auto220261	auto220261	Theobroma cacao	exon
exon-auto220262	auto220262	Theobroma cacao	exon
exon-auto220263	auto220263	Theobroma cacao	exon
exon-auto220264	auto220264	Theobroma cacao	exon
exon-auto220265	auto220265	Theobroma cacao	exon
exon-auto220266	auto220266	Theobroma cacao	exon
exon-auto220267	auto220267	Theobroma cacao	exon
exon-auto220268	auto220268	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto220269	auto220269	Theobroma cacao	CDS
CDS-auto220270	auto220270	Theobroma cacao	CDS
CDS-auto220271	auto220271	Theobroma cacao	CDS
CDS-auto220272	auto220272	Theobroma cacao	CDS
CDS-auto220273	auto220273	Theobroma cacao	CDS
CDS-auto220274	auto220274	Theobroma cacao	CDS
CDS-auto220275	auto220275	Theobroma cacao	CDS
CDS-auto220276	auto220276	Theobroma cacao	CDS
CDS-auto220277	auto220277	Theobroma cacao	CDS
CDS-auto220278	auto220278	Theobroma cacao	CDS
CDS-auto220279	auto220279	Theobroma cacao	CDS
CDS-auto220280	auto220280	Theobroma cacao	CDS
CDS-auto220281	auto220281	Theobroma cacao	CDS
CDS-auto220282	auto220282	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc04v2_t011400.1 ID=Tc04v2_t011400.1|Name=Tc04v2_t011400.1|organism=Theobroma cacao|type=mRNA|length=4386bp
ATGAACCAGCAGACTTTGGAGTACCCTTTCAAAGTTCTTAATGTAAATCC
TACTCCCTCGTTCATGCCCAACAGAATGGTGATGCCAACTTCGGGCTTGG
TGCAAGATGGCAACTTAGCCATTCCTGATGCTTTAAAAGTTCTTAATGTA
AATCCTACTCCCTCATTCATGTCGAACAGTATGATGATGCCAACTTCAGG
TTTGGTACAAGATGGCAATTTAGCCATTCCTGGTGGACTTTTTAATCAAA
ATCAGTTAAATGATGTGACAATGGATTACAAAGAGATTGTTGATGACCCT
AATCAATTTGGCTTCTTAAAAGAATTCTTTGGTGATAGACACAAGGCACA
AACTGCTGGATACACCACTATGGATTGGAATATTGCGCCAGCCTTGGGTA
TGCTGCCGGTTGAGGGTGAGATGGTCCTTTCCTCCGGACAGGCCTCAACC
ATCACTAGTTGTTATGGTGGGGATGGCTTTTCTGATGTCGGATCTCTTGA
AAGTAGGCCACCCTTTTCAAAGGGAAAATTACTACATCTTTATGATGGCA
AAATAAATATGATGGATCACATAGGTTGGTTGGGGAATAATCAGAGCTCT
GATTCCATGGTTTTCCCACATATACTAGGAGGATCCTTGGCATTTTCTGA
AGCAAATACACAGACCTCGCAGGAAATTTTACAGGAACTTTCTGAAGTGC
CTGATATATTGCCTGGTCTGAACTCAGCCATGGCTAGTTCAACTATTATT
CCGTACATGCAGTCTTCTAGACCATCTGAGGCTGAAGCAAAATGTTCTTT
CACTGGAAAAAATCAATCTTACTGTCCAGTAGAGGCAAAAACTGCAGGTC
ATTTTCCTCAGCTCCCTTTAGAAAATGCACCAGCAGATTCAAGGAATCAA
TTGACATGGGCTATCCAGCATAGGGTTTTACTTGCTTATATCCAGTACAA
GAAATCAATGGTGATTATAGGCAATTCTCAAGTTTCTTTCGTGAACCATA
TGCATTCTGCAACCTGCAACAAACATGCATGTAAATGTGAACAATTTTTC
TCACTTGTATCACATTTTGATGGCTGTCATGATGCTGATTGTAATATATG
CAGTCCTGTTTGGTATAGTTGTGTCACCAATAAACCTCACCCTAAGTTTG
AACGTGTAAAAAGAGGTCTTTTAAGGGATGGAGATTCTGACCAGCCCAGC
TGTGGTAGTTCAGAAACCATGCAACCTTCTTTGAAGCGTTTGAAGGTAGA
AAATCCTCTTTGTCCTAGCTTGACTGAGAATGGTATATGTTGTGCAAAGG
CTCCACTGAAGGTTCAACCATGTTATGCCAAGCTTCCACCCTTGCGGCAG
TTGCCAGAATCTCCTGTATCTAATAATTCTGAGGTTATGGAGGTGAACAT
GGAATTGCTACCAAAGCTTATAGAAGCTTCTATGAGCACTAAAGATATTA
GTTATAATGTTGCAGATAATTTTCCTATATTGCCTACTGAGAATTTGCCG
GGTGCTTCAGAAGTGGTTGTCTGCAGTTATAAATTGGAGGAAACAGATGC
TGTTGGCAGTGAAAAAGAAGGGGGTATGGACTTCAGAAGTGATACCGATA
TTGCAGACAATGTAATAGATCACTCCAACATTTTGGAATCCAATACTTTG
CCCAGCTTCTCTGAAGGACTTGCTGCTGGTTATGAAGAGGAAGAAACAGA
AGCCAGGACTAATTCCAACCAGGCAGAGCTAGCAATAGAGAATGAGCTCA
TTACACAAGAATCAAATTGCGGAAAGGAACTTTCTGCTGGTTGTGAAGAG
GGAGAAACAGAAGCCACAACTAATTCCAACCAGGCAGCTCTAGCAATAGA
GGATGAGCTCATTGCACAGGAATCAAATTGTGGAAAGGAACTTGATGCTG
GTTGTGAAGATGGAGAAACAGAAGCCAAGACTAATTCCAACCTGGCAGAG
CTAGCAATGGAGAATAAGCTCATTGCACCGGAATTGAATTGTGGAAAGGA
AATAGAGTTGGAGAGTCAAACAATAAGGGGTTTGTCCTTAATTGAAAATT
TCACAGCCCAGCAAATAAAGGAACATATATCAAGTCTCAGGCAGTGCATA
GATCAGGATATACCAAAGAAAGAAAGGGGAAAGAGAATAAGCAATGTCTA
CAGTGAGAACTCATGCCAGTTGTGTGGAGCAGATAAGCTTTCACTTGCCC
CAGCACCAATATATTGTTCATCATGTGGTAATCGTATCAGGCGCAGTGCA
AACTATTATATCACACCTGAAGAAAAGGACATCAGAATTTGTCTTTGTAC
CTCATGCTATAAGGTATCTCGGGGGAGGAGCATCGTGTTTTCTGGGATTG
CTCTTTCCAAGGCAAAGCTGGATAAAATTAAGAACGAGGAGGAAGCTGAA
GAATCGTGGGTTCAGTGTGATAAATGTGAAGGCTGGCAACACCAGATATG
TGCCCTCTTTAATGATAAAAATGATATGGAAGGAAAAGCTCAGTTCATCT
GCCCAATATGCTGCCTAAAAGAAATTCAAAGTGGAGAACGTATGCCCCCA
CTGATGAGTACTGTTTTTGGTGCAAAAGATCTCCCGTGTACCATGCTTAG
TGACCACATAGAGCAAAGACTCTTTAGGCGTCTTCAAAAAGAAAGAGAAG
AGAAAGCAAGGGTTACAGGAAAGCGCATTGATGAGGTTCCTGAAGCAGAA
GGTCTTGTTGTTAGAGTGGTCGTATCTGTTGACAAACATGTAAAAGTGAA
GAAGCAGCTTTTAGAAATAGTTCAGAATGAGAACTACCCTGCTGAGTTTC
CGTACAAGTCAAAGGTTATTCTTTTGTTTCAGAAGATTGACGGGGTAGAT
GTATGCCTTTTTAGCATGTATGTCCAGGAGTTTGGCTCAGAATGTGGTCA
CCCAAATCAACGCTGTGTTTATATTGCATATCTTGATTCTGTGAAGTACT
TTAGGCCTGAGACAAAAACTGCAGCTGGAGAAGCTCTTCGAACTGTTGTT
TACCATGAAATATTGATTGGATACCTTGAATACTGCAAGAAACGAGGGTT
TGCAACCTGCTATTTATGGGCCTGTCCACCTTTGAAAGGAGAAGATTATA
TCTTAAACTGCCACCCAGAGATTCAGAAAACGCCAAAGACCGATAAGCTG
CGGCAGTGGTATCAGTTCATGCTACAAAAGGCTGCTAAAGAGAAAGTGGT
GGTTGGTTTGACAAACTTGTATGATCACTTTTTTGTTTCCACTGGGAAAT
ACAACTCCAAGGTGACAGCAGCTCATTTGCCATATTTTGATGGTGACTAC
TGGTCTGGTGCTGCTGAGGATGTGATAAATAATATTGAGAAAGCAAGTTC
AGAAGACCCAAAAAAGATGGGCAAAAGAATAATGTCAAAGAGAACATTGA
AAGCTATGGGACACACAAATCCTTCTGGTGATGCCACTAAGGATATTCTG
CTGATGCAAAAGCTGGGGCAAACTATTTTACCTATTAAGGAGGACTTTAT
CATTGCCCACTTGCAGTTTGTGTGCATACATTGTCATAGAGCTATACTAT
CTGGATGGCGATGGTTTTGCAGCCTGTGTAAAGGCTTTCAGCTATGTGAA
AGGTGCCATGATGCAGAGCAAAATGTCTACAAGGATTGCTCTCACACTTT
ATGTAATGGGGAAAAACACGCACTGTGTAAGATTATGGTGGATGATGTGC
CTTCTGATACTGATGATACAGATGCCAGTATGGATAATGGTTTATTTGGA
AATAGGCATAGTTTTTTGAGCTTCTGTCAGAAGAACAGTCATCAGTTTGA
CACACTTCGTCGGGCCAAGCATTCCTCAATGATGATCCTACATTACCTTC
ACAATTCAACCTTGCTGACTGCTGAGACCACCTGTATTATTTGTTACAAG
GACACACCAATGGACCAGTCCTGGCTATGTGAGATCTGCCCCAATGTTGC
TGTTTGTGCTGCATGTTACCGAAGAGATGGTTGTTCTTTGCATATTCATA
AGTTGATTCTGCATTGTTCTGCAGTTGATTCTGCGACCAAAAATAGAGAG
GCCAAGAAGAAGGAATTACTGAAAATGCGACTGCTGGATGTTTTGCTGCA
TGCCTGTCAATGTCGCTCCCCCTGCTCCTACCCTAATTGTCTTCTCATCA
AAAAGCTATTCTTCCATGCAAAAAAGTGCACTGTCAGGATTTCTGGGGGT
TGTGAGCATTGTAAGAAGATGTGGCTCATATTGAGACTGCACTCCAGAAA
TTGCAAAGACTCTGATTGTGACGTACCACGCTGCAGGGATTTAAAGCAAC
ATGTCAACAGCCGTCTGCAACAATTGGAAGAGGCTGCACATGAAGAACCA
CCGATCGTACCTGATCAGATGGGTCAGAGAATTTAA

protein sequence of Tc04v2_p011400.1

>Tc04v2_p011400.1 ID=Tc04v2_p011400.1|Name=Tc04v2_p011400.1|organism=Theobroma cacao|type=polypeptide|length=1462bp
MNQQTLEYPFKVLNVNPTPSFMPNRMVMPTSGLVQDGNLAIPDALKVLNV
NPTPSFMSNSMMMPTSGLVQDGNLAIPGGLFNQNQLNDVTMDYKEIVDDP
NQFGFLKEFFGDRHKAQTAGYTTMDWNIAPALGMLPVEGEMVLSSGQAST
ITSCYGGDGFSDVGSLESRPPFSKGKLLHLYDGKINMMDHIGWLGNNQSS
DSMVFPHILGGSLAFSEANTQTSQEILQELSEVPDILPGLNSAMASSTII
PYMQSSRPSEAEAKCSFTGKNQSYCPVEAKTAGHFPQLPLENAPADSRNQ
LTWAIQHRVLLAYIQYKKSMVIIGNSQVSFVNHMHSATCNKHACKCEQFF
SLVSHFDGCHDADCNICSPVWYSCVTNKPHPKFERVKRGLLRDGDSDQPS
CGSSETMQPSLKRLKVENPLCPSLTENGICCAKAPLKVQPCYAKLPPLRQ
LPESPVSNNSEVMEVNMELLPKLIEASMSTKDISYNVADNFPILPTENLP
GASEVVVCSYKLEETDAVGSEKEGGMDFRSDTDIADNVIDHSNILESNTL
PSFSEGLAAGYEEEETEARTNSNQAELAIENELITQESNCGKELSAGCEE
GETEATTNSNQAALAIEDELIAQESNCGKELDAGCEDGETEAKTNSNLAE
LAMENKLIAPELNCGKEIELESQTIRGLSLIENFTAQQIKEHISSLRQCI
DQDIPKKERGKRISNVYSENSCQLCGADKLSLAPAPIYCSSCGNRIRRSA
NYYITPEEKDIRICLCTSCYKVSRGRSIVFSGIALSKAKLDKIKNEEEAE
ESWVQCDKCEGWQHQICALFNDKNDMEGKAQFICPICCLKEIQSGERMPP
LMSTVFGAKDLPCTMLSDHIEQRLFRRLQKEREEKARVTGKRIDEVPEAE
GLVVRVVVSVDKHVKVKKQLLEIVQNENYPAEFPYKSKVILLFQKIDGVD
VCLFSMYVQEFGSECGHPNQRCVYIAYLDSVKYFRPETKTAAGEALRTVV
YHEILIGYLEYCKKRGFATCYLWACPPLKGEDYILNCHPEIQKTPKTDKL
RQWYQFMLQKAAKEKVVVGLTNLYDHFFVSTGKYNSKVTAAHLPYFDGDY
WSGAAEDVINNIEKASSEDPKKMGKRIMSKRTLKAMGHTNPSGDATKDIL
LMQKLGQTILPIKEDFIIAHLQFVCIHCHRAILSGWRWFCSLCKGFQLCE
RCHDAEQNVYKDCSHTLCNGEKHALCKIMVDDVPSDTDDTDASMDNGLFG
NRHSFLSFCQKNSHQFDTLRRAKHSSMMILHYLHNSTLLTAETTCIICYK
DTPMDQSWLCEICPNVAVCAACYRRDGCSLHIHKLILHCSAVDSATKNRE
AKKKELLKMRLLDVLLHACQCRSPCSYPNCLLIKKLFFHAKKCTVRISGG
CEHCKKMWLILRLHSRNCKDSDCDVPRCRDLKQHVNSRLQQLEEAAHEEP
PIVPDQMGQRI*