Tc08v2_t008160.4 | Cocoa Genome Hub

Overview


Name	Tc08v2_t008160.4
Unique Name	Tc08v2_t008160.4
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3627

Properties


Property Name	Value
Note	Set domain protein, putative isoform 1
Model evidence	Supporting evidence includes similarity to: 1 EST, 2 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 5 samples with support for all annotated introns
Product	histone-lysine N-methyltransferase ATXR7, transcript variant X4

Cross References

External references for this mRNA


Database	Accession
GeneID	18592056
Genbank	XM_018126069.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc08v2_g008160	Tc08v2_g008160	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc08v2_p008160.4	Tc08v2_p008160.4	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto400621	auto400621	Theobroma cacao	exon
exon-auto400622	auto400622	Theobroma cacao	exon
exon-auto400623	auto400623	Theobroma cacao	exon
exon-auto400624	auto400624	Theobroma cacao	exon
exon-auto400625	auto400625	Theobroma cacao	exon
exon-auto400626	auto400626	Theobroma cacao	exon
exon-auto400627	auto400627	Theobroma cacao	exon
exon-auto400628	auto400628	Theobroma cacao	exon
exon-auto400629	auto400629	Theobroma cacao	exon
exon-auto400630	auto400630	Theobroma cacao	exon
exon-auto400631	auto400631	Theobroma cacao	exon
exon-auto400632	auto400632	Theobroma cacao	exon
exon-auto400633	auto400633	Theobroma cacao	exon
exon-auto400634	auto400634	Theobroma cacao	exon
exon-auto400635	auto400635	Theobroma cacao	exon
exon-auto400636	auto400636	Theobroma cacao	exon
exon-auto400637	auto400637	Theobroma cacao	exon
exon-auto400638	auto400638	Theobroma cacao	exon
exon-auto400639	auto400639	Theobroma cacao	exon
exon-auto400640	auto400640	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto400641	auto400641	Theobroma cacao	CDS
CDS-auto400642	auto400642	Theobroma cacao	CDS
CDS-auto400643	auto400643	Theobroma cacao	CDS
CDS-auto400644	auto400644	Theobroma cacao	CDS
CDS-auto400645	auto400645	Theobroma cacao	CDS
CDS-auto400646	auto400646	Theobroma cacao	CDS
CDS-auto400647	auto400647	Theobroma cacao	CDS
CDS-auto400648	auto400648	Theobroma cacao	CDS
CDS-auto400649	auto400649	Theobroma cacao	CDS
CDS-auto400650	auto400650	Theobroma cacao	CDS
CDS-auto400651	auto400651	Theobroma cacao	CDS
CDS-auto400652	auto400652	Theobroma cacao	CDS
CDS-auto400653	auto400653	Theobroma cacao	CDS
CDS-auto400654	auto400654	Theobroma cacao	CDS
CDS-auto400655	auto400655	Theobroma cacao	CDS
CDS-auto400656	auto400656	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc08v2_t008160.4 ID=Tc08v2_t008160.4|Name=Tc08v2_t008160.4|organism=Theobroma cacao|type=mRNA|length=3627bp
ATGGTTTCCTCAACATCCCCCTTTGACGAATATGATCACGTTCACGATTA
CCCTTTCTTTTCCAGAAAGCGGCTTAAAGTTTCAGATCGCAGATCAAATA
TCTATACAGGCCTCTCTCCTGATTCTGCATCTTCGATTTGCGGTGATGAA
CGATCCGCAACGGAGATGAGTTGCCAATCTAATGGCAATAGCAGTGGTGT
TCCTCAATCTTGTAATGACGGTGGAGGTTCATGCCAAGACAAGAGTTACT
CCAGCTATGCACCGTCTTCTTTTGCGAGTGGATGGATGTATGTAAACGAA
CATGGACAGATGTGTGGCCCTTACATCCAGCAGCAATTATACGAGGGTTT
ATCTACTGGTTTCCTGCCTGATGAGCTCCCTGTTTATCCTGTAGTCAATG
GGACTGTGAGTAATCCTGTTCCCTTAAAATACTTCAGGCAGTTCCCTGGT
CATGTCGCAACTGGATTTGTGTATCTCAGTTCAACCACAGCTTCCAATTG
TTTGAAGTCTTCCCATACAAATTTCCAGCACACCCTTTCCCAATCACAAA
TTAACCGCAATGGTTTTGATGCATCCAATGACCTCATTTCAAGCTCTCTT
TTGCAGTCAGGTGAAGATGCATGTTGGTTGTATGAGGATGATAAGAGTAC
GAAACATGGGCCTCATTCCCTTTTACAACTATATTCTTGGCATCGCTATG
GGTATCTTGCAGATTCTGTTATGATACATCATGCTGAAAACAGGTTTCGC
CCCATTAAGTTGCTGTCTGTTTTAAATGCTTGGAAAGGTAGTCAAGCTTA
TGCTGCTGAAAATGAACGGGACTTATCAGTGAACTTCATATCTGATATTT
CTGAAGAAGTTTCTTCTCAGCTCCATTCTGGGATTATGAAAGCAGCTCGT
AGAGTTGTGCTAGATGAAATAATCAGCAATATGATCTCAGAGTTTGTTAC
TGCAAAAAAATCTCAGAGACATCTAATGGTTGAATCATTCAACCAGGATG
CTAAAAGGTTTCCTGATGGAAAAAGGATTGAAAATGCCCCCGAAATAAAA
ATGCAGTGTATTCCCATGTTTGAGACGGCAGCCTCCCACAATGTATCTGA
CCAGCCATGCATTCAAGAATCTACATGTTCTCCTGCAAGTATAAAATCTG
TTGGAAGCATTGAAAATTTTTGGGGTTCTTATACAGTTGTTTGTAAGATG
CTTTTTGACTACTGCATGCAAGTTATGTGGAATGCTGTCTTTTATGACAG
TATAGCCGAGTATTCGTCTTCCTGGAGAAGGGGAAAACTTTGGTTTGGTC
ACCCTAATGTTATGCTGTCTGCTACTGACTCCAGGGATCATGGCAACGAG
ACTGAAAAAGTAACAGATAAACCTCTCTTATCTGGGATGGAATTGATTGC
TCATGACGTTGATTGTCCACCTGGTTTTGAGCTGGCAACAGTTGCTGGAG
TTGATTCTGCAGAAAAGTCATCTAAATCTTCATATGTTGTGCAGCAAATT
TTATCCAAACAGAAAACCCGATTGTGCAATAATGGCCTGTATGATGACAT
GGAATGCATCCTTGAAGGTGTTGAAAATGAGCTCCATTTATCTGTGAAGG
TGTTTATGGCCAAGTATGTTGACAATTTTGTTAAAAGTGAAGCAAGAAGA
GTGATTGGTTTGGAAAATGATGACAAATCGAAGGAAAATCTTGATGATGA
AGAAGCAGAGAAATCAGTTAATTTTTCAATAGATGATGAATTGAAAGAAT
TACAAAAGTTGCAAGATGCTGTTGGATCTTCCAGTCAATGCCATCTTGCT
TTAGAGTTTGATACTTTAGACATTTGTGGAGAGAAAAGGGTCAGTTTAAG
CAGAATGTCTGATTTATCTGGCAATCTACAGAATCCATTACAATCTTGGA
CACCCATTTGTCAGTCTGTGTCTGAAAATTTGTATGTTACAAGGCAGGAA
ACTTTCATGGCAGGTGCATTTAAGAGTTTGTTTTCACATTTAGGGGACGT
AATTGATGAACTAGAAGTTGATGAGCCACCACCTCCTGGACTTGAGGGTA
ATGCTGGGACGCTTGTTCCATCACACCTTTGTAAGTTTCGACCTTCAAGG
TCAGATGAGCGTAGCCCTAAGATTGGAGAATATGTTGCCGTGGCAATGTG
TCGGCAGAAGCTCCATGAGGATGTACTAAGAGAGTGGAAATCATCTTTTA
TTGATGCTACTCTTTATCAGTTTCTTACATCATGGCGTAGTTTGAAGAAA
CGCTGTAAGGCTGATAGCAAAGAGGAAAGGGCATTTAGTGTAGGAAGGGA
AATTCTCGCTGATTCTTCTGCCATAGGAGATAAGCTCAGGGAGAGGTCAA
AGAAGTCTCAGAGTTCAGGCTCCTCAGAAGTATCTTTAGTTACTGGTAAA
TATACATATTACCGCAAGAAAAAGTTGGTTCGTAAGAAGATAGGATCTAC
TCAGTCCACTATTGTCAATGGGTCACAGAATCATCCTGTTGAAAGGCCTC
GGAAAAAAGAGGCTTCCAGAAATTTGTTGGATCATGCAGATCCAGAACCA
ACTGCGGCCACTTCTAAAAAGAGTGCAGGTGGTCGCAAAAAAACCAAGGT
TACCCTTGCTGTTCAAAAAAATTTGGTCGGAGAAGGTGCGGTTCAAGTCT
CCAGGGAGAGAGCATCAACCTCTCAGAATTGTGATGTTAAGAAGGTTGTT
GGCAGGACTAACCATATTGTTGGAAGTGAAGTAGAGCTCACTAATGATTC
CCACAAGAAGACACTAAAAGCTCCCAAGGTATCAAGGGTAAAAAGGAAGC
AATTAGATAATGATGAGCCTCCATTGCTTCCAACCAAGGTACAGAAAGTG
GCAAATTCTGCTAGCAAGCATCCTTCTTCTAGAGGGAATGCAGATCGAAA
TACCCATTCAATTAGATCCAGGACAGCAAATTCCTGTCCCAGATCTGATG
GATGTGCGCGTTCTTCAATTAATGGCTGGGAGTGGCATAAATGGTCACTC
AATGCAAGTCCTGCTGAAAGAGCTCGTGTTAGAGGAATTCAGTGTACACA
CATGAAATATTCAGGCTCTGAGGTTAATAATATGATGCAGTTGTCAAACG
GTAAAGGTCTTTCTGCAAGAACAAACAGAGTGAAGCTGCGCAATCTTCTT
GCTGCTGCAGAGGGTGCTGATCTCTTAAAAGCAACTCAGTTGAAGGCAAG
GAAAAAGCGTCTACGTTTTCAGCGAAGCAAGATTCACGATTGGGGTCTCG
TTGCGCTTGAGCCAATTGAGGCTGAGGATTTTGTCATTGAATATGTTGGA
GAGTTGATTCGTCCCCGGATATCTGATATACGTGAACACTATTATGAGAA
GATGGGAATTGGTAGCAGTTATCTGTTTAGGCTTGATGATGGATACGTGG
TTGATGCTACAAAGCGTGGTGGGATTGCTAGATTTATAAATCATTCTTGT
GAGCCTAACTGTTACACAAAAGTTATTAGTGTTGAGGGCCAGAAGAAGAT
TTTCATCTATGCAAAACGGCACATAGCAGCTGGTGAAGAAATTACTTACA
ACTACAAGTTCCCTTTGGAGGAGAAAAAAATTCCTTGCAACTGTGGTTCA
AAGAAGTGTCGTGGATCTTTAAACTAG

protein sequence of Tc08v2_p008160.4

>Tc08v2_p008160.4 ID=Tc08v2_p008160.4|Name=Tc08v2_p008160.4|organism=Theobroma cacao|type=polypeptide|length=1209bp
MVSSTSPFDEYDHVHDYPFFSRKRLKVSDRRSNIYTGLSPDSASSICGDE
RSATEMSCQSNGNSSGVPQSCNDGGGSCQDKSYSSYAPSSFASGWMYVNE
HGQMCGPYIQQQLYEGLSTGFLPDELPVYPVVNGTVSNPVPLKYFRQFPG
HVATGFVYLSSTTASNCLKSSHTNFQHTLSQSQINRNGFDASNDLISSSL
LQSGEDACWLYEDDKSTKHGPHSLLQLYSWHRYGYLADSVMIHHAENRFR
PIKLLSVLNAWKGSQAYAAENERDLSVNFISDISEEVSSQLHSGIMKAAR
RVVLDEIISNMISEFVTAKKSQRHLMVESFNQDAKRFPDGKRIENAPEIK
MQCIPMFETAASHNVSDQPCIQESTCSPASIKSVGSIENFWGSYTVVCKM
LFDYCMQVMWNAVFYDSIAEYSSSWRRGKLWFGHPNVMLSATDSRDHGNE
TEKVTDKPLLSGMELIAHDVDCPPGFELATVAGVDSAEKSSKSSYVVQQI
LSKQKTRLCNNGLYDDMECILEGVENELHLSVKVFMAKYVDNFVKSEARR
VIGLENDDKSKENLDDEEAEKSVNFSIDDELKELQKLQDAVGSSSQCHLA
LEFDTLDICGEKRVSLSRMSDLSGNLQNPLQSWTPICQSVSENLYVTRQE
TFMAGAFKSLFSHLGDVIDELEVDEPPPPGLEGNAGTLVPSHLCKFRPSR
SDERSPKIGEYVAVAMCRQKLHEDVLREWKSSFIDATLYQFLTSWRSLKK
RCKADSKEERAFSVGREILADSSAIGDKLRERSKKSQSSGSSEVSLVTGK
YTYYRKKKLVRKKIGSTQSTIVNGSQNHPVERPRKKEASRNLLDHADPEP
TAATSKKSAGGRKKTKVTLAVQKNLVGEGAVQVSRERASTSQNCDVKKVV
GRTNHIVGSEVELTNDSHKKTLKAPKVSRVKRKQLDNDEPPLLPTKVQKV
ANSASKHPSSRGNADRNTHSIRSRTANSCPRSDGCARSSINGWEWHKWSL
NASPAERARVRGIQCTHMKYSGSEVNNMMQLSNGKGLSARTNRVKLRNLL
AAAEGADLLKATQLKARKKRLRFQRSKIHDWGLVALEPIEAEDFVIEYVG
ELIRPRISDIREHYYEKMGIGSSYLFRLDDGYVVDATKRGGIARFINHSC
EPNCYTKVISVEGQKKIFIYAKRHIAAGEEITYNYKFPLEEKKIPCNCGS
KKCRGSLN*