Tc03v2_t020090.4 | Cocoa Genome Hub

Overview


Name	Tc03v2_t020090.4
Unique Name	Tc03v2_t020090.4
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	2787

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 2 ESTs, 4 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 3 samples with support for all annotated introns
Product	histone-lysine N-methyltransferase, H3 lysine-9 specific SUVH6, transcript variant X3
Note	SU(VAR)3-9, putative

Cross References

External references for this mRNA


Database	Accession
GeneID	18606171
Genbank	XM_018118242.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc03v2_g020090	Tc03v2_g020090	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc03v2_p020090.4	Tc03v2_p020090.4	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto183152	auto183152	Theobroma cacao	exon
exon-auto183153	auto183153	Theobroma cacao	exon
exon-auto183154	auto183154	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto183155	auto183155	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc03v2_t020090.4 ID=Tc03v2_t020090.4|Name=Tc03v2_t020090.4|organism=Theobroma cacao|type=mRNA|length=2787bp
ATGGGCGTTTCCGATAATATGCTGCATAAAGAGACATTAAAAGTGGCAAG
TTGTAGTCATTCTGAGGGAAGGCTGGGAAGAGTGTCAACTGAAAATGGTC
ACTTTGCCCCTGCACCCAAGTATAAGCAGCGTAAAGTTTCTGTTGTTCGG
AATTTTCCACCAGGGTGTGGAAGGTTGGCTGCACCAATCGATAGACCAAG
TGAGCAAGCGGTGAAATCCCACCCTGGTGAGAGCAGTTTGGAGAAGACTT
CGGCAAGAAATTATCGTCCTCGTAGAGGAGTCACTGTTGTGAGAAACTTC
CCTCCATTTTGTGGAAGAAATGCTCCACCTCTTAGCGAGGAGGAGCGCAT
GAAATGGCTTACCTCTCTAAAGGACAAAGGTTTCAATCTAGAGAAGTTTG
TAAATGAGGAAAAGCCCTCAGAGAAGACTATATGTACTGATGTGAAACAA
GTGATAGAGGATGTTCAGGATGTCAATGCTCTAGAAGGTAAAATAGAAGG
TAGTGCTCCTACACTCTCTGCAGAAGAAATTCAATCTAAACCTGAAGAGC
TGGCTTCTGAAAAAATGAGGAAGCTATGTGCTTATGAAGCTTCATCCAGG
AATGATATGGATGAGGACAAGGAAGATATGAGAGAAAAGAGCATCAAGTC
TCCTTGCGAAACTTATCCAAATGAATTTGATAGCAAGTCCAAGCAAGTTA
GTGAGACAAGTGATGGATATGTTAGAGGTTTGGAGGAAAATCCAATACAT
GATATTGTAATCTATGCTGAGGACAAGAGTTTTGAGACAAAGCTTTCTGA
TTCACCTGCCTTTGAGGATCAATTGCTGGAGGAGGACTGTGGGAGTCAAG
AAGTTTTATTGGATGGGTCAATTGTGCAAGGCCTCATGGCTTCATCAACT
TGTCCTCTGCCACAAGGGAAAGTGACCTGCAAACGTGACCTGGGGGGTGT
TTCATTTAAAAGAAAAAGAAAGAACAATTTCATATTGCTACCAAGGGCAA
ACCATGCTTTAGTAGCAAATAAGAATGAAGCAGAGAGCCCTGAAGAAACA
TGTATTAAGAAGAATTCTTCTCCCACAAGGCCTTATAAAGGTCTTGGTCA
AGTGGTTATCAGGGACAAGGAAGAATCAATCCAACAGGATGGACTATACA
CAGATGATAATTTTGCTCTGAGATCATACAGTTATGATGTGAGTCTTCCT
CCTTCTTGTCCAAGTAGTGTGTGTCATGATAATGATGCAATTACTACTCG
GAACAAAGTGAGAGAGACATTACGCCTATTCCAAGCCATTTGTCGGAAGC
TTTTACAGGAAGAAGAATCAAAGTTGAATGGAGAAGGAAAGACCTTTAAG
AGGGTGGATATCCAAGCTGCAAAGATTCTCAAAGAGAAAGGGAAATACAT
TAACACAGGCAAACAGATCATTGGACCTGTACCAGGTGTTGAAGTTGGTG
ATGAGTTTCATTATTTTGTGGAGCTCAATATTGTTGGCCTTCATCGCCAA
AGTCAGGGTGGTATAGATTACGTAAAGCAAGGTGATAGGATCATTGCTAC
TAGTGTTATAGCATCAGGGGGCTATGACAATGACTTGGATAACTCAGATA
TCTTGACTTACATGGGTCAGGGAGGGAATGTTATGCAGAAAGGTAAGCAA
CCGGAAGACCAGAAACTTGAAAGAGGAAACCTTGCTTTGGCAAATAGCAT
ATTTGTTAAGAATCCAGTGAGGGTTATTCGCGGTGAGACAAGGTCTTCTG
ATTTGTTAGAAGGTAGGGGTAAAACATATGTTTATGATGGCCTCTATTTG
GTGGAGGAGTGTAAGCAAGAATCAGGACCACATGGTAAGCTTGTCTACAA
ATTTAAGCTGGTCAGAATTCCTGGTCAACCAGAGCTTGCTTGGAAAGTTG
TAAAAAAATCTAATAAATCTAAAGTGTGGGAAGGGCTGTGTGCACATGAT
ATCTCACAAGGGAAGGAGGTAATCCCCATTTGTGCTATAAACACCATAGA
TAGTGAAAAACCTCCACCATTTGTGTATGTACCTCACATGATCTATCCTG
ACTGGTGCCACCCTATTCCTCCCAAAGGTTGTGATTGTATTGATGGATGT
TCAGAATCTGGGAAATGTTCCTGTGCAATGAAGAATGGAGGAGAGATCCC
ATATAACCATAATGGGGCCATTGTTGAAGCAAAGCGCCTTGTCTATGAAT
GTGGTCCTACTTGCAAGTGTCCTGCTTCTTGCTATAATAGAGTGAGCCAG
CGTGGCATAAAATTTCAGCTTGAAATCTTTAAAACAGAATCGAGAGGCTG
GGGTGTTAGATCCCTAAATTCTATCCCTTCCGGAAGTTTCATCTGTGAGT
ATGCTGGAGAGCTCCTCGAAGATAGAGAAGCTGAAGAAAGAACAGGGAAT
GATGAGTATCTGTTTGATATTGGAAACAACTACAGTGAAAGTTCTCTGTG
GGATGGTCTTTCAACCCTAATGCCTGATGTGCATTCAAGTGTTTGCCAAG
TTGTGCAAGACAGTGGTTTTACCATCGATGCAGCACAGCATGGCAATGTA
GGGAGATTCATAAACCATAGTTGTTCACCTAATTTGTATGCACAAAATGT
CCTTTATGATCACGATGACAGGAGAATCCCACATATAATGCTCTTTGCTG
CTGAAAATATTCCTCCCTTGCAGGAGTTGACATACCATTACAATTATATG
ATAGATCAGGTTCGTGATGAGAATGGTAACATAAAGAAGAAATTTTGCTA
TTGTGGTTCTTCAGAGTGCACTGGTAGGCTGTATTGA

protein sequence of Tc03v2_p020090.4

>Tc03v2_p020090.4 ID=Tc03v2_p020090.4|Name=Tc03v2_p020090.4|organism=Theobroma cacao|type=polypeptide|length=929bp
MGVSDNMLHKETLKVASCSHSEGRLGRVSTENGHFAPAPKYKQRKVSVVR
NFPPGCGRLAAPIDRPSEQAVKSHPGESSLEKTSARNYRPRRGVTVVRNF
PPFCGRNAPPLSEEERMKWLTSLKDKGFNLEKFVNEEKPSEKTICTDVKQ
VIEDVQDVNALEGKIEGSAPTLSAEEIQSKPEELASEKMRKLCAYEASSR
NDMDEDKEDMREKSIKSPCETYPNEFDSKSKQVSETSDGYVRGLEENPIH
DIVIYAEDKSFETKLSDSPAFEDQLLEEDCGSQEVLLDGSIVQGLMASST
CPLPQGKVTCKRDLGGVSFKRKRKNNFILLPRANHALVANKNEAESPEET
CIKKNSSPTRPYKGLGQVVIRDKEESIQQDGLYTDDNFALRSYSYDVSLP
PSCPSSVCHDNDAITTRNKVRETLRLFQAICRKLLQEEESKLNGEGKTFK
RVDIQAAKILKEKGKYINTGKQIIGPVPGVEVGDEFHYFVELNIVGLHRQ
SQGGIDYVKQGDRIIATSVIASGGYDNDLDNSDILTYMGQGGNVMQKGKQ
PEDQKLERGNLALANSIFVKNPVRVIRGETRSSDLLEGRGKTYVYDGLYL
VEECKQESGPHGKLVYKFKLVRIPGQPELAWKVVKKSNKSKVWEGLCAHD
ISQGKEVIPICAINTIDSEKPPPFVYVPHMIYPDWCHPIPPKGCDCIDGC
SESGKCSCAMKNGGEIPYNHNGAIVEAKRLVYECGPTCKCPASCYNRVSQ
RGIKFQLEIFKTESRGWGVRSLNSIPSGSFICEYAGELLEDREAEERTGN
DEYLFDIGNNYSESSLWDGLSTLMPDVHSSVCQVVQDSGFTIDAAQHGNV
GRFINHSCSPNLYAQNVLYDHDDRRIPHIMLFAAENIPPLQELTYHYNYM
IDQVRDENGNIKKKFCYCGSSECTGRLY*