Tc02v2_t001120.5 | Cocoa Genome Hub

Overview


Name	Tc02v2_t001120.5
Unique Name	Tc02v2_t001120.5
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	5463

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 9 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 1 sample with support for all annotated introns
Product	uncharacterized LOC18607098, transcript variant X2
Note	Protein MKS1

Cross References

External references for this mRNA


Database	Accession
GeneID	18607098
Genbank	XM_018115282.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc02v2_g001120	Tc02v2_g001120	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc02v2_p001120.5	Tc02v2_p001120.5	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto81122	auto81122	Theobroma cacao	exon
exon-auto81123	auto81123	Theobroma cacao	exon
exon-auto81124	auto81124	Theobroma cacao	exon
exon-auto81125	auto81125	Theobroma cacao	exon
exon-auto81126	auto81126	Theobroma cacao	exon
exon-auto81127	auto81127	Theobroma cacao	exon
exon-auto81128	auto81128	Theobroma cacao	exon
exon-auto81129	auto81129	Theobroma cacao	exon
exon-auto81130	auto81130	Theobroma cacao	exon
exon-auto81131	auto81131	Theobroma cacao	exon
exon-auto81132	auto81132	Theobroma cacao	exon
exon-auto81133	auto81133	Theobroma cacao	exon
exon-auto81134	auto81134	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto81135	auto81135	Theobroma cacao	CDS
CDS-auto81136	auto81136	Theobroma cacao	CDS
CDS-auto81137	auto81137	Theobroma cacao	CDS
CDS-auto81138	auto81138	Theobroma cacao	CDS
CDS-auto81139	auto81139	Theobroma cacao	CDS
CDS-auto81140	auto81140	Theobroma cacao	CDS
CDS-auto81141	auto81141	Theobroma cacao	CDS
CDS-auto81142	auto81142	Theobroma cacao	CDS
CDS-auto81143	auto81143	Theobroma cacao	CDS
CDS-auto81144	auto81144	Theobroma cacao	CDS
CDS-auto81145	auto81145	Theobroma cacao	CDS
CDS-auto81146	auto81146	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc02v2_t001120.5 ID=Tc02v2_t001120.5|Name=Tc02v2_t001120.5|organism=Theobroma cacao|type=mRNA|length=5463bp
ATGGACTCTCAATTTCACGCCGGGGAGCCACCGTCAAAGCGTCAGCTACA
AATCCAAGGTCCACGCCCACCCCCTCTAAAGGTCAGCAAAGACTCCCATA
AAATCAAAAAACCACCTCACCCACCATCCCACGCCGCTGGTCCCGCAGCA
GCAGCAGCAGACCAACGCCGTCCCGAGCCAGTAATCATCTACGCCGTCTC
ACCAAAAGTCATCCACGCTGAAGAATCCGATTTCATGTCTATCGTGCAAC
GCTACACCGGACTTTCATCCGGTACCTTCTCCGGAGACGGCGACGTCTAC
CGGGCGGCGAGGTTGGCAGCGACGGAAAAGGCGAGTTCTAGCTCGAGAGA
GAAAATAGGGGACGTGGGGGTCGCGGGTGAAGGTGCGATGGAAGAGGGTT
TGATTCGAGCACTGCCAGGGATACTTTCTCCGCCGCCGGAGACGTTGCCA
GAGGTGGCGGTGGGATTCTTTTCCCCCGTTCGTACGCCAGGGGGGACGTT
CTTATCGCCGGCGGCGAGGTTGGCAGGGACGACAAAGGGGAATCCTAGCT
GGAGAGAGAAAATAGGGGACGTGGGGGTCGCGGGTGAAGGTGGGATGAAA
GAGGGTTTGATTCGAGCACCGCCAGGGATACTTTCTCCTGCGTCGGAGAC
GTTGCCAGCGGTGGCGGCGGGAACATTCTTTTCGCCCGCCGTAGCAGGGG
GGACGTTCTTATCGCGGGCGTCGGAGGCGAGAATGATGTCGGCAGACATC
ATATATGGTCAATCAAATAGTTGCAGTGTGAAAGATGAGTCAAAGCCTGC
GGGACTTGCAAACATAATGTGTAAGTCCTTGTCTGGCTATAACTTGGAGG
AGCAAAAGCTCACAGTCAGTGATGCTTCCAAGAAAAGTTCTGCAGGTGAG
TTACTACCCACAGAAGTTGAGTTTAAAAAGCCCAAATCCTCGCATTATCT
TGGCGAAAGCCTCCCAAGTAAGGACTCTGACTATGATTTCAAAGAGGAGC
AAGAGCTCAAAGTCAATGAAACCTTCAACAAAAGTTGCAGTGTGAAAGAT
GAGACAAAGCCTGCAGGACTTGCAATCGCAATGTTTAAGTCCTTGTCTGA
CTATAACTTGGAGAAGCAAAAGCTCACAGTCAGCGATGCTTCCAAGAAAA
GTGCTGCAGGTGAGTTACAACCCACAGAAGTTGAGTTTAAAAAGCCCAAA
TCCTCGCATTATCTTGGCGAAAGCCTCCCAAGTAAGGACTCTGACTATGA
TTTCAAGGAGGAGCAAGAGCTCAAAGTCAATGAAACCTTCAACAAAAGTT
GCAGTGTGAAAGATGAGACAAAGCCTGCAGGACTTGCAATCGCAATGTTT
AAGTCCTTGTCTGACTATAACTTGGAGAAGCAAAAGCTCACAGTCAGCGA
TGCTTCCAAGAAAAGTGCTGCAGGTGAGTTACAACCCACAGAAGTTGAGT
TTAAAAAGCCCAAATCCTCGCATTATCTTGGCGAAAGCCTCCCAAGTAAG
GACTCTGACTATGATTTCAAGGAGGAGCAAGAGCTCAAAGTCAATGAAAC
CTTCAACAAAAGTTGCAGTGTGAAAGATGAGACAAAGCCTGCAGGACTTG
CAATCGCAATGTTTAAGTCCTTGTCTGACTATAACTTGGAGAAGCAAAAG
CTCACAGTCAGCGATGCTTCCAAGAAAAGTGCTGCAGGTGAGTCACAACC
CACAGAAGTTGAGTTTAAAAAGCCCAAATCCTCGCATTCTCTTGGCGAAA
GCCTCCCAAGTAAGGACTCTGACTATAATTTCAAGGAGCAGGAGCTCAAA
ATCAATGAGGGCTCCGGCAAAAGGAACGCTAGGCGGAGCTGGACAGTATT
GGTTCACTCTGATATGGTCCTAGGGGAACTTCCTTCTGATGGTTGCAATT
GGAGGAAATATGGACAGAAGGATATTCTTAATGCAAGATTTCCAAGAGAA
TACTACAGGTGCGCACATCGACACACTCAAGGCTGTTTTGCTACAAAGGA
AGTCCAAAGAGAGGATGAAGATCCAATGTTCATCACTGCTACTTACAAAG
GAATGCACACTTGCACACTAGCCCCAGATTTGATGCCTCCAGGACCACCT
GAGATACTAGCTCCTTTGGATACTGTACTTGGCGCCGATGGAAATGACAA
AAAGGATTCACAATCTAATCTTCAGTCAAGTGTACACAGTCCTGACAATC
AAACTTGCATTTCGTCAACCAAGCTAACAAGTGAGCTTCCAAATTTAGGG
CTCAACCTGAATGTGTTTCCTGAGAAATCATTTAAGTCATATCCAACGTG
GAAAAACTTTTATGAAAATGAAGTGAGGAAGAATTGGAAAGTGCTGAACA
GGAAGAAGGATGTGCTACTCTTACTTTCATCTTATCCTATGATTATGATT
GACAAATCTGACACAGATAAATGGATTATTGATGTATTGGCAACCATGAG
ACATGTGAAATCAACAGAAAAGATTTTATTTGGTGTAGGGGTAGCGAAAC
ATTGGCCAGGAATGACTACGCTGCAGGAACTTTCTGGACGCTTGCAGAAG
TTGCTGGATGTTCCCTTGATGAATGATATTGAGGGAGTTTTACCGGTAGA
CTTGGTTGAGAACCTATATAGGACTACAGAAGCTGATTTAAGACCCCTGT
TGGAAGTGGAACAGAATATAATTAGCGGAAAGACATCAAAATCTAGAGGT
TCAGCAAGTAACAGTGAAGGGGCAGCAATGGAAGCAGAAAAAGAATTGCA
GCCAATGCCTGCAAAATGTAAAACTCTGGTAGAAGATACTGAGTTGCCAG
CAAAAGGAACACTGAATGTACCAGAAGAAATATTTGACTTGGCAATTTAT
TTAGCTGTTCGTCAGATCTTAAAATGTATAAACAGGGGATATATCTGGTG
TATTACTATCAGTGGAAGAGATAAGAAAAGGGTGCTAGGAGCAGTAAAGC
AACACCAAGATATAGTTTCCGAGTTTGGATATATCATTGTATTCACTGTG
TCAGAAGATCAAAGTGGGGCAAATGTTCACGGTGTCTTTCAACTGCAGAA
GGGTTTTTGGCTAGGTGGATGCTTTGATTCTGTTGACCTTACACATGAAT
ATTTTGACAACTTGTGCTCCCCAGGAATCTTATTGCTTACAGAGGATGAT
TACGATAAGAACATGAACTTGGATCAGTCTACACTCCCACTTTTGATAAA
CCTTAACAAGTTGGTTGACCATAAACATAGCGATTCAAGGTTCATAATCT
TTACTTCTAAAATGGCAACAGACATGGAGATAAGAATGGAGGATCATTTG
TTGTCATGGAAATTGTTTTGTAGGATTGTGGGTGAAGGTTTGCTTTCTCC
TAGTATCCAACAGATAGCAGCAAGTTTGGTGAAAGAATACCGTGGCAATC
TACTCGCCATCATTCTAACGGCCAGGTCCTTGGAGAAAGTTACTGATGAT
GTCAACTTGTGGGAACTTGCTGTTAAAAGATTGACCATGCTACCTCCATC
TCAAATAGAAGATATAGACAATGTCCTGATTAATGCATTAACATTCATTT
GGGAACGTATGAACAATAAAACAAGACATTGCATTAAGTTTTTCACGTGG
TATCCCAAGGGACAGAAAATTAACAGAGTCTCACTAATACAACATTGGAT
CCAAGATCGTCTGGTTGATACCCATGATGAAGGTACCAATATTATCCAAA
ATCTTGTTGATACATCCCTGCTTAATATTGTGGAGTTAAATGGGGTCCAA
CTGCGAAGAGAGATCTATGATGTATTAGTAAACCCACTAATTCTTCAAAT
GCATCCATTTTATCTTTTGCTAGGCAGGGCAAGATTGATTAAACCACCAG
AAGAAGAGGAATGGGATGCCAAAGTGATCAATTTGATGGATAATAAATTA
TCTGACCTGCCAGAATCTCCAAGGTCACCCTCACTAATTGCATTGTACCT
TCAGCGTAACTTGGATCTCATGACTATCCCATCTTGTTTCTTCAAGCACA
TGCCTTTGCTTCAAATCCTAGACTTATCACACACCAGCATCAAATCTTTG
CCAGAGTCACTTTCTAGTTTGGTTAACCTTCGAGAACTCCTTTTGAAAGG
CTGTGAACTCTTCATACGACTCCCTAGCCATGTTGGAGAACTGAAGAATC
TTGAGAAGCTTGACCTTGATGAAACTCAGATTATTGATCTCCCAGCAGAG
ATTGGACAACTTTCCAAATTAAAAATTTTGAGGGTCTCATTCTATGGATA
TATGAACTGTAGCAAAACAAGGTTGCGGCAAGATACAATAATTCCCCCTG
GAACAATATCAGGTCTCTCTGAATTAACTGAATTAAGCATTGATGTTGAT
CCGGATGATGAACGCTGGAATGCAACGGTGAAAGATATTATTGAGGAAGC
TTGCAACTTGAAAACTTTAAGACAGCTTAATTTGTACCTGCCAAACATCG
AAATATTGTGGAAACGCAGAACCGGTAGCGCATCATTGCTCCATTACCCT
TTGCCACGTTTTAGATTTACTGTCGGTTATCACAAGCGGCAGGTCATATC
TCGAGTACCGGAAGAAGTAGAAGCTCACTTCAATAAAAGCAACAAATGCT
TGAAGTTTGTCAAAGGCAATGATATCCCAGCTGAAATGAAAAAGGTTCTG
AACCACAGCACAGCTTTTTTCCTGGAAGGTCATGCTACCGCTAGGAGTTT
GTCTGATTTCGGAATTGAGAATACCAGGCTGCTAAAATGTTGCTTATTGA
CAGAATGTAATGGAGTCAAAACCATCATTGATTTGTCACAAGGTGGTGGA
CACTCACAAGTTTACACAAGAGGAAAAGGGAAGAGCGAGTCACTGAAGTT
TCCTGAAGAACAAACTGATGCACTTGGAAATCTACAAGACTTGAATATAT
ATTACATGAAGAATTTAGAGAGCATTTGGAAGGGGCCTGTTCATAAGCAC
TGCCTAGCTAGCCTGAAGTTCCTTGCACTTCATAAATGCCCCAGATTGAG
TACCATTTTCTCACTAGATTTGGTTGCTAATCTTGACAATTTAGAAGAGC
TCATTGTTGAACACTGCCCTCAACTGACCAGTCTTGTGAGCCCGACGGGT
CATGTGTCCAGTAACTCAACACCACAACCAAATTGCTTTTTTCCTAGCTT
GAAAAGAATATCACTGCTTTACGTGCCAAATCTTGTTAGCATTTCTAGTG
GTTTGTGGATTGCTCCAGAACTGGAAAAAGTAGGCTTTTACAATTGCCCA
AAGCTTAAGAGTCTTTCCGCGATGGAAATGTCAAGTGACCATTTGACGAG
GATCAAAGGAGAAAGTCACTGGTGGGAAGCATTGGAGTGGAAAAACTCAG
AGTGGGGGAACCCGCTGGATTATCTGCAGAGTATCTTTTCCCCACTTATT
AAGGAGAGAGATGTGAAGGCGCAATTGGCAGAAGAAGGAATTATGCACCA
TGCTTCAACTTAA

protein sequence of Tc02v2_p001120.5

>Tc02v2_p001120.5 ID=Tc02v2_p001120.5|Name=Tc02v2_p001120.5|organism=Theobroma cacao|type=polypeptide|length=1821bp
MDSQFHAGEPPSKRQLQIQGPRPPPLKVSKDSHKIKKPPHPPSHAAGPAA
AAADQRRPEPVIIYAVSPKVIHAEESDFMSIVQRYTGLSSGTFSGDGDVY
RAARLAATEKASSSSREKIGDVGVAGEGAMEEGLIRALPGILSPPPETLP
EVAVGFFSPVRTPGGTFLSPAARLAGTTKGNPSWREKIGDVGVAGEGGMK
EGLIRAPPGILSPASETLPAVAAGTFFSPAVAGGTFLSRASEARMMSADI
IYGQSNSCSVKDESKPAGLANIMCKSLSGYNLEEQKLTVSDASKKSSAGE
LLPTEVEFKKPKSSHYLGESLPSKDSDYDFKEEQELKVNETFNKSCSVKD
ETKPAGLAIAMFKSLSDYNLEKQKLTVSDASKKSAAGELQPTEVEFKKPK
SSHYLGESLPSKDSDYDFKEEQELKVNETFNKSCSVKDETKPAGLAIAMF
KSLSDYNLEKQKLTVSDASKKSAAGELQPTEVEFKKPKSSHYLGESLPSK
DSDYDFKEEQELKVNETFNKSCSVKDETKPAGLAIAMFKSLSDYNLEKQK
LTVSDASKKSAAGESQPTEVEFKKPKSSHSLGESLPSKDSDYNFKEQELK
INEGSGKRNARRSWTVLVHSDMVLGELPSDGCNWRKYGQKDILNARFPRE
YYRCAHRHTQGCFATKEVQREDEDPMFITATYKGMHTCTLAPDLMPPGPP
EILAPLDTVLGADGNDKKDSQSNLQSSVHSPDNQTCISSTKLTSELPNLG
LNLNVFPEKSFKSYPTWKNFYENEVRKNWKVLNRKKDVLLLLSSYPMIMI
DKSDTDKWIIDVLATMRHVKSTEKILFGVGVAKHWPGMTTLQELSGRLQK
LLDVPLMNDIEGVLPVDLVENLYRTTEADLRPLLEVEQNIISGKTSKSRG
SASNSEGAAMEAEKELQPMPAKCKTLVEDTELPAKGTLNVPEEIFDLAIY
LAVRQILKCINRGYIWCITISGRDKKRVLGAVKQHQDIVSEFGYIIVFTV
SEDQSGANVHGVFQLQKGFWLGGCFDSVDLTHEYFDNLCSPGILLLTEDD
YDKNMNLDQSTLPLLINLNKLVDHKHSDSRFIIFTSKMATDMEIRMEDHL
LSWKLFCRIVGEGLLSPSIQQIAASLVKEYRGNLLAIILTARSLEKVTDD
VNLWELAVKRLTMLPPSQIEDIDNVLINALTFIWERMNNKTRHCIKFFTW
YPKGQKINRVSLIQHWIQDRLVDTHDEGTNIIQNLVDTSLLNIVELNGVQ
LRREIYDVLVNPLILQMHPFYLLLGRARLIKPPEEEEWDAKVINLMDNKL
SDLPESPRSPSLIALYLQRNLDLMTIPSCFFKHMPLLQILDLSHTSIKSL
PESLSSLVNLRELLLKGCELFIRLPSHVGELKNLEKLDLDETQIIDLPAE
IGQLSKLKILRVSFYGYMNCSKTRLRQDTIIPPGTISGLSELTELSIDVD
PDDERWNATVKDIIEEACNLKTLRQLNLYLPNIEILWKRRTGSASLLHYP
LPRFRFTVGYHKRQVISRVPEEVEAHFNKSNKCLKFVKGNDIPAEMKKVL
NHSTAFFLEGHATARSLSDFGIENTRLLKCCLLTECNGVKTIIDLSQGGG
HSQVYTRGKGKSESLKFPEEQTDALGNLQDLNIYYMKNLESIWKGPVHKH
CLASLKFLALHKCPRLSTIFSLDLVANLDNLEELIVEHCPQLTSLVSPTG
HVSSNSTPQPNCFFPSLKRISLLYVPNLVSISSGLWIAPELEKVGFYNCP
KLKSLSAMEMSSDHLTRIKGESHWWEALEWKNSEWGNPLDYLQSIFSPLI
KERDVKAQLAEEGIMHHAST*