Tc02v2_t001130.4 | Cocoa Genome Hub

Overview


Name	Tc02v2_t001130.4
Unique Name	Tc02v2_t001130.4
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	4410

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 4 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 2 samples with support for all annotated introns
Product	uncharacterized LOC18607098, transcript variant X9
Note	Uncharacterized protein

Cross References

External references for this mRNA


Database	Accession
GeneID	18607098
Genbank	XM_018115289.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc02v2_g001120	Tc02v2_g001120	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc02v2_p001130.4	Tc02v2_p001130.4	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto81246	auto81246	Theobroma cacao	exon
exon-auto81247	auto81247	Theobroma cacao	exon
exon-auto81248	auto81248	Theobroma cacao	exon
exon-auto81249	auto81249	Theobroma cacao	exon
exon-auto81250	auto81250	Theobroma cacao	exon
exon-auto81251	auto81251	Theobroma cacao	exon
exon-auto81252	auto81252	Theobroma cacao	exon
exon-auto81253	auto81253	Theobroma cacao	exon
exon-auto81254	auto81254	Theobroma cacao	exon
exon-auto81255	auto81255	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto81256	auto81256	Theobroma cacao	CDS
CDS-auto81257	auto81257	Theobroma cacao	CDS
CDS-auto81258	auto81258	Theobroma cacao	CDS
CDS-auto81259	auto81259	Theobroma cacao	CDS
CDS-auto81260	auto81260	Theobroma cacao	CDS
CDS-auto81261	auto81261	Theobroma cacao	CDS
CDS-auto81262	auto81262	Theobroma cacao	CDS
CDS-auto81263	auto81263	Theobroma cacao	CDS
CDS-auto81264	auto81264	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc02v2_t001130.4 ID=Tc02v2_t001130.4|Name=Tc02v2_t001130.4|organism=Theobroma cacao|type=mRNA|length=4410bp
ATGGAGAGCTGGGAACGTAAGAATGTTAGAAATGAACTAAGACAAGGGAG
GAAGCTAGCAAAGCAGCTCCAAGCAAATCTCAAACGGTCATCTTCCGAAG
AAAATCCTGAGTTAGTCCAAAAGATCGTATCGTCCTTTGAAAAGGCACTT
TCAATGCTTAACTGCAGCACCTCCTCTATGGCAGCCAAGCTGCAGCCCAT
AGCTCACAGCTCGCTTGCTCGTGATGGAAGTCACCAGAGTAAGGACCCTG
ACCATGATATCAAGGAGCAAGACTTCAAAGTTAAAGATTTCTTCATGAAA
AGAGAAGTAACTGAGTCACAGCCTAAAGGACTTGCAACTGAAATGTTTAA
ATTCCCGCCTCCTTTCAGTGGAAGCTTCTCAAGTGCGGGAAATTTGGAAG
CCTTTGACGGTAAGGCAGCCGAATTAAAGCCAACAATAATTGGGACCGAA
TTTGACCATGATTTCATGGAGGAGCATGAGCTCAAAGTCAATGAAACCTT
CAATAAAAGTTGCAGTGTGAAAGATGAGTCAAAGCCTGCAGGACATGCAA
AAGTAATGTTTAAGTCCTTGTCTGACTATAACTTGGAGAAGAAAAAGCAC
ACCGTCGGCGATGCTTCCAAGAAAAGTGCTGCAGGTGAGTCACAACCCAC
AGAAGTTGAGTTTAAAAAGCCCAAATCCTCGCATTCTCTTGGCGAAAGCC
TCCCAAGTAAGGACTCTGACTATAATTTCAAGGAGCAGGAGCTCAAAATC
AATGAGGGCTCCGGCAAAAGGAACGCTAGGCGGAGCTGGACAGTATTGGT
TCACTCTGATATGGTCCTAGGGGAACTTCCTTCTGATGGTTGCAATTGGA
GGAAATATGGACAGAAGGATATTCTTAATGCAAGATTTCCAAGAGAATAC
TACAGGTGCGCACATCGACACACTCAAGGCTGTTTTGCTACAAAGGAAGT
CCAAAGAGAGGATGAAGATCCAATGTTCATCACTGCTACTTACAAAGGAA
TGCACACTTGCACACTAGCCCCAGATTTGATGCCTCCAGGACCACCTGAG
ATACTAGCTCCTTTGGATACTGTACTTGGCGCCGATGGAAATGACAAAAA
GGATTCACAATCTAATCTTCAGTCAAGTGTACACAGTCCTGACAATCAAA
CTTGCATTTCGTCAACCAAGCTAACAAGTGAGCTTCCAAATTTAGGGCTC
AACCTGAATGTGTTTCCTGAGAAATCATTTAAGTCATATCCAACGTGGAA
AAACTTTTATGAAAATGAAGTGAGGAAGAATTGGAAAGTGCTGAACAGGA
AGAAGGATGTGCTACTCTTACTTTCATCTTATCCTATGATTATGATTGAC
AAATCTGACACAGATAAATGGATTATTGATGTATTGGCAACCATGAGACA
TGTGAAATCAACAGAAAAGATTTTATTTGGTGTAGGGGTAGCGAAACATT
GGCCAGGAATGACTACGCTGCAGGAACTTTCTGGACGCTTGCAGAAGTTG
CTGGATGTTCCCTTGATGAATGATATTGAGGGAGTTTTACCGGTAGACTT
GGTTGAGAACCTATATAGGACTACAGAAGCTGATTTAAGACCCCTGTTGG
AAGTGGAACAGAATATAATTAGCGGAAAGACATCAAAATCTAGAGGTTCA
GCAAGTAACAGTGAAGGGGCAGCAATGGAAGCAGAAAAAGAATTGCAGCC
AATGCCTGCAAAATGTAAAACTCTGGTAGAAGATACTGAGTTGCCAGCAA
AAGGAACACTGAATGTACCAGAAGAAATATTTGACTTGGCAATTTATTTA
GCTGTTCGTCAGATCTTAAAATGTATAAACAGGGGATATATCTGGTGTAT
TACTATCAGTGGAAGAGATAAGAAAAGGGTGCTAGGAGCAGTAAAGCAAC
ACCAAGATATAGTTTCCGAGTTTGGATATATCATTGTATTCACTGTGTCA
GAAGATCAAAGTGGGGCAAATGTTCACGGTGTCTTTCAACTGCAGAAGGG
TTTTTGGCTAGGTGGATGCTTTGATTCTGTTGACCTTACACATGAATATT
TTGACAACTTGTGCTCCCCAGGAATCTTATTGCTTACAGAGGATGATTAC
GATAAGAACATGAACTTGGATCAGTCTACACTCCCACTTTTGATAAACCT
TAACAAGTTGGTTGACCATAAACATAGCGATTCAAGGTTCATAATCTTTA
CTTCTAAAATGGCAACAGACATGGAGATAAGAATGGAGGATCATTTGTTG
TCATGGAAATTGTTTTGTAGGATTGTGGGTGAAGGTTTGCTTTCTCCTAG
TATCCAACAGATAGCAGCAAGTTTGGTGAAAGAATACCGTGGCAATCTAC
TCGCCATCATTCTAACGGCCAGGTCCTTGGAGAAAGTTACTGATGATGTC
AACTTGTGGGAACTTGCTGTTAAAAGATTGACCATGCTACCTCCATCTCA
AATAGAAGATATAGACAATGTCCTGATTAATGCATTAACATTCATTTGGG
AACGTATGAACAATAAAACAAGACATTGCATTAAGTTTTTCACGTGGTAT
CCCAAGGGACAGAAAATTAACAGAGTCTCACTAATACAACATTGGATCCA
AGATCGTCTGGTTGATACCCATGATGAAGGTACCAATATTATCCAAAATC
TTGTTGATACATCCCTGCTTAATATTGTGGAGTTAAATGGGGTCCAACTG
CGAAGAGAGATCTATGATGTATTAGTAAACCCACTAATTCTTCAAATGCA
TCCATTTTATCTTTTGCTAGGCAGGGCAAGATTGATTAAACCACCAGAAG
AAGAGGAATGGGATGCCAAAGTGATCAATTTGATGGATAATAAATTATCT
GACCTGCCAGAATCTCCAAGGTCACCCTCACTAATTGCATTGTACCTTCA
GCGTAACTTGGATCTCATGACTATCCCATCTTGTTTCTTCAAGCACATGC
CTTTGCTTCAAATCCTAGACTTATCACACACCAGCATCAAATCTTTGCCA
GAGTCACTTTCTAGTTTGGTTAACCTTCGAGAACTCCTTTTGAAAGGCTG
TGAACTCTTCATACGACTCCCTAGCCATGTTGGAGAACTGAAGAATCTTG
AGAAGCTTGACCTTGATGAAACTCAGATTATTGATCTCCCAGCAGAGATT
GGACAACTTTCCAAATTAAAAATTTTGAGGGTCTCATTCTATGGATATAT
GAACTGTAGCAAAACAAGGTTGCGGCAAGATACAATAATTCCCCCTGGAA
CAATATCAGGTCTCTCTGAATTAACTGAATTAAGCATTGATGTTGATCCG
GATGATGAACGCTGGAATGCAACGGTGAAAGATATTATTGAGGAAGCTTG
CAACTTGAAAACTTTAAGACAGCTTAATTTGTACCTGCCAAACATCGAAA
TATTGTGGAAACGCAGAACCGGTAGCGCATCATTGCTCCATTACCCTTTG
CCACGTTTTAGATTTACTGTCGGTTATCACAAGCGGCAGGTCATATCTCG
AGTACCGGAAGAAGTAGAAGCTCACTTCAATAAAAGCAACAAATGCTTGA
AGTTTGTCAAAGGCAATGATATCCCAGCTGAAATGAAAAAGGTTCTGAAC
CACAGCACAGCTTTTTTCCTGGAAGGTCATGCTACCGCTAGGAGTTTGTC
TGATTTCGGAATTGAGAATACCAGGCTGCTAAAATGTTGCTTATTGACAG
AATGTAATGGAGTCAAAACCATCATTGATTTGTCACAAGGTGGTGGACAC
TCACAAGTTTACACAAGAGGAAAAGGGAAGAGCGAGTCACTGAAGTTTCC
TGAAGAACAAACTGATGCACTTGGAAATCTACAAGACTTGAATATATATT
ACATGAAGAATTTAGAGAGCATTTGGAAGGGGCCTGTTCATAAGCACTGC
CTAGCTAGCCTGAAGTTCCTTGCACTTCATAAATGCCCCAGATTGAGTAC
CATTTTCTCACTAGATTTGGTTGCTAATCTTGACAATTTAGAAGAGCTCA
TTGTTGAACACTGCCCTCAACTGACCAGTCTTGTGAGCCCGACGGGTCAT
GTGTCCAGTAACTCAACACCACAACCAAATTGCTTTTTTCCTAGCTTGAA
AAGAATATCACTGCTTTACGTGCCAAATCTTGTTAGCATTTCTAGTGGTT
TGTGGATTGCTCCAGAACTGGAAAAAGTAGGCTTTTACAATTGCCCAAAG
CTTAAGAGTCTTTCCGCGATGGAAATGTCAAGTGACCATTTGACGAGGAT
CAAAGGAGAAAGTCACTGGTGGGAAGCATTGGAGTGGAAAAACTCAGAGT
GGGGGAACCCGCTGGATTATCTGCAGAGTATCTTTTCCCCACTTATTAAG
GAGAGAGATGTGAAGGCGCAATTGGCAGAAGAAGGAATTATGCACCATGC
TTCAACTTAA

protein sequence of Tc02v2_p001130.4

>Tc02v2_p001130.4 ID=Tc02v2_p001130.4|Name=Tc02v2_p001130.4|organism=Theobroma cacao|type=polypeptide|length=1470bp
MESWERKNVRNELRQGRKLAKQLQANLKRSSSEENPELVQKIVSSFEKAL
SMLNCSTSSMAAKLQPIAHSSLARDGSHQSKDPDHDIKEQDFKVKDFFMK
REVTESQPKGLATEMFKFPPPFSGSFSSAGNLEAFDGKAAELKPTIIGTE
FDHDFMEEHELKVNETFNKSCSVKDESKPAGHAKVMFKSLSDYNLEKKKH
TVGDASKKSAAGESQPTEVEFKKPKSSHSLGESLPSKDSDYNFKEQELKI
NEGSGKRNARRSWTVLVHSDMVLGELPSDGCNWRKYGQKDILNARFPREY
YRCAHRHTQGCFATKEVQREDEDPMFITATYKGMHTCTLAPDLMPPGPPE
ILAPLDTVLGADGNDKKDSQSNLQSSVHSPDNQTCISSTKLTSELPNLGL
NLNVFPEKSFKSYPTWKNFYENEVRKNWKVLNRKKDVLLLLSSYPMIMID
KSDTDKWIIDVLATMRHVKSTEKILFGVGVAKHWPGMTTLQELSGRLQKL
LDVPLMNDIEGVLPVDLVENLYRTTEADLRPLLEVEQNIISGKTSKSRGS
ASNSEGAAMEAEKELQPMPAKCKTLVEDTELPAKGTLNVPEEIFDLAIYL
AVRQILKCINRGYIWCITISGRDKKRVLGAVKQHQDIVSEFGYIIVFTVS
EDQSGANVHGVFQLQKGFWLGGCFDSVDLTHEYFDNLCSPGILLLTEDDY
DKNMNLDQSTLPLLINLNKLVDHKHSDSRFIIFTSKMATDMEIRMEDHLL
SWKLFCRIVGEGLLSPSIQQIAASLVKEYRGNLLAIILTARSLEKVTDDV
NLWELAVKRLTMLPPSQIEDIDNVLINALTFIWERMNNKTRHCIKFFTWY
PKGQKINRVSLIQHWIQDRLVDTHDEGTNIIQNLVDTSLLNIVELNGVQL
RREIYDVLVNPLILQMHPFYLLLGRARLIKPPEEEEWDAKVINLMDNKLS
DLPESPRSPSLIALYLQRNLDLMTIPSCFFKHMPLLQILDLSHTSIKSLP
ESLSSLVNLRELLLKGCELFIRLPSHVGELKNLEKLDLDETQIIDLPAEI
GQLSKLKILRVSFYGYMNCSKTRLRQDTIIPPGTISGLSELTELSIDVDP
DDERWNATVKDIIEEACNLKTLRQLNLYLPNIEILWKRRTGSASLLHYPL
PRFRFTVGYHKRQVISRVPEEVEAHFNKSNKCLKFVKGNDIPAEMKKVLN
HSTAFFLEGHATARSLSDFGIENTRLLKCCLLTECNGVKTIIDLSQGGGH
SQVYTRGKGKSESLKFPEEQTDALGNLQDLNIYYMKNLESIWKGPVHKHC
LASLKFLALHKCPRLSTIFSLDLVANLDNLEELIVEHCPQLTSLVSPTGH
VSSNSTPQPNCFFPSLKRISLLYVPNLVSISSGLWIAPELEKVGFYNCPK
LKSLSAMEMSSDHLTRIKGESHWWEALEWKNSEWGNPLDYLQSIFSPLIK
ERDVKAQLAEEGIMHHAST*