Tc10v2_t012190.1 | Cocoa Genome Hub

Overview


Name	Tc10v2_t012190.1
Unique Name	Tc10v2_t012190.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3345

Properties


Property Name	Value
Note	Glycoside hydrolase family 2 protein isoform 1
Model evidence	Supporting evidence includes similarity to: 3 ESTs, 10 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 8 samples with support for all annotated introns
Product	beta-galactosidase

Cross References

External references for this mRNA


Database	Accession
GeneID	18587232
Genbank	XM_007010933.2

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc10v2_g012190	Tc10v2_g012190	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc10v2_p012190.1	Tc10v2_p012190.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto509732	auto509732	Theobroma cacao	exon
exon-auto509733	auto509733	Theobroma cacao	exon
exon-auto509734	auto509734	Theobroma cacao	exon
exon-auto509735	auto509735	Theobroma cacao	exon
exon-auto509736	auto509736	Theobroma cacao	exon
exon-auto509737	auto509737	Theobroma cacao	exon
exon-auto509738	auto509738	Theobroma cacao	exon
exon-auto509739	auto509739	Theobroma cacao	exon
exon-auto509740	auto509740	Theobroma cacao	exon
exon-auto509741	auto509741	Theobroma cacao	exon
exon-auto509742	auto509742	Theobroma cacao	exon
exon-auto509743	auto509743	Theobroma cacao	exon
exon-auto509744	auto509744	Theobroma cacao	exon
exon-auto509745	auto509745	Theobroma cacao	exon
exon-auto509746	auto509746	Theobroma cacao	exon
exon-auto509747	auto509747	Theobroma cacao	exon
exon-auto509748	auto509748	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto509749	auto509749	Theobroma cacao	CDS
CDS-auto509750	auto509750	Theobroma cacao	CDS
CDS-auto509751	auto509751	Theobroma cacao	CDS
CDS-auto509752	auto509752	Theobroma cacao	CDS
CDS-auto509753	auto509753	Theobroma cacao	CDS
CDS-auto509754	auto509754	Theobroma cacao	CDS
CDS-auto509755	auto509755	Theobroma cacao	CDS
CDS-auto509756	auto509756	Theobroma cacao	CDS
CDS-auto509757	auto509757	Theobroma cacao	CDS
CDS-auto509758	auto509758	Theobroma cacao	CDS
CDS-auto509759	auto509759	Theobroma cacao	CDS
CDS-auto509760	auto509760	Theobroma cacao	CDS
CDS-auto509761	auto509761	Theobroma cacao	CDS
CDS-auto509762	auto509762	Theobroma cacao	CDS
CDS-auto509763	auto509763	Theobroma cacao	CDS
CDS-auto509764	auto509764	Theobroma cacao	CDS
CDS-auto509765	auto509765	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc10v2_t012190.1 ID=Tc10v2_t012190.1|Name=Tc10v2_t012190.1|organism=Theobroma cacao|type=mRNA|length=3345bp
ATGGCTTCTTTGATAGTGGGACAGCTTGTTTTTCCATCAGAAAATGGTTA
CAAAGTGTGGGAAGATCAGTCTTTTTTTAAATGGAGAAAAAGAGATCCTC
ATGTTACTTTGCATTGCCATGAATCTGTTGAAGGATCTCTTAGATACTGG
TATGAACGCAATAAAGTGGATCTTTCAGTATCCAACACTGCAGTTTGGAA
CGATGATGCCGTTCAGAAAGCACTTGACAGTGCTGCTTTTTGGGTCAATG
GCTTGCCTTTTGTCAAGTCTTTGTCTGGTTATTGGAAATTTTTCTTGGCT
TCCAATCCTAATGCTGTTCCAAAGAATTTTTATGAAAGTGCATTTCAGGA
TTCTGATTGGGAAACTTTGCCAGTTCCTTCCAATTGGCAAATGCATGGAT
TTGATCGGCCTATTTATACAAATGTTGTTTATCCAATTCCGCTTGATCCT
CCTCATGTTCCTATAGATAACCCTACAGGCTGCTACAGGACATACTTTCA
CATTCCTGAACCATGGCAGGGTCGCAGGATTTTGTTGCACTTTGAAGCAG
TTGATTCTGCCTTCTGTGCGTGGATAAATGGGGTCCCTGTTGGATACAGT
CAGGATAGTAGATTGCCCGCTGAGTTTGAAATAACAGAATATTGTTATTC
ATGTGATTCGGACAAGAAGAATGTTCTAGCTGTTCAAGTATTTAGATGGA
GTGATGGATCTTACCTTGAAGACCAAGATCATTGGTGGTTATCTGGTATA
CACCGTGATGTGCTTCTCCTTTCTAAGCCACAGGTCTTCATAGCGGATTA
CTTTTTCAAATCAAGCCTGGCTTACAATTTTTCTTATGCTGATATACAGG
TTGAAGTGAAAATAGATTGCTCAAGAGAAATGAGTAAAGACAAAGTGCTT
ACGGACTTTACCATAGAAGCTGCATTATTTGATGCTGGGGTCTGGTACAA
CCATGATGGAAATGTTGATCTGCTTTCTTCGAATGTGGCTAACATAGTGC
TCAAAACTGTCCCGACTGGAACCCTAGGATTTCATGGTTATGTGCTTGTG
GGGAAACTGGAAAAGCCCAAGCTGTGGTCTGCTGAACAACCAAATTTGTA
TACACTGGTTATCATACTTAAGGATGCATCTGGCAACGTAGTTGACTGTG
AATCATGCCTAGTTGGTGTAAGACAAGTATCTAAAGCCCCAAAACAATTG
CTTGTTAATGGGCATCCTGTTGTAATAAGAGGTGTGAACAGGCATGAGCA
TCATCCACGTCTGGGGAAGACAAACATAGAGTCTTGCATGGTGAAAGATT
TGGTTGTAATGAAGCAAAACAATATCAACGCTGTGAGAAACAGCCACTAT
CCTCAACATCCCCGTTGGTATGAGTTGTGTGACCTGTTCGGTATCTATAT
GATAGATGAAGCCAATATTGAGACGCATGGTTTTGATCTTTCGGGACATG
TGAAGCATCTTACTCAGGAACCTGGTTGGGCCGCTGCAATGATGGACCGT
GTTATTGGCATGGTGGAAAGGGACAAAAATCATGCATGCATATTTTCTTG
GTCCTTAGGAAATGAGTCTGGATATGGACCTAATCATTCTGCTTCAGCTG
GATGGATTCGTGGAAGGGATCCTTCAAGACTAGTCCATTATGAAGGTGGT
GGGTCCAGGACCTCATCTACCGATATTATATGCCCTATGTATATGCGTGT
CTGGGACATAGTGAAGATTGCAAAAGATCCAAATGAGACACGTCCTTTGA
TATTGTGCGAGTATTCACATGCAATGGGAAACAGCAATGGAAATATACAT
GAATATTGGGAAGCAATTGATAACATATTTGGCCTCCAAGGTGGCTTTAT
ATGGGATTGGGTTGACCAGGGCCTACTGAAGGACAATGAAGATGGTAGTG
AATATTGGGCATATGGTGGTGACTTTGGGGATTCTCCCAATGATTTAAAT
TTTTGCTTGAATGGCCTTACATGGCCCGATCGAACTCCTCATCCTGCCTT
ACATGAGGTTAAGTATGTCTATCAACCAATCAAGGTTTCTATAGGCGAAA
GCATGATTAAGATAAAGAACACTAATTTTTATGAGACAACTGAAGGAGTG
GAGTTCAAATGGGCTGCTCATGGTGATGGTTGTGAACTTGGATGTGGAAT
TCTCTCTCTGCCAGTAATAGAGCCCCAGAGCAGTTATGATATAGAATGGA
AGTCAGGTCCATGGTATCCTCTATGGGCTTCCTCCGATGCTGAAGAAATA
TTTTTAACAATCACTGCTAAGCTTTTGCACTCCAAACGGTGGGTTGACGC
TGGTCATGTTGTTTCATCTACACAAGTCCAGTTGCTGGCGAAAAGAGATA
TTGTACCTCATATCATCAAAACAAAAGATGATGTCCTTTCCACTGAAATT
CTTGGGGATAATATCAGAATTAGCCAGCAGAAGTTATGGGGAATTACATT
GAATGTGAAAACTGGAAGTCTTGACAGCTGGAAGGTTCAAGGTGTCTCAA
TATTGAAAAATGGCATAATTCCATGCTTTTGGCGAGCACCCACTGATAAT
GACAAAGGGGGAGGTCCGAGTAGTTATTACTCTAGGTGGAAAGCTGCGCA
TATGGATGACATAGTTTTCCTTAGAGAAAGCTGTTCTATACAAGAAAAGA
CTGACCATGCTGTGAAAATAGTGGTTGTTTACCTTGGTGTTTCTAAGGGT
GAGAATGGTCCTTTAAATGAGTTGGAAAAAGCAGATGCTTTATTCGAAAT
TGACATGCTTTACACAATCCATGCTTCTGGTGACATCATTATTGACTCCA
ATGTAAAACCAAGTTCTAGTCTTCCTCCTTTACCACGTGTTGGAGTTGAA
TTTCACCTGGAAAAATCAGTGGACCAGGTTAAATGGTATGGAAGAGGGCC
ATTTGAGTGTTATCCAGATCGAAAAGCAGCTGCCCAAGTTGGGGTTTATG
AGCAGACAGTGGATGACATGCATGTTCCTTACATTGTTCCTGGGGAATCT
GGGGGTAGGGCAGATGTCAGATGGGTGACATTTCAAAACAAGGATGGATA
TGGAATTTATGCTTCAACTTATGGCAAATCTCCACCTATGCAAATGAATG
CAAGTTATTACAGCACAACAGAGCTTGACCGGGCAACACGCAATGAAGAG
CTTATCAAAGGGGATAGCATTGAGGTGCATCTTGACCACAAGCACATGGG
AATAGGCGGAGATGATAGCTGGACACCCTGTGTACATGAAAAGTATCTGA
TTCCGGCTGTGCCATACTCATTCTCTATCAGGTTGTGTCCGGTCACTGCA
GCTACCTCCGGCCAAAACATCTACAAATCCCAACTTCAAAATTGA

protein sequence of Tc10v2_p012190.1

>Tc10v2_p012190.1 ID=Tc10v2_p012190.1|Name=Tc10v2_p012190.1|organism=Theobroma cacao|type=polypeptide|length=1115bp
MASLIVGQLVFPSENGYKVWEDQSFFKWRKRDPHVTLHCHESVEGSLRYW
YERNKVDLSVSNTAVWNDDAVQKALDSAAFWVNGLPFVKSLSGYWKFFLA
SNPNAVPKNFYESAFQDSDWETLPVPSNWQMHGFDRPIYTNVVYPIPLDP
PHVPIDNPTGCYRTYFHIPEPWQGRRILLHFEAVDSAFCAWINGVPVGYS
QDSRLPAEFEITEYCYSCDSDKKNVLAVQVFRWSDGSYLEDQDHWWLSGI
HRDVLLLSKPQVFIADYFFKSSLAYNFSYADIQVEVKIDCSREMSKDKVL
TDFTIEAALFDAGVWYNHDGNVDLLSSNVANIVLKTVPTGTLGFHGYVLV
GKLEKPKLWSAEQPNLYTLVIILKDASGNVVDCESCLVGVRQVSKAPKQL
LVNGHPVVIRGVNRHEHHPRLGKTNIESCMVKDLVVMKQNNINAVRNSHY
PQHPRWYELCDLFGIYMIDEANIETHGFDLSGHVKHLTQEPGWAAAMMDR
VIGMVERDKNHACIFSWSLGNESGYGPNHSASAGWIRGRDPSRLVHYEGG
GSRTSSTDIICPMYMRVWDIVKIAKDPNETRPLILCEYSHAMGNSNGNIH
EYWEAIDNIFGLQGGFIWDWVDQGLLKDNEDGSEYWAYGGDFGDSPNDLN
FCLNGLTWPDRTPHPALHEVKYVYQPIKVSIGESMIKIKNTNFYETTEGV
EFKWAAHGDGCELGCGILSLPVIEPQSSYDIEWKSGPWYPLWASSDAEEI
FLTITAKLLHSKRWVDAGHVVSSTQVQLLAKRDIVPHIIKTKDDVLSTEI
LGDNIRISQQKLWGITLNVKTGSLDSWKVQGVSILKNGIIPCFWRAPTDN
DKGGGPSSYYSRWKAAHMDDIVFLRESCSIQEKTDHAVKIVVVYLGVSKG
ENGPLNELEKADALFEIDMLYTIHASGDIIIDSNVKPSSSLPPLPRVGVE
FHLEKSVDQVKWYGRGPFECYPDRKAAAQVGVYEQTVDDMHVPYIVPGES
GGRADVRWVTFQNKDGYGIYASTYGKSPPMQMNASYYSTTELDRATRNEE
LIKGDSIEVHLDHKHMGIGGDDSWTPCVHEKYLIPAVPYSFSIRLCPVTA
ATSGQNIYKSQLQN*