Tc01v2_t031950.1 | Cocoa Genome Hub

Overview


Name	Tc01v2_t031950.1
Unique Name	Tc01v2_t031950.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	2238

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 33 ESTs, 21 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 27 samples with support for all annotated introns
Product	transketolase, chloroplastic
Note	Transketolase-2, chloroplastic

Cross References

External references for this mRNA


Database	Accession
GeneID	18614321
Genbank	XM_007052028.2

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc01v2_g031950	Tc01v2_g031950	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc01v2_p031950.1	Tc01v2_p031950.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto71889	auto71889	Theobroma cacao	exon
exon-auto71890	auto71890	Theobroma cacao	exon
exon-auto71891	auto71891	Theobroma cacao	exon
exon-auto71892	auto71892	Theobroma cacao	exon
exon-auto71893	auto71893	Theobroma cacao	exon
exon-auto71894	auto71894	Theobroma cacao	exon
exon-auto71895	auto71895	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto71896	auto71896	Theobroma cacao	CDS
CDS-auto71897	auto71897	Theobroma cacao	CDS
CDS-auto71898	auto71898	Theobroma cacao	CDS
CDS-auto71899	auto71899	Theobroma cacao	CDS
CDS-auto71900	auto71900	Theobroma cacao	CDS
CDS-auto71901	auto71901	Theobroma cacao	CDS
CDS-auto71902	auto71902	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc01v2_t031950.1 ID=Tc01v2_t031950.1|Name=Tc01v2_t031950.1|organism=Theobroma cacao|type=mRNA|length=2238bp
ATGGCCTCAACTTCGTCTACCACCCTATCCCAAGCCCTCTTGGCTCGCGC
CATCTCTTACCATGGCTCCACCCAGTCCTCCGACCACCGCGTCTCTCTCT
CCACCCTCTCTCTCCCCACCTTCTCTGGCCTCAAATCCACTACCTCACGT
GCTTCGGCTTCTCGTAGACGCCCTCCCGTGCGCTCCTACCAGAACCGCCA
AGTCCGTGCCGCCGCCGTGGAGACAATTGGTACTGCCGCGGAGACTTCCT
TGGTGGAGAAATCGGTCAATACGATCAGATTCCTGGCCATTGATGCTGTC
GAGAAGGCGAATTCGGGTCATCCTGGGTTGCCTATGGGCTGTGCTCCGAT
GGGCCACATTTTGTACGATGAAGTCATGAGGTATAACCCGAAGAACCCTT
ATTGGTTCAACCGTGACCGTTTCGTGTTGTCCGCTGGTCACGGTTGTATG
TTGCAGTATGCTCTGCTTCACCTCGCTGGTTACGACAGTGTCCTGGAAGA
AGATTTGAAGAATTTCCGTCAGTGGGGTAGCAAAACCCCAGGACATCCTG
AGAACTTTGAAACACTTGGAGTTGAAGTCACAACTGGTCCTCTTGGTCAA
GGTGTTGCGAATGCTGTCGGACTGGCTCTTGCGGAGAAACACTTGGCTGC
TAGATTCAACAAGCCAGACAATGAGATCGTTGACCACTACACATATGTTA
TTTTGGGAGATGGGTGTCAAATGGAGGGTATTGCAAATGAAGCATGTTCA
CTTGCTGGACACTGGGGACTTGGGAAGCTTATAGCTTTCTATGATGACAA
CCACATTTCCATTGATGGTGACACTGAAATTGCCTTTACTGAGAGTGTTG
ATAAGCGTTTTGAGGGGCTTGGGTGGCATGTCATCTGGGTCAAGAATGGA
AACACTGGCTATGATGATATTCGTGCTGCTATTAAGGAAGCAAAGGCTGT
TAAAGACAAACCCACTTTGATCAAGCTGACAACCACCATTGGTTATGGAT
CCCCGAACAAGGCAAACTCATACAGTGTACATGGGAGTGCACTGGGTGCC
AAGGAAGTGGATGCTACTAGGAAAAATCTTGGATGGCCATATGAGCCTTT
CCATGTACCTGAAGATGTTAAAACGCACTGGAGTCGCCATGTCCCTCAGG
GTGCTGCTCTTGAAGCCGAATGGAATGCCAAGTTTGCTGAATATGAGAAG
AAGTACAAAGAGGAAGCTGCAGAGCTCAAGACAATCATCACTGGTGAACT
ACCTGCTGGATGGGAGAAGGCACTTCCGACATACACTCCAGAGAGCCCAC
CTGATGCTACCAGAAATCTCTCTCAACAAAATCTCAATGCCCTTGTAAAA
GTACTCCCTGGTCTTCTTGGTGGAAGTGCAGACCTTGCTTCTTCCAACAT
GACCTTGCTCAAAATGTATGGTGATTTCCAGAAGGACACCCCTGAGGAAC
GCAATGTTAGGTTTGGTGTTAGGGAACATGGAATGGGAGCCATCTCAAAT
GGCATTGCCCTTCACAGCCCTGGTCTGATTCCATACTGTGCTACTTTCTT
TGTCTTTACTGACTACATGAGAGCTGCCATCAGGATTTCTGCCTTGTGTG
AAGCTGGAGTTATCTATGTTATGACCCACGATTCCATTGGTCTTGGGGAA
GATGGACCAACCCACCAGCCAATTGAGCACTTGGCGAGCTTCCGTGCAAT
GCCTAACATTTTAATGCTCCGTCCAGCTGATGGAAATGAAACTGCTGGTG
CATACAAGGTTGCTGTCCTCAACAGGAAGAGACCCTCAATTCTTGCTCTC
TCTCGGCAAAAGCTGCCCCAACTTGCTGGAACTTCCATTGAGGGAGTTGA
AAAGGGTGGCTACATTGTTTCAGACAATTCTTCAGGCAACAAGCCTGATG
TAATTCTGATTGGAACTGGTTCTGAGCTAGAGATTGCTGCTAAAGCTGCT
GAGGAACTAAGGAATGGAGGAAAGGCTGTTAGGGTTGTCTCCCTGGTTTC
TTGGGAGCTCTTTGATGAGCAATCTGATGCCTACAAGGAAAGTGTTTTGC
CATCTGCTGTATCAGCTAGGGTGAGTATTGAGGCTGGATCAACATTTGGA
TGGGAGAAGATAGTTGGATCCAAAGGAAAGTCAATAGGAATTGACCGGTT
TGGCGCAAGTGCACCAGCAGGCAGAATATACAAGGAATTTGGTTTAACCC
CAGAGGCTGTTGTTACAGCAGCGAAAGAACTCTGCTAG

protein sequence of Tc01v2_p031950.1

>Tc01v2_p031950.1 ID=Tc01v2_p031950.1|Name=Tc01v2_p031950.1|organism=Theobroma cacao|type=polypeptide|length=746bp
MASTSSTTLSQALLARAISYHGSTQSSDHRVSLSTLSLPTFSGLKSTTSR
ASASRRRPPVRSYQNRQVRAAAVETIGTAAETSLVEKSVNTIRFLAIDAV
EKANSGHPGLPMGCAPMGHILYDEVMRYNPKNPYWFNRDRFVLSAGHGCM
LQYALLHLAGYDSVLEEDLKNFRQWGSKTPGHPENFETLGVEVTTGPLGQ
GVANAVGLALAEKHLAARFNKPDNEIVDHYTYVILGDGCQMEGIANEACS
LAGHWGLGKLIAFYDDNHISIDGDTEIAFTESVDKRFEGLGWHVIWVKNG
NTGYDDIRAAIKEAKAVKDKPTLIKLTTTIGYGSPNKANSYSVHGSALGA
KEVDATRKNLGWPYEPFHVPEDVKTHWSRHVPQGAALEAEWNAKFAEYEK
KYKEEAAELKTIITGELPAGWEKALPTYTPESPPDATRNLSQQNLNALVK
VLPGLLGGSADLASSNMTLLKMYGDFQKDTPEERNVRFGVREHGMGAISN
GIALHSPGLIPYCATFFVFTDYMRAAIRISALCEAGVIYVMTHDSIGLGE
DGPTHQPIEHLASFRAMPNILMLRPADGNETAGAYKVAVLNRKRPSILAL
SRQKLPQLAGTSIEGVEKGGYIVSDNSSGNKPDVILIGTGSELEIAAKAA
EELRNGGKAVRVVSLVSWELFDEQSDAYKESVLPSAVSARVSIEAGSTFG
WEKIVGSKGKSIGIDRFGASAPAGRIYKEFGLTPEAVVTAAKELC*