Tc01v2_t007550.1 | Cocoa Genome Hub

Overview


Name	Tc01v2_t007550.1
Unique Name	Tc01v2_t007550.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3174

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 1 EST, 12 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 15 samples with support for all annotated introns
Product	uncharacterized LOC18611437, transcript variant X1
Note	Methylmalonate-semialdehyde dehydrogenase [acylating], mitochondrial

Cross References

External references for this mRNA


Database	Accession
GeneID	18611437
Genbank	XM_007047680.2

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc01v2_g007550	Tc01v2_g007550	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc01v2_p007550.1	Tc01v2_p007550.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto16276	auto16276	Theobroma cacao	exon
exon-auto16277	auto16277	Theobroma cacao	exon
exon-auto16278	auto16278	Theobroma cacao	exon
exon-auto16279	auto16279	Theobroma cacao	exon
exon-auto16280	auto16280	Theobroma cacao	exon
exon-auto16281	auto16281	Theobroma cacao	exon
exon-auto16282	auto16282	Theobroma cacao	exon
exon-auto16283	auto16283	Theobroma cacao	exon
exon-auto16284	auto16284	Theobroma cacao	exon
exon-auto16285	auto16285	Theobroma cacao	exon
exon-auto16286	auto16286	Theobroma cacao	exon
exon-auto16287	auto16287	Theobroma cacao	exon
exon-auto16288	auto16288	Theobroma cacao	exon
exon-auto16289	auto16289	Theobroma cacao	exon
exon-auto16290	auto16290	Theobroma cacao	exon
exon-auto16291	auto16291	Theobroma cacao	exon
exon-auto16292	auto16292	Theobroma cacao	exon
exon-auto16293	auto16293	Theobroma cacao	exon
exon-auto16294	auto16294	Theobroma cacao	exon
exon-auto16295	auto16295	Theobroma cacao	exon
exon-auto16296	auto16296	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto16297	auto16297	Theobroma cacao	CDS
CDS-auto16298	auto16298	Theobroma cacao	CDS
CDS-auto16299	auto16299	Theobroma cacao	CDS
CDS-auto16300	auto16300	Theobroma cacao	CDS
CDS-auto16301	auto16301	Theobroma cacao	CDS
CDS-auto16302	auto16302	Theobroma cacao	CDS
CDS-auto16303	auto16303	Theobroma cacao	CDS
CDS-auto16304	auto16304	Theobroma cacao	CDS
CDS-auto16305	auto16305	Theobroma cacao	CDS
CDS-auto16306	auto16306	Theobroma cacao	CDS
CDS-auto16307	auto16307	Theobroma cacao	CDS
CDS-auto16308	auto16308	Theobroma cacao	CDS
CDS-auto16309	auto16309	Theobroma cacao	CDS
CDS-auto16310	auto16310	Theobroma cacao	CDS
CDS-auto16311	auto16311	Theobroma cacao	CDS
CDS-auto16312	auto16312	Theobroma cacao	CDS
CDS-auto16313	auto16313	Theobroma cacao	CDS
CDS-auto16314	auto16314	Theobroma cacao	CDS
CDS-auto16315	auto16315	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc01v2_t007550.1 ID=Tc01v2_t007550.1|Name=Tc01v2_t007550.1|organism=Theobroma cacao|type=mRNA|length=3174bp
ATGGAGACTCAAAATCAGCCAGAGTTTAGTGGACAGAAAAGGATGCTTCC
TCCACCTGCTGGAAATTTTCAAGATCGTGAGGAGCTCATTAAACACGTGC
GTGATTTTGGGGCTTCCCAAGGATATGTAGTGACTATTAAGAAATCTAGG
AAGGACAGAAGAGTCATCCTTGGGTGTGACAGAGGAGGTGTTTATCGCAA
TAGGCGTAAGATTGATGAAAGTAAACGCAAAAGGAAAGCATGCTCAAGGC
TTATCAATTGTCCTTTTGAAGCCATAGGTAAAAAGGAAGATGATGCATGG
GTTCTCACCATAAAAAACGGGGAGCATAATCACGAGCCTTTAAAAGATAT
GTCAGAGCATCCTTATAGTCGTCGTTTTACTGAGGAAGAAGTTAGGCAAA
TCAAATTAATGACTGAAGCTGGTATAAAACCACGTCAAGTGCTCAAGGCT
TTGAAACAAAGTAACCCAGAGTTGCAGTCAACTCCAAGGCATTTGTACAA
CCTTAAAGCTAAGATTCGTCAAGGAAATTTATCAGAGAAAAGTTTCAAAT
CATGGAGGCCTAACAGATCTGTTCCTGTAAGCACGAATGGAACTCTCACT
GGAGAGTTGTTAAGGCAAAACAACCAGCCGGTGAAAGTTCCTAATTTTAT
TGGAGGGAAATTTGTGCATTCACAAGGGTCCATGGTCATTGACGTAATTA
ATCCTGCAACACAAGAGGTTGTTTCTCAAGTTCCTTCAGCTACCTACGAA
GAGTTCAAAGATGCAGTTAATGCTGCCAAGCAAGCTTTTTCCTCTTGGAA
GAATACACCGGTTGCAACTCGCCAGCGCATCATGTTCAAGCTCCAGGAGC
TCATCCACAGAAATATTGATAAGCTTGCAATGAATATCACGATGGAACAG
GGAATGACTTTAAAGAGAGCCCAGGGTGATGTGTTGCGTGGTTTAGAGGT
TGTTGAACATGCTTGTGGACTGGCAACTCTGCAAATGGGGGAGTTTGTCC
CGAATGCATCTAATGGCATTGACACGTACTTCATTAGAGAACCACTCGGT
GTGTGTGCTGGGATATGTCCCTCTAACTTTCCTGCAATGATCCCTTTATT
GATGTTTCCTATTGCAGTTTCATGTGGCAATACATTTATTCTTAAGCCAT
GTGAAAAAAATCCAGGGGCTTCAATGATTCTTGCAGCACTAGCAAAGGAG
GCTGGTTTGCCTGATGGTGTCTTAAATATTGTTCATGGCACCAATGATAT
TGTCAATTATATTTGTGATGATGAGGATATAAAAGCTATATCTTTTGTTG
GTTCAAACACAGCTGGCATGCATATATATGCTAGGGCTGCTGCTAGAGGG
AAACGTATTCAGTCCAATGTAGGAGGCAAGAATTATGCAATTATCATGCC
TGATGCAAGCATAGATGCTACTTTAAGTTCTCTAGTTGCAGGCGGATTTG
GAGCTGCAGGGCAGAGGTGCATAGGTCTAAGTACAGCAGTTTTTGTTGGA
GGTTCAATGCCATGGGAAGAAGAACTTTTGGAGCGTGCCAAAGCACTTAA
AGTGAATGTAGGATCAGATCCTGGTGCAGATGTAGGTCCGGTGATTAGTA
AGGAGGTAAAGGATCGCATAAATAGATTAGTTCAAAGCAGTGTTGATGGT
GGTGCTAGACTTATTCTTGATGGGAGAAATATTGTGGTTCCTGGTTATGA
GAATGGGAATTTTATTGGTCCTACTATCATATGTGATGTTGCATCCAATA
TGGAGTGCTGCAAGGAAGAAATATTTGGACCGGTTCTCCTTTGTATGCAG
GCTGGGAGCCTAGAAGGGGCCATAGCCATTGTAAACAGAAACAAGTCCGT
GAATGGAGCTTCTATATTCACAACATCTGGCTATGCTGCAAGGAAGTTTC
AGAATGAAATCGAGTCCGGCTTGGTTGGGATCAATGTTCCTGTTCCCGTT
GCTATTCCAATGCCTTTTTCCTCTTTTAATGGACCAAGAACATCTTTTGC
CGGAGATCTTAATTTTTGTGGAAAGTCAGGTGTGCATTTTTACACCCAGA
TCAAAATGGTGGCACAGCAGTGGAGGGATTTACCAAGCCTAGGATTGTCC
TCGGGTTTGCATCTATCATCTGAGACAGATATTACAAGCCGGGGAGTCTC
TTCAGCATTGCCTCCATCATCAGAGAGAGATTCACCATACCGTAGAGTTT
CGCGGGCCATGTCTCCAGAATCAGAGGGTAATTCACCAAATCATGCATTG
TTGCTTTCTGTTGCTGCAACTTCAGAGAGGGATCTATCAAACCCGGTAAT
TACATCTCTGCCTCCAACTGCTGATGGTGATTTACCAAATCATGGAGCAT
CTCTCCTCATACCTCCGACATCAGAGATGGATTTGGAGAACCAAGATGCA
TCCCTAACCGTGCCATTAGGAAGAGAAACATCAAACCAAGGAGTGTCATC
AGCAACATCCCATCAATCTGAAAGGATGTATACGTCGCAAACATCACAGT
GGAATGAAACTCCGACACTAGCATCTCAAAGAAATGAGCCTATTCCTCCA
CCCTCTGAGAGGATTAATATACCTACAACATCTAAGAGGAATAGCAATGC
AGCTCCAACAGTTCCGAGGTCGGACACTGCAATAGGTTTAACTCATGAGC
GACTATATTTGCCTACATCCCATAAAAATGACAGTATGGTTCCCATTTCA
CATAGGAATGAAAGCATGTCTCCAACTTCCGAGAGAATATATATGATGGC
AACTTCTCACTTGAGCGACAGTATGGGTCAAACGTTTCAGAGGACTGATG
CCCCAATGTTTCCAACTTCTGAGAGGATGTATGTACCTGCCACTCCTCAC
AGGACCGACCACATGGGATCAACTTCTCAGAGGGCTGATGTTGCATTACA
GCCAGCCGCCGAGAGGTTATACATGCCTGCAACATCTCAAAGGAACGATA
ACATTGCTTCGTCTTCTCACCGGGCTGAGTCCATGCCCCAAAATTCCGAG
GGCCTGTATCTGTCTCCAATTATTCACAGAAATGCTGGTATGCCGCCAAC
ATCTGAGAGGTTATATATGCCTGCAGCATCTCAGAGGATGTATGCTCAAA
ACACAATAATTTCAATGGATGATTATCCCAGCCAAGGACCACCTATGACT
TTGCCTACTTCACAGAGGATATAG

protein sequence of Tc01v2_p007550.1

>Tc01v2_p007550.1 ID=Tc01v2_p007550.1|Name=Tc01v2_p007550.1|organism=Theobroma cacao|type=polypeptide|length=1058bp
METQNQPEFSGQKRMLPPPAGNFQDREELIKHVRDFGASQGYVVTIKKSR
KDRRVILGCDRGGVYRNRRKIDESKRKRKACSRLINCPFEAIGKKEDDAW
VLTIKNGEHNHEPLKDMSEHPYSRRFTEEEVRQIKLMTEAGIKPRQVLKA
LKQSNPELQSTPRHLYNLKAKIRQGNLSEKSFKSWRPNRSVPVSTNGTLT
GELLRQNNQPVKVPNFIGGKFVHSQGSMVIDVINPATQEVVSQVPSATYE
EFKDAVNAAKQAFSSWKNTPVATRQRIMFKLQELIHRNIDKLAMNITMEQ
GMTLKRAQGDVLRGLEVVEHACGLATLQMGEFVPNASNGIDTYFIREPLG
VCAGICPSNFPAMIPLLMFPIAVSCGNTFILKPCEKNPGASMILAALAKE
AGLPDGVLNIVHGTNDIVNYICDDEDIKAISFVGSNTAGMHIYARAAARG
KRIQSNVGGKNYAIIMPDASIDATLSSLVAGGFGAAGQRCIGLSTAVFVG
GSMPWEEELLERAKALKVNVGSDPGADVGPVISKEVKDRINRLVQSSVDG
GARLILDGRNIVVPGYENGNFIGPTIICDVASNMECCKEEIFGPVLLCMQ
AGSLEGAIAIVNRNKSVNGASIFTTSGYAARKFQNEIESGLVGINVPVPV
AIPMPFSSFNGPRTSFAGDLNFCGKSGVHFYTQIKMVAQQWRDLPSLGLS
SGLHLSSETDITSRGVSSALPPSSERDSPYRRVSRAMSPESEGNSPNHAL
LLSVAATSERDLSNPVITSLPPTADGDLPNHGASLLIPPTSEMDLENQDA
SLTVPLGRETSNQGVSSATSHQSERMYTSQTSQWNETPTLASQRNEPIPP
PSERINIPTTSKRNSNAAPTVPRSDTAIGLTHERLYLPTSHKNDSMVPIS
HRNESMSPTSERIYMMATSHLSDSMGQTFQRTDAPMFPTSERMYVPATPH
RTDHMGSTSQRADVALQPAAERLYMPATSQRNDNIASSSHRAESMPQNSE
GLYLSPIIHRNAGMPPTSERLYMPAASQRMYAQNTIISMDDYPSQGPPMT
LPTSQRI*