Tc04v2_t024720.1 | Cocoa Genome Hub

Overview


Name	Tc04v2_t024720.1
Unique Name	Tc04v2_t024720.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3744

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 2 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 3 samples with support for all annotated introns
Product	FIP1[V]-like protein
Note	Uncharacterized protein isoform 1

Cross References

External references for this mRNA


Database	Accession
GeneID	18603647
Genbank	XM_007035732.2

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc04v2_g024720	Tc04v2_g024720	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc04v2_p024720.1	Tc04v2_p024720.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto249745	auto249745	Theobroma cacao	exon
exon-auto249746	auto249746	Theobroma cacao	exon
exon-auto249747	auto249747	Theobroma cacao	exon
exon-auto249748	auto249748	Theobroma cacao	exon
exon-auto249749	auto249749	Theobroma cacao	exon
exon-auto249750	auto249750	Theobroma cacao	exon
exon-auto249751	auto249751	Theobroma cacao	exon
exon-auto249752	auto249752	Theobroma cacao	exon
exon-auto249753	auto249753	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto249754	auto249754	Theobroma cacao	CDS
CDS-auto249755	auto249755	Theobroma cacao	CDS
CDS-auto249756	auto249756	Theobroma cacao	CDS
CDS-auto249757	auto249757	Theobroma cacao	CDS
CDS-auto249758	auto249758	Theobroma cacao	CDS
CDS-auto249759	auto249759	Theobroma cacao	CDS
CDS-auto249760	auto249760	Theobroma cacao	CDS
CDS-auto249761	auto249761	Theobroma cacao	CDS
CDS-auto249762	auto249762	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc04v2_t024720.1 ID=Tc04v2_t024720.1|Name=Tc04v2_t024720.1|organism=Theobroma cacao|type=mRNA|length=3744bp
ATGGATTCGATGGATGATGATTTTGGTGACTTATACGCCGACGTTGAAAT
CCAAGCTAGCTCAGCGATCGACGCATTGTTCATTGAACCAGAAGACAATG
GCCGTAGCAATGGCGCCGAAAGCACTGACGGGGATGAGAAATTCGACCCC
GGTTCAGTTATGGAAGATAGTGACAGCGAGGACGATTTGAACATTTTGTT
GAACGATGATGACTGCGAGAAGTTTCCGGTTACCGGTGCGAGGAGTCACG
GTGGTGGCTATGAGGAGGATGAAGATAGCGGTTTTGGTGTGGAGGGAACT
GGGTCGGATAAGATTTCAAGGCGGGTGGAACCGGTTGGTGATGGGTCGGA
GCTGAATTGTAGTGGAAATGGTGTAGAAAGAGGGACTGGAGCTAAAACGC
AGTTTTCGCTCTTCAAGTATGTGAGACCTCATGGATTACCATTTTCAAGT
AATGTGAGAGTTACTGGATGTACTGGTGTTTCACCATTCTCTTCTACGTC
GGCAAGAGGTGATCGGGAAGATGATGTTTACAGCCAGAAAAAGGGTGGAA
GCTTGGTTCAGGTTGCTAACAGACATGCTACCACGAATTCATTACCACAT
CAATTTGGATATGGTTTTTCTCTTCCATGGTATAGGACAATATTGGATAT
GAAAATTGATGCATTTGAGGAGAAACCTTGGAGGCATCCCGGCATAGATA
TAACAGATTTCTTCAATTTTGGTTTCAATGAGGACAGTTGGAAACGATAC
TGTAACTCCCTGGAGAAATTTCGGCACCGGTCGTCCAGGCAGGCTAGGAT
TCCTGTTTATTTTTCTTCAAAACTTGATCAGGCTTATGAAGCTGAGGCTG
GGCTTGAGACAGCAACTCAAGAAGCTATGACTGAGGATGTATCTAAAGTT
GAACCATCATTTAAATGTGCTGATAGAGGAGAGATGCCCTTGGAATTGCC
AAAAGGAAGAGCAATTCAGGTCGAAGACAGCATCAATGAACGCCAACCAT
CCATGGATCTAAGGCGTCCACGTTTTCAGGATTCTGATGTTATTATACAG
ATAACTGTGCAGGATTTCACTGTGGATTCCTCTGAGTCTGCAAGGGAGGA
ACTAGGTCATGGTAGAAAGTGTGAAGTGTCAGAATCTGGGAAGTTGGATG
TGAAGGATGACAGAGATGTTTGCTTTTCTGTTAGTGCTGGCGGTGATGAC
CTGTCTGGAGAGCATTGTGCAAGGGTCAGAAATGCGTCCCTGTCTTGTCC
TTTGAGGTCTTTGCAGCCAACAACTGCATCTAATCAAACTTCACTGGAGA
CTAATAATCACAGAAATGACAAGCTCTCTGATATGAATGGGCGTTGTCAT
CCAAATATGGATGTTTGCATATCAGAAGGAATTGCTGAATCAATGGAAAC
AACATATAAGGAAAATGAAGTGGCTTGCAGAAATACTTACCAGTCAGATC
CTTGCATGATTGAACCAGAACAATCACTTGACGATCGGAGTCATTTTAGC
CCTACACTTTCCTTTTCTGAAAGCAATTCTGAAGAAAGATCCAAAGATAG
CGTTCATGCTGTTTCCATTGACGGTCCAAGTCCATTAAGAAGGCAATCAC
TAGATTATGGCTCTGAATTGCAGAAGTCAGTTGCATCTTATCATAAAAGT
TCCAGAATTGGTGGCAGCAAAACAAAATCAGATGATGGAGAAAGTTATTC
AATACATTCAAGTCCACTCAGAGACAAGCAAAAGCATGAGAGCTGGAGAC
ACCGACCTCTTGTGAAACAGAGGATCTTGCATGAAAGTGATGATGACATT
TCTCCAATACCAGATGCAGAGTGTGATAGGAAAAGATATCAAAGATGTAA
AAATCCCATTGAGGAAGAAAGGAAGCATCACCGTGGTAGACCTCACGGTA
TTACTGATCAGAAGATATATCCTGAAAACTGCTATAAAGCTTCCCCTTCA
TCAAATGCACTGAAACTCTGTGATAAAGATTACTCATCTGATTGTAGCAG
ACAGAAAGAAAGACTGCAAGATCTTGGTTATCATGACAGAGAAGGTTCCT
CATGCTACATGGAGAAAGGACCTTGTGTTAATGGCCATAAAAGGTTTGCT
GACAGCCATCTTCAGGCTGTCCGCACAAAAGGTCCTCTAAGCTTAAAAGA
AGATTCGGATCAGTTTGCTGGAAGAGAATGGAAAAAGGAGTTTTATCATG
GAAGAAGAGCTGGCATAGATAAAGAAGATGACATGGATGGGTTTTGGCAT
CATGGACAAAGACTTCCTGCTCAACAGGGTTTGTTTCCTCACACTTGCAG
GGAATCTGGGAGGTTAGTCTCAAGGTATTCCTCTGCTTCAAAAGAAAGAG
ATATTCAATGGAGAAGGGGATATGATGGACTCCAGCTTCGGAAGAAAACT
GATCATGATGATTGTCCATTAGATTATAAGCATGAAAATGAACGGTTAAA
AGAAACGTATGGTAGATCCATTCCATTCACTCGTTGTGAAAGGGATATGG
TTGAACCATATGAGAGATGGCTACCACCAATTAGGAGAGAATTCAAAGTT
TCTGGCAGAAAAGGTAGATATGTTGATCCTGCCTATTTCCCTTTGGATAG
ACCGTGGCCGATGGAAAGTGAAGAGTATCTGAGACACACGTATTGTAGAT
CTCTAGCCTTGGAGACTGACAGAGAACCTTCCGTACCTAATGGAAGAAGG
TGGCGTAACACTTTATTATCAAGAAATGAGGCATTTGACTCCAAGTTTAT
TAAAAGATACCATAGACATCAGAGAATAGTATGTCATGAGGAAGATGGAG
ACAATGGTCGATGTGGTTGTTATGATTATGTCGATGACAATGAAGATGGT
ATCTTGCCAAATGGGAATCAAGTTCAGTCGTGGAGAAGGGGCCATAGTCA
GCGAGGTAGAGTAGTACACTGGACGAAGGATAAACTACTTGGAAATGATA
GATTGTTAGCCCAATGGGTGTCTTTTTCCTGTCAAAAAACTTCTAAGCAT
GACTTAATTCATGCTAGGCATGGATCCCTCCGTGATGAGATGCTCATTAA
TGATTTGATGTTGGAGCATCACGGATATGAAATGATAACTGAAGGAAGTA
ATGCCAACTGTCATGAAAGAAATTCTATTATTAGGCAAAAGCAGAAGGTC
CTGAAGGACAGGGACTCAGTTGACTTGATTGTTGGGGAAGGAAAGTCTTC
TGTAAGGCACTTGGATGGTGGAAGCTTAATATGCAATGGAAGGCTTGAAA
AGATTGGCTTGGAATTTCCTATGGAGCAGAAATCTTTAAGGGATGTTAAT
GACTCTTGTGGAGGCAACAGAGTTAAGACAGACATCTCAAATACGGATGG
TAGCAGAACTATTGAGAAACAGCTTGATAAGTTTTCAGTTGCAGAGTGTA
ATCAAGATCTGGATATTGAGGAGGGTCAGATTATATGTGAAGAACAAAGT
ATTAACCTGGAAAAGGAAAATGTTTCTGAGACTATGGTGCAAAGGAGCAA
GGTCAAGATGAGAACATTGCATGTTGACAGTTCTGACGGAAATAGAGCTG
TGGGTGAATATGACAACAAACGGATAGTGGAGACACTAGCAAAGATGGAG
AAACGAAGGGAACGGTTTAAGGATCCCATCACAATAAAAATGGAGCCAGA
CAAGACTTCTGAGCCTCAAGTTGACTTGGTAGTTGACACTAATGAAATTA
AGCACCAAAGGCCTGCTCGAAAGAGGCGGTGGGGTGTAAGTTAG

protein sequence of Tc04v2_p024720.1

>Tc04v2_p024720.1 ID=Tc04v2_p024720.1|Name=Tc04v2_p024720.1|organism=Theobroma cacao|type=polypeptide|length=1248bp
MDSMDDDFGDLYADVEIQASSAIDALFIEPEDNGRSNGAESTDGDEKFDP
GSVMEDSDSEDDLNILLNDDDCEKFPVTGARSHGGGYEEDEDSGFGVEGT
GSDKISRRVEPVGDGSELNCSGNGVERGTGAKTQFSLFKYVRPHGLPFSS
NVRVTGCTGVSPFSSTSARGDREDDVYSQKKGGSLVQVANRHATTNSLPH
QFGYGFSLPWYRTILDMKIDAFEEKPWRHPGIDITDFFNFGFNEDSWKRY
CNSLEKFRHRSSRQARIPVYFSSKLDQAYEAEAGLETATQEAMTEDVSKV
EPSFKCADRGEMPLELPKGRAIQVEDSINERQPSMDLRRPRFQDSDVIIQ
ITVQDFTVDSSESAREELGHGRKCEVSESGKLDVKDDRDVCFSVSAGGDD
LSGEHCARVRNASLSCPLRSLQPTTASNQTSLETNNHRNDKLSDMNGRCH
PNMDVCISEGIAESMETTYKENEVACRNTYQSDPCMIEPEQSLDDRSHFS
PTLSFSESNSEERSKDSVHAVSIDGPSPLRRQSLDYGSELQKSVASYHKS
SRIGGSKTKSDDGESYSIHSSPLRDKQKHESWRHRPLVKQRILHESDDDI
SPIPDAECDRKRYQRCKNPIEEERKHHRGRPHGITDQKIYPENCYKASPS
SNALKLCDKDYSSDCSRQKERLQDLGYHDREGSSCYMEKGPCVNGHKRFA
DSHLQAVRTKGPLSLKEDSDQFAGREWKKEFYHGRRAGIDKEDDMDGFWH
HGQRLPAQQGLFPHTCRESGRLVSRYSSASKERDIQWRRGYDGLQLRKKT
DHDDCPLDYKHENERLKETYGRSIPFTRCERDMVEPYERWLPPIRREFKV
SGRKGRYVDPAYFPLDRPWPMESEEYLRHTYCRSLALETDREPSVPNGRR
WRNTLLSRNEAFDSKFIKRYHRHQRIVCHEEDGDNGRCGCYDYVDDNEDG
ILPNGNQVQSWRRGHSQRGRVVHWTKDKLLGNDRLLAQWVSFSCQKTSKH
DLIHARHGSLRDEMLINDLMLEHHGYEMITEGSNANCHERNSIIRQKQKV
LKDRDSVDLIVGEGKSSVRHLDGGSLICNGRLEKIGLEFPMEQKSLRDVN
DSCGGNRVKTDISNTDGSRTIEKQLDKFSVAECNQDLDIEEGQIICEEQS
INLEKENVSETMVQRSKVKMRTLHVDSSDGNRAVGEYDNKRIVETLAKME
KRRERFKDPITIKMEPDKTSEPQVDLVVDTNEIKHQRPARKRRWGVS*