Tc04v2_t010350.1 | Cocoa Genome Hub

Overview


Name	Tc04v2_t010350.1
Unique Name	Tc04v2_t010350.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	3465

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 2 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 21 samples with support for all annotated introns
Product	putative disease resistance protein RGA1, transcript variant X1
Note	Putative disease resistance protein RGA4

Cross References

External references for this mRNA


Database	Accession
GeneID	18601973
Genbank	XM_018120267.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc04v2_g010350	Tc04v2_g010350	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc04v2_p010350.1	Tc04v2_p010350.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto218120	auto218120	Theobroma cacao	exon
exon-auto218121	auto218121	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto218122	auto218122	Theobroma cacao	CDS
CDS-auto218123	auto218123	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc04v2_t010350.1 ID=Tc04v2_t010350.1|Name=Tc04v2_t010350.1|organism=Theobroma cacao|type=mRNA|length=3465bp
ATGGCAGATGCTCTTCTTTCAGCCGTTCTAAACACCATCTTGGAGAACAT
AAACTCCCTGTGGCTTGAAGAGTTTGGGATCACAGGGGGATTGAAAACCG
AGCTTGAGAGTCTGCAGAGCACCTTAAGTACGATCCAAGCGGTACTTCTT
GATGCAGAGGAGAAGCAGTGGAAGAGTGAGGCTATCAAGAATTGGCTGGG
AAAACTCAAAGATACGGCTTATCATCTAGATGATATACTAGATGAGTTTG
CAACAAACACTCAAAAAGAAAGGCTGCAGAGAGATGCTAGAAGCCAGGTA
TGCACCTTCCATTACCTTCCTAAACAGCTTTTATTTCGCTCAAAGATGGC
GCATAAGTTGAAGGATGTTAGAGAAAAATTGGATGCAGTTGCTGGGGAGA
GATCCAAGTTCCATTTGAGAGAAGGGATGGAGCCCTTGGAGGACAGAGAA
GTGAGTGATACAGAGTGGAGAAAAACTAGCTCACTTGTAAATGAATTAGA
GGTGTATGGAAGAGATAAGGAGCTGGATAGAATAATCAATATGCTGTTGA
ACAATTTAGCAGATCAGGATGGGATTTCTGTTTACACTATATGTGGCATG
GGAGGACTCGGAAAGACAACACTTGCTCAATTGGTTTATAATGATGAAAG
CATAAGAAAGGCTTTTGATTTGAGAATTTGGGTATGTGTATCCGATGATT
TTGATATTACAAGATTAACAAAAGCCATTATAGAGTCCATTGAAGGAAAG
TGCAGTATAGAAGAACTAGATCCCCTGCTAAGACACCTACAAGAAAAACT
AATTGGGAAAAGGTTTTTGCTTGTATTGGATGATGTGTGGAATGAATATC
ACGAAAAGTGGGAAGGATTGAAGGAAGCATTTAGATGCGGTGCGAAAGGA
AGCACAGTTATAGTCACTACCCGTATCGAGAAAGTTGCCCTTATGATGAC
AACTACTCCTATACACCACTTGGGAAGCTTGTCCTGTGATGATTCTTGGT
CCTTATTCAAGCAGCGTGCGTTTAGGATGGGAAAGAGCGAGGATTACCCA
CACTTAGAAGCACTTGGAAAGGAAATAGTTAAGAAGTGTGGGGGGGTGCC
CTTAGCACTAAAGGCTTTGGGAGGTTTGTTGCGTTTCAAAGAAAGAGAGA
GTGAGTGGCTATCGATCAAAGAAAGCGAGATGTGGGAATTGGCAGATGAG
GGGAGCAAAGTCTTATCTGTGTTGAATTTGAGTTACAGACGTCTAAAACC
GCATTTGAGACAATGTTTTACATTTTGCTCTATATTTCCCAAAGATTATA
TCATGAGTAAAGAGCAGTTGATACAACTTTGGATGGCTAATGGCTTTGTT
CCTGCAAGAGGACAAATGAATTTGCATGACATGGGCTGTGAAATCTTCAA
TGAATTAGCTTGGAGGTCCTTTTTCCAAGAACTCGTGGAGGATTTTGAAG
GAAATTCAACATGTAAAATGCATGACCTTATCCATGATCTTGCACAATCA
ATTATGAGTTGCGAGTGCTCTGTGACTGAACCAAGTCAGCTAGTGTTGAC
TGCGCCCAAAACAGTTCGTCACATGTTTGCTTCTGGTAATTCGTCTATAT
TTGCTCCTTCAAATGTGGACAACCTACCCAAAGTCTGTTCCTTGCGCACA
TTGTTTGTACGTAACAACTTCCATTGGAGAATTGCAACTAAACAGAAGCA
TCTGAGGGCATTACACGTTACATTTAATGGAGGAATGAAAATCTCAATTG
ATGATAAGTTCAGACATCTAAGGTATCTGAGCCTTGTTAATTCTGGAATT
GAAACACTGCCAGAATCACTATGCAGCTTCCAAAAATTGCAGACACTAAA
TCTGATATGTTGTTATCACCTTCGCAAATTACCCAAAGGTTTGAAGCTCT
TGAAAAGTCTTACATATTTAGACATAAAATATTGTAATGCACTTACTCGT
ATGCCTGTTGGCCTGGGGCAATTGTCTTGCTTGCGTAGGCTGAGCATGTT
CATTGTGGGAAAGGACCGTGGTTGCTGTATAGACGAATTAAAAGGGCTGG
CTCTTGAGGGAGAGCTTTGCATTGAAGAACTTGATAATGTAAAAAGTTTA
ATAGATGCTAAAAGTGCCAATCTGATAATGAAGCAAAATCTAAGATCACT
AGGCTTATCTTGGCGCAAAATCGACAATTGTTACCTACATGAAAATGCTG
AAGAGGTTCTTAGTGGTCTCCAACCTCATTCAAGTTTGAAGACGCTAAGC
ATACGAAATTACCATGGTCCAAAGTTTTCATATTGGTTGATGGATCTCCT
TGTTCCAAACCTAGTTGACATCACACTGGTAAATTGTGAAAGATGTGAAT
GCCTTCCACCTCTTGGTAAATTAGGCTTCCTCAAGTCCCTCACCATTACT
GGAATGGATGCTCTAAAATCTATTGATAATAGCTTCTATGGAGATGGCGA
GAGTTCATTCTCGTCACTGGAGAGTCTCTGTTTCGAGAATATGCTTTCTT
TCGAGGAATGGACAACAGTGAAGGGGAAGGAAAATTTTCCTCAGCTAAGA
TCATTAGTTATTAGAGATTGTCCGAAGCTAGTTGAAATGCCTATGCTTCA
ATCTCTGAAAATATTAGAAATTAGCAAAACCAGCGTCTCATTACTTAGCT
CCGTGATGCATTTCACTTTTCTCACCTCTCTCTTACTGGGCGGCTTTGAT
GGCTTGACGGTTATGCCAGATGGACTATTGCAAAATCACAAGCACCTTGA
AAGCTTGGAGATACGTTTTAAAAAGCTGAAATCTCTATCAAATCTTCTAG
ATAACCTATCTGCTCTCGAGCAATTGGATCTTCAGGACTGCCTAGAGCTT
GAAAATATTCCAGCAGGACTAGAAAACCTCAGCTCTTTGGAGAGATTGCA
TTTAAGTGAGTGTAACAGCCTTGTAACCCTTCCAGAAGATGGATTGCGTG
GTTTATCTTCCCTTTCTTCGCTGTGGTTTCAAGGGTGTCAGAAATTAGCC
TCTTTATCTGATGGAGTGAGATATCTGACTTCGCTCCGAGACTTACTCGT
CAATGATTGTCCAGAGTTAAACTCATTGCCCGAGTGTATCCAACATCTCT
CTGCACTTCGGAGTTTGAGGATTTGGCATTGTGAGAGATTAACTTCTCTG
CCAAATGGGATAGAAAACCTTGCCTTGCTTTCAGAATTGGAGATCATGCG
TTGCGATAATCTAATGTGTCTGCCTCAAGGGCTACAGAGTCTCACGGCAC
TCACAATACTGAGGATTGTAGGATGCCGACATCTGGAAAGGCGGTGCAGG
AGAGAGAGAGGAGAGGATTGGCCCATCATAGCCCACATTCCTTCTATTGT
AATCATGTCCCGTGGAGAGTACTTTTTTCGAGGACGAAGAAGGCCTCTTG
GCAATCTGTTAACAAGGGTTGGTGATTGGACAAATGGGCTCTCCAGAAAG
TTTTGGAAATCTTAG

protein sequence of Tc04v2_p010350.1

>Tc04v2_p010350.1 ID=Tc04v2_p010350.1|Name=Tc04v2_p010350.1|organism=Theobroma cacao|type=polypeptide|length=1155bp
MADALLSAVLNTILENINSLWLEEFGITGGLKTELESLQSTLSTIQAVLL
DAEEKQWKSEAIKNWLGKLKDTAYHLDDILDEFATNTQKERLQRDARSQV
CTFHYLPKQLLFRSKMAHKLKDVREKLDAVAGERSKFHLREGMEPLEDRE
VSDTEWRKTSSLVNELEVYGRDKELDRIINMLLNNLADQDGISVYTICGM
GGLGKTTLAQLVYNDESIRKAFDLRIWVCVSDDFDITRLTKAIIESIEGK
CSIEELDPLLRHLQEKLIGKRFLLVLDDVWNEYHEKWEGLKEAFRCGAKG
STVIVTTRIEKVALMMTTTPIHHLGSLSCDDSWSLFKQRAFRMGKSEDYP
HLEALGKEIVKKCGGVPLALKALGGLLRFKERESEWLSIKESEMWELADE
GSKVLSVLNLSYRRLKPHLRQCFTFCSIFPKDYIMSKEQLIQLWMANGFV
PARGQMNLHDMGCEIFNELAWRSFFQELVEDFEGNSTCKMHDLIHDLAQS
IMSCECSVTEPSQLVLTAPKTVRHMFASGNSSIFAPSNVDNLPKVCSLRT
LFVRNNFHWRIATKQKHLRALHVTFNGGMKISIDDKFRHLRYLSLVNSGI
ETLPESLCSFQKLQTLNLICCYHLRKLPKGLKLLKSLTYLDIKYCNALTR
MPVGLGQLSCLRRLSMFIVGKDRGCCIDELKGLALEGELCIEELDNVKSL
IDAKSANLIMKQNLRSLGLSWRKIDNCYLHENAEEVLSGLQPHSSLKTLS
IRNYHGPKFSYWLMDLLVPNLVDITLVNCERCECLPPLGKLGFLKSLTIT
GMDALKSIDNSFYGDGESSFSSLESLCFENMLSFEEWTTVKGKENFPQLR
SLVIRDCPKLVEMPMLQSLKILEISKTSVSLLSSVMHFTFLTSLLLGGFD
GLTVMPDGLLQNHKHLESLEIRFKKLKSLSNLLDNLSALEQLDLQDCLEL
ENIPAGLENLSSLERLHLSECNSLVTLPEDGLRGLSSLSSLWFQGCQKLA
SLSDGVRYLTSLRDLLVNDCPELNSLPECIQHLSALRSLRIWHCERLTSL
PNGIENLALLSELEIMRCDNLMCLPQGLQSLTALTILRIVGCRHLERRCR
RERGEDWPIIAHIPSIVIMSRGEYFFRGRRRPLGNLLTRVGDWTNGLSRK
FWKS*