Tc03v2_t019860.1 | Cocoa Genome Hub

Overview


Name	Tc03v2_t019860.1
Unique Name	Tc03v2_t019860.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	2931

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 3 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 15 samples with support for all annotated introns
Product	DNA repair endonuclease UVH1
Note	DNA repair endonuclease UVH1

Cross References

External references for this mRNA


Database	Accession
GeneID	18606146
Genbank	XM_018117922.1

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc03v2_g019860	Tc03v2_g019860	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc03v2_p019860.1	Tc03v2_p019860.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto182734	auto182734	Theobroma cacao	exon
exon-auto182735	auto182735	Theobroma cacao	exon
exon-auto182736	auto182736	Theobroma cacao	exon
exon-auto182737	auto182737	Theobroma cacao	exon
exon-auto182738	auto182738	Theobroma cacao	exon
exon-auto182739	auto182739	Theobroma cacao	exon
exon-auto182740	auto182740	Theobroma cacao	exon
exon-auto182741	auto182741	Theobroma cacao	exon
exon-auto182742	auto182742	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto182743	auto182743	Theobroma cacao	CDS
CDS-auto182744	auto182744	Theobroma cacao	CDS
CDS-auto182745	auto182745	Theobroma cacao	CDS
CDS-auto182746	auto182746	Theobroma cacao	CDS
CDS-auto182747	auto182747	Theobroma cacao	CDS
CDS-auto182748	auto182748	Theobroma cacao	CDS
CDS-auto182749	auto182749	Theobroma cacao	CDS
CDS-auto182750	auto182750	Theobroma cacao	CDS
CDS-auto182751	auto182751	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc03v2_t019860.1 ID=Tc03v2_t019860.1|Name=Tc03v2_t019860.1|organism=Theobroma cacao|type=mRNA|length=2931bp
ATGGTCTTGAAATTCCACGAACAAATAGTCTCCGACCTCCTCCAAGACCC
AAACGGCGGCCTTGTAATCCTTTCTTCCGGCCTTTCCCTCCCTAAACTAC
TCTCTTCTTTCCTCTCTTTCCACTCCCAATCGAACGGCTCCCTCCTCCTC
CTCCACTCCCCTCAATTCTCCTCCTCCCTCAAATCCCTCCTCCTTTCCCT
CTCCCCCAACCTCCCGCTCTCAGAAATTACCGCCGACCTACCTTCCTCCA
ACCGCCTCTCGCTCTACTCCTCCAATCGAGTCCTCCTCCTCTCCCCTCGT
ATCCTCATCGTCGACCTCTTAACCCAAAAGGCCCAAACTTCCTTAATTTC
CGGTGTCATTTTCCTCAACACCCATTCGCTCTCCGAAAGCTCAACTGAAT
CTTTCATTGTGAGAATCATCAAAACATTCAATAAAAATGCTTCTGTTTAC
GCGTTTTCAGACAAGCCTCACTCTATGGTTTCTGGGTTCGCGAAAACGGA
GAGGATAATGAAGAGTTTGTTCATTAAAAAGCTTCATCTTTGGCCGAGGT
TTCAAGTGAATGTATCGGAGGAATTGGAGAGGGATCCGCCTGAAGTGGTG
GATATAAGGGTGCCGATGAGTAAATACATGGTGGGGATTCAAAAGGCGAT
TGTGGAAGTCATGGATGCTTGTTTGAAGGAAATGAGGAAGACTAATAAGG
TTGATGTGGAGGACCTGACGTTGGAGAATGGGTTGTTTAAGTCATTTGAT
GAGATTGTGAGGAGACAATTGGATCCCATTTGGCATACTTTGGGGAAGAA
GACGAAGCAGCTCGTTTCGGATTTGAAGACTTTGAGGAAGTTGTTGGACT
ATCTTGTTAGGTATGATGCGGTGAGTTATTTGAAGTATTTGGATACGCTT
AGAGTGTCAGAGAGTTTTCGGTCTGTTTGGATATTTGCAGAGTCCAGTTA
TAAGATATTTGACTATGCAAGGAAGCGAGTTTATTGTTTTTCAAGGTCAG
ATGGAACCAAAATTAATAAGCCTAGTAAGAACGTGTCTGGCAAAAAGAGA
AAATTGAAGGAGGATGGTAGTATTAACGAAGGAGCAATTGCTGGTACTTC
ATCAACAGGTACAAGTAATGGAGTTGTTCTCGAAGAAGTTTTGGAAGAGC
CTCCAAAGTGGAAGGTGTTACGTGAGGTTCTTGAGGAGATAGAAGAGGAA
AGACAAAAGCAAGCATCATCAGAAGAACTTCTTTTGGATGTCGGAGAGGA
CAATAATGGAATTGTTTTAGTGGCGTGCAAAGATGAGTGCTCGTGCATGC
AACTTGAAGATTGCATTACTAACAGCCCACAAAAGGTCATGAGGGATGAA
TGGGAGAAATACCTCTTAAGCAAAGTAGAACTCCGTAGTGTGCAAACATC
TCACAAGAAAAAACCTAAAAAACCTAAAACACCTAAAGGTTATGGGATTC
TTGATGGTATTGTTCCTGTTACGTCTGCCCAAAATGCAGAACCTAGCAGT
GCATGCAAGCAGGAACATGAAGCATTGTTAGCAGCGGCATCAGAATTAAG
AAGAAACCAGACTAAAATGGAAAATGATGCTGCAGATGATCCTGAACCTC
ATGTTGGCAGCCGAGGACATGGGAAAGGAAGGGGAAGAGGAAGGATTAAA
AAAGGCCCTGCAAATACACGGTGTTCTAGGAATAAAGATGGCTCTCATAG
CACTGAGGCAGCAACAGATGATAGACCTGAAATTTCTGTTTCAGAAAATG
AAGGTCATAGAAATGAAATTAACCCTACTATTGGCAATGGGCTTTTTAGG
AAGCATATTGACAGGATTGATGATACGAAAACTGACAACTCTAAGCAATT
ACCACCTGTCCACTTTCATGCTCTGGAGAGAGATCAGCCTATACTAGATG
TGTTGAAGCCCTCTGTAATTATTGTTTACCATCCAGATACGACTTTTGTT
AGGGAAATTGAAGTCTACAAAGCAGAGAATCCTGGAAAAAGGTTGAAGGT
CTATTTTCTTTTCTATGAAGCTTCTACTGAAGTCCAAAAGTTTGAAGCAA
GTATTCGTAGAGAAAATGGAGCATTTGAATCCTTGATCCGGCAGAAATCA
ATGATGATGATTCCTGTTGATCAGGATGGGTTCTGCCTTGGTTCTAATTC
TTCCTCAGACCTACAAGGTTCAAGTTCCCAGAACTCAATCACTAGAAAGG
CAGGTGGAAGAAAGGAAGCTGAGAAAGAAAAGCAGGTTGTAGTGGACATG
AGGGAGTTCATGAGTAGTCTTCCAAATGTGCTCCATCAGAAGGGCATGCG
CATAATCCCAGTTACCTTAGAAGTTGGAGATTATGTTCTCTCACCACTTA
TTTGTGTTGAGAGGAAAAGCATTCAAGATCTTTTTATGAGTTTCACATCA
GGCCGCCTTTACCACCAAGTGGAGACTATGGTTCGTTATTATCGAATACC
AGTTCTTCTAATTGAGTTTTCACAAGACAAAAGCTTTTCATTTCAGTCTG
CAAGTGACATTGGGGATGATGTAACACCAAATAATATCATATCCAAACTG
TCATTACTTGTTCTGCATTTTCCCCGCCTACGAATCCTCTGGTCTCGCAG
CTTGCATGCAACTGCTGAAATATTTGCTTCTCTTAAGGCAAATCAGGATG
AACCTGATGAGGCAAAGGCAATGAGAGTGGGTGTACCCTCCGAAGAGGGT
TTCATAGAAAATGATGTTAGAGCTGAGAACTACAATACATCTGCTGTTGA
GTTTCTGAGACGACTTCCAGGAGTGACAGATTCTAACTACAGGGCTATAA
TGGATGGATGTAAGAGCTTGGCCGAACTTGCACTTCTTCCTATGGAGAAG
CTAGCTGAACTAATGGGTGGTCGGAAAGCTGCTCAGACTCTAAGAGATTT
CCTTGATGCAAAGTGTCCAACCTTGTTGTGA

protein sequence of Tc03v2_p019860.1

>Tc03v2_p019860.1 ID=Tc03v2_p019860.1|Name=Tc03v2_p019860.1|organism=Theobroma cacao|type=polypeptide|length=977bp
MVLKFHEQIVSDLLQDPNGGLVILSSGLSLPKLLSSFLSFHSQSNGSLLL
LHSPQFSSSLKSLLLSLSPNLPLSEITADLPSSNRLSLYSSNRVLLLSPR
ILIVDLLTQKAQTSLISGVIFLNTHSLSESSTESFIVRIIKTFNKNASVY
AFSDKPHSMVSGFAKTERIMKSLFIKKLHLWPRFQVNVSEELERDPPEVV
DIRVPMSKYMVGIQKAIVEVMDACLKEMRKTNKVDVEDLTLENGLFKSFD
EIVRRQLDPIWHTLGKKTKQLVSDLKTLRKLLDYLVRYDAVSYLKYLDTL
RVSESFRSVWIFAESSYKIFDYARKRVYCFSRSDGTKINKPSKNVSGKKR
KLKEDGSINEGAIAGTSSTGTSNGVVLEEVLEEPPKWKVLREVLEEIEEE
RQKQASSEELLLDVGEDNNGIVLVACKDECSCMQLEDCITNSPQKVMRDE
WEKYLLSKVELRSVQTSHKKKPKKPKTPKGYGILDGIVPVTSAQNAEPSS
ACKQEHEALLAAASELRRNQTKMENDAADDPEPHVGSRGHGKGRGRGRIK
KGPANTRCSRNKDGSHSTEAATDDRPEISVSENEGHRNEINPTIGNGLFR
KHIDRIDDTKTDNSKQLPPVHFHALERDQPILDVLKPSVIIVYHPDTTFV
REIEVYKAENPGKRLKVYFLFYEASTEVQKFEASIRRENGAFESLIRQKS
MMMIPVDQDGFCLGSNSSSDLQGSSSQNSITRKAGGRKEAEKEKQVVVDM
REFMSSLPNVLHQKGMRIIPVTLEVGDYVLSPLICVERKSIQDLFMSFTS
GRLYHQVETMVRYYRIPVLLIEFSQDKSFSFQSASDIGDDVTPNNIISKL
SLLVLHFPRLRILWSRSLHATAEIFASLKANQDEPDEAKAMRVGVPSEEG
FIENDVRAENYNTSAVEFLRRLPGVTDSNYRAIMDGCKSLAELALLPMEK
LAELMGGRKAAQTLRDFLDAKCPTLL*