Tc04v2_t014510.1 | Cocoa Genome Hub

Overview


Name	Tc04v2_t014510.1
Unique Name	Tc04v2_t014510.1
Type	mRNA
Organism	Theobroma cacao (cacao)
Sequence length	2106

Properties


Property Name	Value
Model evidence	Supporting evidence includes similarity to: 8 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments
Product	DNA-directed RNA polymerase II subunit RPB1
Note	Uncharacterized protein

Cross References

External references for this mRNA


Database	Accession
GeneID	18602497
Genbank	XM_007033908.2

Relationships

This mRNA is a part of the following gene feature(s):


Feature Name	Unique Name	Species	Type
Tc04v2_g014510	Tc04v2_g014510	Theobroma cacao	gene

The following polypeptide feature(s) derives from this mRNA:


Feature Name	Unique Name	Species	Type
Tc04v2_p014510.1	Tc04v2_p014510.1	Theobroma cacao	polypeptide

The following exon feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
exon-auto227116	auto227116	Theobroma cacao	exon

The following CDS feature(s) are a part of this mRNA:


Feature Name	Unique Name	Species	Type
CDS-auto227117	auto227117	Theobroma cacao	CDS

Sequences

The following sequences are available for this feature:

mRNA sequence
protein sequence

mRNA sequence

>Tc04v2_t014510.1 ID=Tc04v2_t014510.1|Name=Tc04v2_t014510.1|organism=Theobroma cacao|type=mRNA|length=2106bp
ATGGCCTTCACCAGTTGTTTCTTATTGGCTTTCTCTATTGTTGTCATGCT
TTCAGGCATTGATACAAACTTGGCAGCTCGCTATCTGCTTGACAAGACAC
GGTCTCCAGCTCCATCTGTGCTGTCCGTGTCTGCTCCACAATCATCACTG
CCTCCGCACAGTTCAAAATCAAGTTTCACAGCACCTGCAGAGCCTCCTTT
GGCCGGCTCTCAACCATCCGTTTCTAGTTCCATGCCCAGTTCATCAGAAT
CAACGACACCATCCTCAGCTTCAGATAAACCATCTCTGCCTAATTCTACG
CCAAGCTTGACACAGCCCGCAGCAGCGCCTAAAGCTTCTACTCAGCCATC
TTTATCTAAAACAATCCCAAGCTCAACACAGCCCACACCCTCTCAGCAAG
CTTCCCGTAATTCAATCCCTGGCTCGAGAGAACCAACAATGGCTCCAATG
GGTTCCTCTCATCCGTCCTTGTCTAATACAGAGCCAAGCTTGACACAACC
CGCAATGTCACCTTTAGCTAATGCCCCACCATCTTCGTCTACTAATAATC
CATCTCTGTCCAATTCAACAAACAACTTGGCACAGCCTGCTGTGGCACCT
ATGGCTTCTACTCATCCGTCTTCTCCAGATAAAGTACCAAGTTTGGCAGT
GCCTGCTACCTCGCCTTCAGCTACTACCCAACCATCGTTGCCTACTAATA
ATTCACCTTCGTCCAATTCAATGCCAGGCTTGGCACAGCCTGCTATGGCA
CCTATGGATTCTACTCATCCATCTGCACCAGGTAAAGTGCCAAGCTTGGC
ACTGCCTGCAACGTCTCCTTCAGAAACTACCCAACCATCGTTGCCTAATC
CATCTTCGTCCAACTCAACATCAGGCTTGACACAACATGGAATGGCACCT
ATGGCTTCCTCTCTGCCATCTTCACCAGATAAGATGCCAAGCTTGACACT
GCCTGCAACATCACCTTCTGCTACCAGCCAACCATCTTTGCCTACTAATA
GTCCATCATTCTCCAATTCAACGCCAAGCTTGGCACAACCTGGAATGGCA
CCTATGGCTTCCTCTCAACCATCATTGTCAAACTCAACGCCGAGCTTGGG
ACTGCCTTCAATGTCGCCTTCTGCTACCAGCCAACCATCTTTACCTGCAA
ATATTCCATCGTTCTCCAACTCAACACCAAGCTTGGCACAACCTGGAATG
GCACCTATGGCTTCCTCTCAACCATCATTGTCAAACTCAACGCCAAGCTT
GGGACTGCCTTCGATGTCGCCTTCTGCTACCAGCCAACCATCTTTGCCCA
CAAATATTCCATCGTTCTCCAACTCAACACCAAGCTTGGCACAACCTGGA
ATGCCACCTATGTCTTCCTCGCAACCATCATTACCAAACTCAACGCCGAG
CTTGACACAACCTGGTATGGCACCAATGGCTTCGTCTCAACCATCATTGT
CAAATTCAACTCCAAGCTTGGGACTGCCTTCAATGTCGCCTTCTGCTACC
AGCCAACCATCTTTGCCTACAAATAGCCCATCGTTCTCCAACTCAACGTC
AAGCTTGACACAACCTGGAATGGCACCTATAGCTTCCTCTCAACCATCTT
CGCCTGATAAAATCCCAAGCTTGGCATTGCCTTCAAATTCACCTTCTAAT
ACCACCCAACCGTCGTTGCCTAACAATATTAATCCATCATTATCCAACTC
AACCCCAAGCTTGACACAACCTGCAATATCACCTTCAGCTCATCAAGCTT
CGCCCCAATCCTCAATGACACCTACGGCTTCACCAAATCATACATCTCCG
TCTAATATTGCACCGAAGGCTTCCTCGCAACCATCTTTACCAAACACGAC
TCCAAGCTCGACACAATCAGCAGTTGCGCCTTCTCCTACTGCTCATCCAT
CTTCGTCTAATACAACGTCAGGGTTAAAACAACCCGCGATGGCGCCGCCA
AGGACATCTGAGACACCTTTGCGTGGAGCTTCCTTGCCTCCACTTTCTGG
CATGAACCCCACTACGCCAACAAATGCAAGCACAACGCTACCGTCAATCC
CAACGAAAATCTCTTTCCCATTCCTTCCGCCACCATCTACCAAAACTAGG
CCTTGA

protein sequence of Tc04v2_p014510.1

>Tc04v2_p014510.1 ID=Tc04v2_p014510.1|Name=Tc04v2_p014510.1|organism=Theobroma cacao|type=polypeptide|length=702bp
MAFTSCFLLAFSIVVMLSGIDTNLAARYLLDKTRSPAPSVLSVSAPQSSL
PPHSSKSSFTAPAEPPLAGSQPSVSSSMPSSSESTTPSSASDKPSLPNST
PSLTQPAAAPKASTQPSLSKTIPSSTQPTPSQQASRNSIPGSREPTMAPM
GSSHPSLSNTEPSLTQPAMSPLANAPPSSSTNNPSLSNSTNNLAQPAVAP
MASTHPSSPDKVPSLAVPATSPSATTQPSLPTNNSPSSNSMPGLAQPAMA
PMDSTHPSAPGKVPSLALPATSPSETTQPSLPNPSSSNSTSGLTQHGMAP
MASSLPSSPDKMPSLTLPATSPSATSQPSLPTNSPSFSNSTPSLAQPGMA
PMASSQPSLSNSTPSLGLPSMSPSATSQPSLPANIPSFSNSTPSLAQPGM
APMASSQPSLSNSTPSLGLPSMSPSATSQPSLPTNIPSFSNSTPSLAQPG
MPPMSSSQPSLPNSTPSLTQPGMAPMASSQPSLSNSTPSLGLPSMSPSAT
SQPSLPTNSPSFSNSTSSLTQPGMAPIASSQPSSPDKIPSLALPSNSPSN
TTQPSLPNNINPSLSNSTPSLTQPAISPSAHQASPQSSMTPTASPNHTSP
SNIAPKASSQPSLPNTTPSSTQSAVAPSPTAHPSSSNTTSGLKQPAMAPP
RTSETPLRGASLPPLSGMNPTTPTNASTTLPSIPTKISFPFLPPPSTKTR
P*