NO04G04560, NO04G04560 (gene) Nannochloropsis oceanica | NanDeSyn: Nannochloropsis Design & Synthesis Initiative

Overview


Name	NO04G04560
Unique Name	NO04G04560
Type	gene
Organism	Nannochloropsis oceanica (N. oceanica IMET1)
Sequence length	1346
Alignment location	chr4:1242989..1244334 +

Link to JBrowse

Properties


Property Name	Value
Description	Cysteine proteinase

Mutants

Expression

Analysis:

Hover the mouse over a column in the graph to view expression values.
Sort Descending | Sort Ascending | Only Non-Zero Values | Tile/Chart | Reset

Alignments

The following features are aligned


Aligned Feature	Feature Type	Alignment Location
chr4	genome	chr4:1242989..1244334 +

Analyses

This gene is derived from or has results from the following analyses


Analysis Name	Date Performed
PRJNA769958	2024-08-13
GSE178672	2023-12-15
PRJNA933693	2023-10-26
PRJNA943449	2023-07-19
GSE149904	2020-10-10
NoIMET1_WT_HS	2020-09-29
GSE139615	2020-03-11
PRJNA241382	2020-03-11
BLASTP analysis of N. oceanica IMET1 genes	2019-07-11
InterPro analysis for N. oceanica IMET1 genes	2019-07-11
GO annotation for IMET1v2 genes	2019-07-10
PRJNA182180	2019-04-25
Gene prediction for N. oceanica IMET1	2017-10-24

Annotated Terms

The following terms have been associated with this gene:

Vocabulary: **Biological Process**
Term	Definition
GO:0006508	proteolysis
GO:0006508	proteolysis

Vocabulary: **Molecular Function**
Term	Definition
GO:0008234	cysteine-type peptidase activity
GO:0008234	cysteine-type peptidase activity

Vocabulary: **INTERPRO**
Term	Definition
IPR038765	Papain_like_cys_pep_sf
IPR013128	Peptidase_C1A
IPR000668	Peptidase_C1A_C

Homology

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: XP_009032695.1 (hypothetical protein AURANDRAFT_19240 [Aureococcus anophagefferens] >EGB13096.1 hypothetical protein AURANDRAFT_19240 [Aureococcus anophagefferens])

HSP 1 Score: 183.7 bits (465), Expect = 5.500e-43
Identity = 86/175 (49.14%), Postives = 116/175 (66.29%), Query Frame = 0

Query:    3 TPGLVSAAMAPYVESMYEE--CLSPRCTEKCRNRQIGNLTKAEEYEALTGFYVSIAGWSYGTPPCDDACDAQDLDLLKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEPYFVVRNSWSTLWGMDGHIRLSSRNNTCGLANEVTFVSIAPEE 176
            TPGL +    PYV+ M  +  CLSP+CTE CR    G  T+ EE   LTG Y  +A +S+ T  C D C+ QDL  L+  VA +GPASICVNA +W +Y  GV+ T  CGSY ++ LDHCV +VG+N ++  PY++V+N WST WG+DG+I L +RNNTCG+A+  TF  + P +
Sbjct:   70 TPGLSNLWYYPYVQGMGSQRTCLSPKCTETCR----GIGTEVEE-TLLTGVYAQVANYSWATKGCFDDCEDQDLYGLRKAVAAHGPASICVNAANWDVYAGGVMSTATCGSYNFNDLDHCVGLVGFNMDSDPPYWIVKNQWSTTWGVDGYIFLDARNNTCGVADTATFAKVFPPD 239

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: KOO22621.1 (cysteine proteinase [Chrysochromulina sp. CCMP291])

HSP 1 Score: 136.7 bits (343), Expect = 7.600e-29
Identity = 68/169 (40.24%), Postives = 97/169 (57.40%), Query Frame = 0

Query:    5 GLVSAAMAPYVESMYEECLSPRCTEKCRNRQIGNLTKAEEYEALTGFYVSIAGWSYGTPPC-DDACDAQDLDLLKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEPYFVVRNSWSTLWGMDGHIRLSSRNNTCGLANEVTFVSIA 173
            GL ++   PY++S+     +   T+ C   ++  +        LTG Y +++G+ Y T PC   AC  QDL  L+A + E  P S+CVNA SW  Y  GV+ + ACGS A  + DHCV   G+N  AP PY++VRNSWS+ WG  G+I L    NTCG+A++ T   +A
Sbjct:  199 GLTNSFNYPYMQSL----TATSATQACNTAKVAAID--GPMMQLTGGYAAVSGYHYATTPCTSGACANQDLAALQAAI-ETTPVSVCVNAASWNDYTGGVMTSAACGSMAAKAQDHCVMATGFNTTAPTPYWIVRNSWSSTWGEYGYIYLEMAENTCGIADDATIPEVA 360

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: OLQ02337.1 (Digestive cysteine proteinase 2 [Symbiodinium microadriaticum])

HSP 1 Score: 129.8 bits (325), Expect = 9.300e-27
Identity = 61/138 (44.20%), Postives = 83/138 (60.14%), Query Frame = 0

Query:   45 YEALTGFYVSIAGWSYGTPPC-DDACDAQDLDLLKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEPYFVVRNSWSTLWGMDGHIRLSSRNNTCGLANEVTFVSIAPEEEEEGGR 182
            Y  L+G Y ++ G+SY   PC + +C+ QDL+ L A   E  P S+CVNA  W  Y  GVL + ACG       DHCV  VG+N  AP+PY++VRNSW++ WGM G+I L    NTCG+A++ T   +  +  EE  R
Sbjct: 2692 YMQLSGGYAAVTGYSYAVKPCTEGSCENQDLNGLAA-ALEQSPISVCVNAGVWNDYTGGVLSSAACGPMGAAYQDHCVMAVGFNATAPKPYWIVRNSWASTWGMQGYIYLEMAKNTCGVADDATIPEVKVDLSEEEAR 2828

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: XP_009040822.1 (hypothetical protein AURANDRAFT_5922, partial [Aureococcus anophagefferens] >EGB04435.1 hypothetical protein AURANDRAFT_5922, partial [Aureococcus anophagefferens])

HSP 1 Score: 124.0 bits (310), Expect = 5.100e-25
Identity = 74/181 (40.88%), Postives = 89/181 (49.17%), Query Frame = 0

Query:   10 AMAPYVESMYEECLSPRCTEK-----CRNRQIGNLTKAEEYEALT---GFYVSIAGWSY----------GTPPCDDACDAQDLDLLKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPE-PYFVVRNSWSTLWGMDGHIRLSSRNNTCGLANEVTFVSI 172
            A AP VE   ++  S  CT       C     G+ T A EY A     G     A W Y            P C   CD  D D L A + E  P S+C+NA +W  Y  GVL   ACG +  D +DHCV +VGYN   PE  Y++VRNSWST WG DG+I LS   N CG+ANE T   +
Sbjct:   53 AGAPQVELSTQQVAS--CTADPQLMCCDGCAGGDPTAAYEYLAWASRKGGLAPDAWWPYEQGLTPDEVCEAPACTKTCDKDDTDQLAARL-EASPLSVCLNAGAWDDYTGGVLSEAACGGHGADDVDHCVQLVGYNKTEPENSYWIVRNSWSTSWGEDGYIYLSMDGNACGVANEATLAVV 230

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: BAK00754.1 (predicted protein [Hordeum vulgare subsp. vulgare])

HSP 1 Score: 121.3 bits (303), Expect = 3.300e-24
Identity = 51/117 (43.59%), Postives = 72/117 (61.54%), Query Frame = 0

Query:   55 IAGWSYGTPPCDDACDAQDLDLLKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEPYFVVRNSWSTLWGMDGHIRLSSRNNTCGLANEVTFVSI 172
            I+G+ Y  P C D+C  QD + +   + E  P S+CV+AE W  Y  G++  + C S  +  LDHCV  VGY+    +PY++VRNSW+T WG DG IRL+   NTCG+ +  T+V I
Sbjct:  226 ISGFGYAIPTCSDSCTNQDENSMAQYMQENSPLSVCVDAEPWQFYSSGIMTVDQCPS-DFSGLDHCVQAVGYDATGSQPYWIVRNSWNTNWGEDGFIRLALGTNTCGIGDVATYVKI 341

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: XP_009032801.1 (hypothetical protein AURANDRAFT_18666 [Aureococcus anophagefferens] >EGB13210.1 hypothetical protein AURANDRAFT_18666 [Aureococcus anophagefferens])

HSP 1 Score: 118.6 bits (296), Expect = 2.200e-23
Identity = 57/147 (38.78%), Postives = 81/147 (55.10%), Query Frame = 0

Query:   37 GNLTKAEEYEALTGFYVSIAGWSYGTPPCDDA-CDAQDLDLLKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEP-----------YFVVRNSWSTLWGMDGHIRLSSRNNTCGLANEVTFVSI 172
            GN  + +++E   G    +  +SY  P C    C+ QD D + A +A +GPASICVNA +W  Y +GV+    CGS+A ++LDHCV +VGY     +             + VRNSW T WG  G+IR+    N CG+AN+ TF  +
Sbjct:  202 GNTGRCKKFETAGG---DVESFSYVVPECKKGKCNDQDEDKMAAALASHGPASICVNAGAWQTYTKGVMTNLQCGSHAANALDHCVQVVGYTGYTGDAKACGKGLKDKCVWNVRNSWGTSWGYQGYIRVQMGKNACGIANDATFAKV 345

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: XP_009037507.1 (hypothetical protein AURANDRAFT_5846, partial [Aureococcus anophagefferens] >EGB07772.1 hypothetical protein AURANDRAFT_5846, partial [Aureococcus anophagefferens])

HSP 1 Score: 109.0 bits (271), Expect = 1.700e-20
Identity = 63/161 (39.13%), Postives = 80/161 (49.69%), Query Frame = 0

Query:    5 GLVSAAMAPYVESMY--EECLSPRCTEKCRNRQIGNLTKAEEYEALTGFYVSIAGWSYGTPPCDDACDAQDLDLLK-ANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEPYFVVRNSWSTLWGMDGHIRLSSRNNTCGL 163
            GL  AA  PY +++   EECL P CT  C                                      D  +LDL + A   +  PA++CVNA +W  Y  GVL  +AC S AY  +DHCV +VGY+    EPY++VRNSWST WG DG+IRL    NTCG+
Sbjct:   85 GLSPAAYWPYTQALTPDEECLGPFCTNAC------------------------------------DMDLSELDLGELAKTIQATPAAVCVNAGAWDDYTGGVLRYDAC-SGAYADIDHCVQLVGYDATGEEPYWIVRNSWSTSWGEDGYIRLQMDANTCGV 208

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: XP_013762925.1 (cruzipain [Thecamonas trahens ATCC 50062] >KNC45942.1 cruzipain [Thecamonas trahens ATCC 50062])

HSP 1 Score: 105.5 bits (262), Expect = 1.900e-19
Identity = 52/117 (44.44%), Postives = 68/117 (58.12%), Query Frame = 0

Query:   55 IAGWSYGTPPCDDACDAQDLDLLKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEPYFVVRNSWSTLWGMDGHIRLSSRNNTCGLANEVTFVSI 172
            I G++Y T P       ++   L AN+   GP SICV+A SW  Y  G+L      S+    LDHCV I G+  +  E Y+ VRNSW+T WGM G+I+L    NTCGLA+E T V+I
Sbjct:  222 IMGYNYATSP-----STKNETQLAANLMSTGPVSICVDASSWQTYTSGIL------SHCGKQLDHCVQITGWGTSGSEMYWWVRNSWATSWGMSGYIQLKFGQNTCGLADEATIVTI 327

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: XP_004363040.1 (hypothetical protein DFA_03437 [Cavenderia fasciculata] >EGG25189.1 hypothetical protein DFA_03437 [Cavenderia fasciculata])

HSP 1 Score: 104.0 bits (258), Expect = 5.500e-19
Identity = 49/100 (49.00%), Postives = 64/100 (64.00%), Query Frame = 0

Query:   77 LKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPE--PYFVVRNSWSTLWGMDGHIRLSSRNNTCGLANEVTFVSIAPE 175
            L+  +A  GP SICVNAE W  Y  G+       S   D LDHCV IVGY+ +A    PYF+VRNSW T WG+ G+I + + +N CG+ NEVT+VS+ P+
Sbjct:  236 LREAMAARGPLSICVNAEPWMSYQSGIF-----SSTCSDDLDHCVQIVGYDTDATSKTPYFIVRNSWGTDWGLLGYIYIQAGSNLCGITNEVTYVSVHPD 330

[Close]

BLAST of NO04G04560 vs. NCBI_GenBank
Match: OLP78299.1 (Serine/threonine-protein kinasePKR2 [Symbiodinium microadriaticum])

HSP 1 Score: 102.1 bits (253), Expect = 2.100e-18
Identity = 52/136 (38.24%), Postives = 71/136 (52.21%), Query Frame = 0

Query:   45 YEALTGFYVSIAGWSYGTPPC-DDACDAQDLDLLKANVAEYGPASICVNAESWGLYVEGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEPYFVVRNSWSTLWGMDGHIRLSS-RNNTCGLANEVTFVSIAPEEEEE 179
            Y  L+G Y ++ G+SY   PC + +C+ Q                  VNA  W  Y  GVL   ACG       DHCV  VG+N  AP+PY++VRNSW++ WGM G+I L     NTCG+A++ T   +  +  EE
Sbjct: 1322 YMQLSGGYAAVTGYSYAVKPCTEGSCENQ------------------VNAGVWNDYTGGVLSAAACGPMGAAYQDHCVMAVGFNATAPKPYWIVRNSWASTWGMQGYIYLEMVAKNTCGVADDATIPEVKVDLSEE 1439

The following BLAST results are available for this feature:

BLAST of NO04G04560 vs. NCBI_GenBank

BLAST of NO04G04560 vs. NCBI_GenBank
Analysis Date: 2019-07-11 (BLASTP analysis of N. oceanica IMET1 genes)
Total hits: 20


Match Name	E-value	Identity	Description
XP_009032695.1	5.500e-43	49.14	hypothetical protein AURANDRAFT_19240 [Aureococcus...	[more]
KOO22621.1	7.600e-29	40.24	cysteine proteinase [Chrysochromulina sp. CCMP291]	[more]
OLQ02337.1	9.300e-27	44.20	Digestive cysteine proteinase 2 [Symbiodinium micr...	[more]
XP_009040822.1	5.100e-25	40.88	hypothetical protein AURANDRAFT_5922, partial [Aur...	[more]
BAK00754.1	3.300e-24	43.59	predicted protein [Hordeum vulgare subsp. vulgare]	[more]
XP_009032801.1	2.200e-23	38.78	hypothetical protein AURANDRAFT_18666 [Aureococcus...	[more]
XP_009037507.1	1.700e-20	39.13	hypothetical protein AURANDRAFT_5846, partial [Aur...	[more]
XP_013762925.1	1.900e-19	44.44	cruzipain [Thecamonas trahens ATCC 50062] >KNC4594...	[more]
XP_004363040.1	5.500e-19	49.00	hypothetical protein DFA_03437 [Cavenderia fascicu...	[more]
OLP78299.1	2.100e-18	38.24	Serine/threonine-protein kinasePKR2 [Symbiodinium ...	[more]

Pages

Relationships

This gene is member of the following syntenic_region feature(s):


Feature Name	Unique Name	Species	Type
nonsL082	nonsL082	Nannochloropsis oceanica (N. oceanica IMET1)	syntenic_region
nonsL080	nonsL080	Nannochloropsis oceanica (N. oceanica IMET1)	syntenic_region
nonsL078	nonsL078	Nannochloropsis oceanica (N. oceanica IMET1)	syntenic_region
ncniR058	ncniR058	Nannochloropsis oceanica (N. oceanica IMET1)	syntenic_region
ngnoR110	ngnoR110	Nannochloropsis oceanica (N. oceanica IMET1)	syntenic_region
ngnoR108	ngnoR108	Nannochloropsis oceanica (N. oceanica IMET1)	syntenic_region

The following polypeptide feature(s) derives from this gene:


Feature Name	Unique Name	Species	Type
NO04G04560.1	NO04G04560.1-protein	Nannochloropsis oceanica (N. oceanica IMET1)	polypeptide

The following mRNA feature(s) are a part of this gene:


Feature Name	Unique Name	Species	Type
NO04G04560.1	NO04G04560.1	Nannochloropsis oceanica (N. oceanica IMET1)	mRNA

Sequences

The following sequences are available for this feature:

gene sequence
protein sequence

gene sequence

>NO04G04560 ID=NO04G04560|Name=NO04G04560|organism=Nannochloropsis oceanica|type=gene|length=1346bp
ATGCAGACCCCGGGGCTGGTGAGCGCCGCCATGGCCCCTTATGTCGAGAG
CATGTACGAGGAGTGTCTGTCGCCGCGATGCACGGAAAAATGCCGCAACC
GGCAGATTGGGAACCTGACCAAGGCGGAGGAGTACGAGGCATTGACTGgt
acgtacgtacgtacgtgtgtacctggaatgtggatttgtatgtgggtggt
aatcaatggcgtgggtgtttgtcgtactcgtgtgtatgtgggtatgtgtg
tgtatgtaaaggtgtgtgggaatgggttagagatgaaggaaggaaagacg
ggcatgccattgtcccacgtgaagactttccccccttattcatccccccc
ccctccctccctccctccacctacatttctcgactccgcacacatacttt
ccctctgtccctcccactcgtcgttctccaattcccttccacaacactca
agagtccctccctcccgccctcccccctccttccctagGATTCTACGTCT
CTATCGCCGGCTGGTCCTACGGCACTCCGCCCTGCGACGACGCCTGCGAC
GCGCAAGACCTTGACCTCTTGAAGGCGAATGTGGCGGAATATGGGCCCGC
CTCCATATGTGTCAACGCCGAGAGCTGGGGGTTGTACGTCGAGgtacgtc
gtctcccgccctcctgccctccctccctccctccctccccccccctcttt
ctttcttcatcccttcctcctcccctctctttctcccttcttccctccct
cctccccattattcttctgcagggtgtgctgatgaccgaggtctgcggag
gccacggctacaacttatctctccctccctccctcccttcctctttcccg
ctctccccctcttagGGTGTACTAATGACGGAGGCTTGCGGGAGCTACGC
CTACGATTCTCTCGATCACTGCGTCAATATTGTGGGATACAATGACAACG
CACCCGAGCCGTATTTCGTGgtcagtcctcagccctccccccctccccca
ttatctccttgagcattctatctccttgatcactgatgtctgaatggcgc
tcgaccacacccctccctcaatcccttctccctccttccccttctctccc
cctccctccctcctcccctccttcgccccctccctccctccctccttcgc
cccctcccagGTTCGTAATTCGTGGTCAACCTTGTGGGGTATGGATGGCC
ATATCCGCCTGTCATCGAGGAACAACACATGCGGCTTGGCCAACGAGGTG
ACGTTTGTCTCGATCGCACCGGAGGAGGAGGAGGAGGGGGGGAGAATGAG
GGAGGGGGGCGGGGATGGAGACAGGGAGGGAAGAGGCGATAACTGA

protein sequence of NO04G04560.1

>NO04G04560.1-protein ID=NO04G04560.1-protein|Name=NO04G04560.1|organism=Nannochloropsis oceanica|type=polypeptide|length=198bp
MQTPGLVSAAMAPYVESMYEECLSPRCTEKCRNRQIGNLTKAEEYEALTG
FYVSIAGWSYGTPPCDDACDAQDLDLLKANVAEYGPASICVNAESWGLYV
EGVLMTEACGSYAYDSLDHCVNIVGYNDNAPEPYFVVRNSWSTLWGMDGH
IRLSSRNNTCGLANEVTFVSIAPEEEEEGGRMREGGGDGDREGRGDN*

Synonyms

Publications