Дата инженер

НИИ Восход

Дата инженер

Москва, улица Удальцова, 85

Метро: Мичуринский проспект

Описание вакансии

НИИ «ВОСХОД» — мультисервисный партнер государства в области информационных технологий с 1972 года. Мы создаем инновационные ИТ-решения для органов власти, внедряем и развиваем новые форматы эффективного взаимодействия между государством и обществом.

Институт специализируется на разработке и эксплуатации информационных систем, услугах в области информационной безопасности (в том числе создании средств криптографической защиты информации), а также разработке и развитии ИТ-архитектуры современных информационных систем и цифровых платформенных решений.


НИИ «ВОСХОД» включен в реестр аккредитованных ИТ-компаний и организаций оборонно-промышленного комплекса.

Ваши будущие задачи:

  • Участие в полном жизненном цикле данных: от интеграции источников и обеспечения качества данных до организации удобного доступа для аналитиков и data scientist-ов.
  • Проектирование, автоматизация и техническая эксплуатация отказоустойчивых и масштабируемых вычислительных процессов (пайплайнов) для сбора, проверки качества, нормализации, реструктуризации, обогащения больших данных (в том числе геоданных).
  • Развитие и оптимизация инфраструктуры данных компании: DWH, Data Lake, систем мониторинга и оркестрации.
  • Внедрение лучших практик инженерии данных (тестирование пайплайнов, мониторинг, версионирование, документирование).
  • Техническое лидерство и менторство в команде инженерии данных.
  • Взаимодействие со смежными командами (аналитики, ML-инженеры, разработчики) для понимания потребностей в данных и реализации эффективных решений.

Для нас важно:

  • Опыт разработки с использованием:
    • Python (библиотеки для работы с геоданными, для, анализа данных);
    • S3 (например, MinIO);
    • ClickHouse;
    • PostgreSQL, PL/pgSQL;
    • PostGIS;
    • Parquet (и друге популярные форматы: Iceberg, Avro, ORC, CSV);
    • Spark (API на Scala, PySpark);
    • Dagster (и другие популярные оркестраторы: AirFlow);
    • SQL;
    • ОС Linux;

  • Будет преимуществом:
    • Scala;
    • Shapefile;
    • JupyterLab (Jupyter Notebook);
    • Java;
    • Prometheus;
    • Graphana;
    • ELK;

  • Общее знакомство с:
    PostgREST;
     Kafka;
     Docker;
     Kubernetes;
     Istio;
     Hadoop;
     HashiCorp Terraform;
     RedHat Ansible
     Sonatype Nexus;
     Go;
     JavaScript.

  • Опыт развития систем обработки больших данных (сбор, нормализация, реструктуризация):
     Анализ потребностей и проектирование архитектуры ПО. Знакомство с DAMA DMBOK, BPMN, микросервисной архитектурой, REST API, Open API;
     Спецификация требований к ПО и данным, разработка логического дизайна ПО. Знакомство с C4, UML, ERD;
     Разработка физического дизайна и кода ПО для процессов обработки данных (пайплайнов);
     Отладка кода, участие в функциональном, нагрузочном, приёмочном тестированиях;
     Оптимизация унаследованного кода;
     Практика CI/CD;

  • Опыт технической эксплуатации систем обработки больших данных:
     Развёртывание и настройка процессов обработки данных;
     Мониторинг работы процессов обработки данных
     Устранение сбоев в работе процессов обработки данных;

  • Опыт обеспечения качества данных:
     Разработка и тестирование процедур проверки качества данных;
     Мониторинг исполнения и результатов процедур проверки качества данных;
     Участие в устранении инцидентов, связанных с качеством данных.

  • Опыт документирования.

Мы предлагаем:

  • Работу в команде профессионалов;
  • Стабильную белую и конкурентоспособную заработную плату;
  • График работы 5/2 с 9-18 либо с 10-19, в пятницу до 16-45/17-45 (формат работы гибрид или удаленно)
  • Оформление по ТК РФ;
  • Комфортный, просторный офис (м. Проспект Вернадского/Мичуринский проспект);
  • Возможность профессионального развития;
  • Отсутствие опен-спейсов и строгого дресс-кода;
  • Бесплатную охраняемую парковку на территории офиса;
  • Тренажерный зал в офисе.
Навыки
  • Data Engineer
  • ETL
  • ELT
  • DWH
  • Data Lake
  • Python
  • Dagster
  • Clickhouse Apache Airflow
  • Apache Spark
  • PySpark
  • GCP
  • DBT
  • Terraform
  • Data Pipeline
  • Data Quality
  • PostgreSQL
  • PostGIS
Посмотреть контакты работодателя

Адрес

Похожие вакансии

билайн

Data Engineer

билайн

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
1001 LABS

Data Engineer

1001 LABS

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
ДОМ.РФ

Data-инженер

ДОМ.РФ

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Okko
Удаленная работа
  • Москва

  • Не указана

Дата Дженерейшн

Data Engineer

Дата Дженерейшн

Удаленная работа
  • Москва

  • до 350000 RUR

Честный знак.рф
Удаленная работа
  • Москва

  • до 350000 RUR

WMT
Удаленная работа
  • Москва

  • до 250000 RUR

Flowwow
Удаленная работа
  • Москва

  • от 300000 RUR

ТЕХНОНИКОЛЬ

DataScience/ML-инженер

ТЕХНОНИКОЛЬ

Удаленная работа
  • Москва

  • от 300000 RUR

RateXAi Scoring Systems (ИП Гусев Юрий Михайлович)

Senior Data Engineer (Web3)

RateXAi Scoring Systems (ИП Гусев Юрий Михайлович)

Удаленная работа
  • Москва

  • до 5000 USD

ГК Орбита
Удаленная работа
  • Москва

  • до 5000 USD

Раппорто
Удаленная работа
  • Москва

  • до 5000 USD

ФосАгро

AI Engineer

ФосАгро

Удаленная работа
  • Москва

  • до 5000 USD

BORK
Удаленная работа
  • Москва

  • до 5000 USD

Бэнкс Софт Системс

Backend Developer (ML Engineer)

Бэнкс Софт Системс

Удаленная работа
  • Москва

  • до 5000 USD

Яндекс
Полный день
  • Москва

  • до 5000 USD

ARK
Полный день
  • Москва

  • до 5000 USD

МФК Фордевинд
Удаленная работа
  • Москва

  • от 250000 RUR

METASCAN
Удаленная работа
  • Москва

  • до 350000 RUR

Удаленная работа
  • Москва

  • до 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию