Founding ML / Systems Engineer

Founding ML / Systems Engineer

Москва

Метро: Библиотека им.Ленина

Описание вакансии

О компании

Мы строим интеллектуальный вычислительный слой для биологии.

Современная биоинформатика опирается на мощные, но разрозненные инструменты (Scanpy, Seurat, RAPIDS, Parabricks). При этом:

  • пайплайны фрагментированы
  • решения принимаются вручную
  • методы часто применяются “вслепую”
  • вычисления не оптимальны по скорости и стоимости

Наша цель — изменить это.

Мы создаём систему, которая:

  • анализирует биологические датасеты
  • автоматически выбирает оптимальный пайплайн
  • управляет CPU / GPU / sparse вычислениями
  • измеряет производительность и стоимость
  • проверяет корректность биологического результата

В долгосрочной перспективе это приведёт к созданию нативного вычислительного стека для биологии — от софта до облака и специализированного железа.

Роль

Мы ищем технического лида, который возглавит разработку ключевой платформы.

Это роль уровня 0→1. Вам предстоит:

  • спроектировать архитектуру системы
  • определить стратегию оптимизации
  • построить core performance layer
  • сформировать инженерную культуру

Вы будете работать напрямую с фаундером и найчным лидом по биологии, превращая сложную техническую идею в реальный продукт для биотеха и фармы.

Что вы будете строить

🔹 Краткосрочно (0–6 месяцев)

  • MVP BioCompute Optimizer:
    • оркестрация CPU vs GPU
    • движок выполнения пайплайнов
    • слой бенчмаркинга и метрик
  • Интеграции с:
    • Scanpy / Seurat
    • RAPIDS / cuML
  • Улучшение:
    • скорости выполнения
    • потребления памяти
    • стоимости вычислений

🔹 Среднесрочно (6–18 месяцев)

  • Продвинутый оптимизатор:
    • dataset-aware execution planning
    • работа с разреженными данными (CSR / CSC)
    • approximate алгоритмы (KNN, графы)
  • Распределённые вычисления:
    • multi-GPU
    • кластерные системы
  • Продакшн-система:
    • API
    • облачная платформа
    • enterprise deployment

🔹 Долгосрочно

  • Собственные ядра (kernels) для биологических задач
  • BioSparse / BioGraph compute engines
  • Оптимизация под конкретное железо
  • Движение к специализированной вычислительной архитектуре для биологии

Технологический стек и задачи

Вы будете работать с:

  • GPU-программированием (CUDA, Triton, cuML, CuPy)
  • Оптимизацией разреженных матриц (CSR / CSC)
  • Графовыми алгоритмами (KNN, clustering)
  • Оркестрацией пайплайнов
  • Управлением памятью и перемещением данных
  • Распределёнными вычислениями
  • Performance benchmarking

Идеальный кандидат

Обязательно:

  • 5–10+ лет опыта в инженерии
  • Сильное системное мышление
  • Опыт в одной из областей:
    • GPU / HPC
    • ML-инфраструктура
    • высоконагруженные системы
  • Опыт построения performance-critical систем

Плюс:

  • CUDA / Triton
  • ML-инфраструктура (PyTorch, JAX, distributed training)
  • Численные методы / scientific computing
  • Работа с большими данными

Дополнительный плюс:

  • Опыт в биоинформатике / геномике
  • RAPIDS, FAISS, графовые системы
  • Стартап-опыт

Что для нас важнее всего

  • Умение мыслить с первых принципов
  • Чувство узких мест в производительности
  • Комфорт с неопределённостью
  • Способность быстро реализовывать решения

Не подойдёт, если вы:

  • Предпочитаете только исследовательскую работу без продуктовой части
  • Хотите работать по заранее заданному плану
  • Не готовы к условиям ранней стадии стартапа

Почему это интересно

Биология становится одной из самых data-intensive индустрий, но её вычислительный стек сильно отстаёт.

Это возможность:

  • создать новую категорию (BioCompute layer)
  • работать на стыке:
    • AI
    • системного программирования
    • life sciences
  • построить инфраструктуру, которая может стать стандартом в индустрии
  • возможность переезда зарубеж

Условия

  • Значимая доля (equity)
  • Зарплата — обсуждается
  • География — гибкая
Навыки
  • Английский язык
  • Математическая статистика
  • GitHub
  • Машинное обучение
  • Kubernetes
  • Python
  • Big Data
  • PyTorch
  • CUDA
  • triton
  • JAX
  • distributed training
  • ML-инфраструктура
  • высоконагруженные системы
  • scientific computing
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Инженер ПТО

Товарищество Бахрушиных

  • Москва

  • от 50000 RUR

Рекомендуем
Эксперт Коми
  • Москва

  • от 50000 RUR

Рекомендуем
  • Москва

  • от 50000 RUR

Рекомендуем
Volna.tech

SRE-инженер

Volna.tech

  • Москва

  • до 130000 RUR

Бауманский учебный центр Специалист

Тренер/ментор курсов по OSINT и социальной инженерии

Бауманский учебный центр Специалист

  • Москва

  • до 130000 RUR

АСГ
  • Москва

  • от 80000 RUR

АСГ
  • Москва

  • от 80000 RUR

Волкова Таиса Александровна

Инженер ПТО / Ведущий инженер ПТО

Волкова Таиса Александровна

  • Москва

  • от 80000 RUR

  • Москва

  • от 100000 RUR

Devhunt
  • Москва

  • от 100000 RUR

Экокомерс
  • Москва

  • от 100000 RUR

  • Москва

  • от 100000 RUR

ПрофиПроект Групп

Инженер-проектировщик ОВиК

ПрофиПроект Групп

  • Москва

  • от 180000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию