О компании
Мы строим интеллектуальный вычислительный слой для биологии.
Современная биоинформатика опирается на мощные, но разрозненные инструменты (Scanpy, Seurat, RAPIDS, Parabricks). При этом:
- пайплайны фрагментированы
- решения принимаются вручную
- методы часто применяются “вслепую”
- вычисления не оптимальны по скорости и стоимости
Наша цель — изменить это.
Мы создаём систему, которая:
- анализирует биологические датасеты
- автоматически выбирает оптимальный пайплайн
- управляет CPU / GPU / sparse вычислениями
- измеряет производительность и стоимость
- проверяет корректность биологического результата
В долгосрочной перспективе это приведёт к созданию нативного вычислительного стека для биологии — от софта до облака и специализированного железа.
Роль
Мы ищем технического лида, который возглавит разработку ключевой платформы.
Это роль уровня 0→1. Вам предстоит:
- спроектировать архитектуру системы
- определить стратегию оптимизации
- построить core performance layer
- сформировать инженерную культуру
Вы будете работать напрямую с фаундером и найчным лидом по биологии, превращая сложную техническую идею в реальный продукт для биотеха и фармы.
Что вы будете строить
🔹 Краткосрочно (0–6 месяцев)
- MVP BioCompute Optimizer:
- оркестрация CPU vs GPU
- движок выполнения пайплайнов
- слой бенчмаркинга и метрик
- Интеграции с:
- Scanpy / Seurat
- RAPIDS / cuML
- Улучшение:
- скорости выполнения
- потребления памяти
- стоимости вычислений
🔹 Среднесрочно (6–18 месяцев)
- Продвинутый оптимизатор:
- dataset-aware execution planning
- работа с разреженными данными (CSR / CSC)
- approximate алгоритмы (KNN, графы)
- Распределённые вычисления:
- multi-GPU
- кластерные системы
- Продакшн-система:
- API
- облачная платформа
- enterprise deployment
🔹 Долгосрочно
- Собственные ядра (kernels) для биологических задач
- BioSparse / BioGraph compute engines
- Оптимизация под конкретное железо
- Движение к специализированной вычислительной архитектуре для биологии
Технологический стек и задачи
Вы будете работать с:
- GPU-программированием (CUDA, Triton, cuML, CuPy)
- Оптимизацией разреженных матриц (CSR / CSC)
- Графовыми алгоритмами (KNN, clustering)
- Оркестрацией пайплайнов
- Управлением памятью и перемещением данных
- Распределёнными вычислениями
- Performance benchmarking
Идеальный кандидат
Обязательно:
- 5–10+ лет опыта в инженерии
- Сильное системное мышление
- Опыт в одной из областей:
- GPU / HPC
- ML-инфраструктура
- высоконагруженные системы
- Опыт построения performance-critical систем
Плюс:
- CUDA / Triton
- ML-инфраструктура (PyTorch, JAX, distributed training)
- Численные методы / scientific computing
- Работа с большими данными
Дополнительный плюс:
- Опыт в биоинформатике / геномике
- RAPIDS, FAISS, графовые системы
- Стартап-опыт
Что для нас важнее всего
- Умение мыслить с первых принципов
- Чувство узких мест в производительности
- Комфорт с неопределённостью
- Способность быстро реализовывать решения
Не подойдёт, если вы:
- Предпочитаете только исследовательскую работу без продуктовой части
- Хотите работать по заранее заданному плану
- Не готовы к условиям ранней стадии стартапа
Почему это интересно
Биология становится одной из самых data-intensive индустрий, но её вычислительный стек сильно отстаёт.
Это возможность:
- создать новую категорию (BioCompute layer)
- работать на стыке:
- AI
- системного программирования
- life sciences
- построить инфраструктуру, которая может стать стандартом в индустрии
- возможность переезда зарубеж
Условия
- Значимая доля (equity)
- Зарплата — обсуждается
- География — гибкая