WaveAccess is looking for a Data Scientist to join our team and contribute to innovative projects in the pharmaceutical domain. This role involves working with real-world pharmaceutical data and leveraging the power of Large Language Models (LLMs) to drive impactful insights and solutions.
Responsibilities:
Requirements:
Technologies:
Preferred:
At least 5 years of experience as a Data Scientist
Team management experience
Experience in presales participation
English — confident B2 level or higher, comfortable communication with native speakers
Deep knowledge of neural networks and sequence modeling architectures (RNN, LSTM, Transformers, CNN, Attention)
Experience working with LLMs and modern approaches, including RAG and LLM agents (mid-level)
Excellent proficiency in Python
Ability to present results effectively
Experience in classical ML
Nice to have:
We offer the following conditions:
Work in a dynamic international team
Opportunity for cooperation through individual entrepreneurship/self-employment
Participation in foreign and Russian projects
Health insurance with dental coverage
Necessary equipment for work
Corporate training programs
Broad opportunities for self-realization, professional and career growth
Democratic approach to processes and flexible start of the workday.
Вакансия на русском:
Компания WaveAccess ищет Data Scientist для работы в нашей команде и участия в инновационных проектах в фармацевтической сфере. В этой роли вы будете работать с реальными фармацевтическими данными и использовать возможности больших языковых моделей (LLM) для получения значимых инсайтов и разработки решений.
Обязанности:
Интеграция LLM: разработка, тонкая настройка и внедрение больших языковых моделей для анализа и обработки разнообразных текстовых и медицинских данных
Анализ данных: проведение продвинутого анализа реальных фармацевтических наборов данных для извлечения полезных инсайтов и поддержки принятия решений
Текстовый майнинг и NLP: использование методов обработки естественного языка для извлечения релевантной информации из больших объемов текста, включая медицинскую литературу, записи пациентов и данные клинических испытаний
Разработка моделей: создание и валидация предиктивных моделей для решения ключевых задач в фармацевтике, таких как эффективность препаратов, результаты лечения пациентов и прогнозирование побочных эффектов
Инновации: отслеживание последних достижений в области LLM и NLP и применение инновационных подходов для решения сложных задач в фармацевтической области
Требования:
Опыт работы Data Scientist'ом от 5 лет
Опыт участия в presale
Английский — уверенный B2 и выше, комфортное общение с носителями языка
Глубокие знания нейросетей и архитектур для работы с последовательностями (RNN, LSTM, Transformers, CNN, Attention)
Опыт работы с LLM и современными подходами, включая RAG и LLM-агентов (уровень мидл)
Отличное владение Python
Навыки презентации результатов работы
Опыт классического ML
Технологии:
Python
Transformers
LLM
Стандартный стек NLP
Стандартный стек ML
Базовый SQL
Git
Векторные базы данных (Postgres+pgvector / Milvus / Qdrant / Faiss)
Желательно:
Знание общих подходов машинного обучения
Знания математической статистики
Опыт работы с AWS (EC2, S3)
Linux + bash, ssh
Опыт письменного и устного взаимодействия с бизнес-стейкхолдерами
Опыт полного цикла разработки
Будет плюсом:
Опыт разработки RestAPI
Snowflake
Docker
Понимание CI/CD
Знание Java/C++/других языков
Мы предлагаем:
Работа в динамичной международной команде
Официальное трудоустройство по трудовому законодательству, 100% оплата больничных и отпусков
Возможность сотрудничества через ИП / самозанятость
Участие в зарубежных и российских проектах
Медицинская страховка с стоматологией
Необходимое оборудование для работы
Корпоративные обучающие программы
Широкие возможности для самореализации, профессионального и карьерного роста
Демократичный подход к процессам и гибкий старт рабочего дня
В сопроводительном письме ответьте, пожалуйста, на вопрос: Есть ли у вас коммерческий опыт (не исследовательские проекты или прототипы) в работе с системами, использующими LLM, RAG и мультиагентные архитектуры?