Москва, Фуркасовский переулок, 6
Метро: Лубянка- Подготовка аналитической информации в сфере нормативно-технических документов;
- формирование XML-файлов согласно методическому пособию;
- проведение семантического анализа требований, содержащихся в Реестре требований ЕИС «Стройкомплекс.РФ»;
- перевод требований нормативных документов, используемых в строительстве, в цифровой (машиночитаемый и машинопонимаемый) формат представления данных;
- Подбор конфигураций (CPU, GPU, RAM, диски) под задачи работы с LLM;
- Реализация контура: документы мбеддинги/ векторная БД/запрос к LLM;
- Написание скриптов для обработки данных, работы с файлами и API;
- Автоматизация рутинных задач (парсинг, конвертация, загрузка данных и т. п.);
- Практическое использование эмбеддингов, чанкинга и поиска «по смыслу»;
- Написание парсеров/ETL-скриптов для сбора и очистки данных из различных источников (PDF, сайты, документы);
- Подготовка структурированных корпусов для базы знаний.
Требования:
- Понимание различий в ресурсах для обучения и инференса моделей;
- Понимание на уровне применения: модель, токенизация, эмбеддинги;
- Опыт использования готовых моделей в прикладных задачах;
- Знание языков программирования.
- Практическая работа с open-source LLM через готовые инструменты/рантаймы;
- опыт работы с векторной БД (Chroma, Qdrant, Weaviate и др.);
Условия:
Работа в стабильной, динамично-развивающейся компании;
- Команда постоянно развивается, участвует в решении амбициозных и интересных задач, которые влияют на дальнейшее развитие строительной отрасли;
- Оформление по ТК РФ;
- Возможность профессионального, личностного и карьерного роста;
- Испытательный срок 3 месяца
Государственное казенное учреждение Московской Области «Центр Компетенций Госуправления»
Москва
Не указана
Москва
до 200000 RUR
Цифровые Пространственные Технологии
Москва
до 150000 RUR
СИ ЭС Групп
Москва
до 160000 RUR
Москва
до 160000 RUR