Senior Machine Learning Engineer (LLM, RL)

Уровень дохода не указан

Опыт работы: 3–6 лет

Полная занятость

График: 5/2

Рабочие часы: 8

Формат работы: на месте работодателя или удалённо

Напишите телефон, чтобы работодатель мог связаться с вами

Пройдите капчу
Чтобы подтвердить, что вы не робот, введите текст с картинки:
captcha
Неверный текст. Пожалуйста, повторите попытку.

Мы – Intella, крупнейшее узкопрофильное кадровое агентство на территории СНГ.

Сейчас мы ищем амбициозных кандидатов на роль Senior Machine Learning Engineer для международной компании, специализирующейся на разработке бизнес-решений с применением искусственного интеллекта. Организация работает над проектами, которые напрямую влияют на развитие фармацевтики и медицины. Команда мультиязычная, офисы разработки расположены в нескольких странах, включая Абу-Даби (ОАЭ). В компании работает более 300 сотрудников, а проекты реализуются на глобальном уровне.

Задачи:

  • Разработка и масштабирование тонкой настройки обучения с подкреплением для LLM, включая подходы RLHF, RLVR и другие современные методы

  • Построение и оптимизация высокопроизводительных конвейеров обучения трансформеров в средах с несколькими GPU и несколькими узлами.

  • Разработка экспериментов, мониторинг ключевых метрик и представление результатов в виде презентаций и/или публикаций.

  • Масштабирование пайплайнов и параллелизация обучения

Ожидания от кандидата:

  • ​​​​​​​Коммерческий опыт тренировки и масштабирования LLM моделей: pre-train, fine-tune, обучение на нескольких GPU
  • Коммерческий опыт с RL ( RLHF / RLVR ), знание алгоритмов и методов preference-based optimization (PPO / DPO / RLOO / GRPO),
  • Навыки масштабирования пайплайнов, параллелизации обучения (DeepSpeed, vLLM)
  • Глубокие знания Python, PyTorch, Transformers / Diffusion models
  • Английский уровня B2+ для общения с командой
  • Высшее образование

Будет плюсом бэкграунд генеративными моделями/ разработкой LLM для написания кода / построением ревордных моделей / диффузионными моделями для молекул

​​​​​​​​​​​​​​Мы предлагаем:

  • Участие в социально-значимом медицинском проекте
  • Релокацию в Абу-Даби, ОАЭ. Возможна удаленная работа на период прохождения испытательного срока
  • Медицинскую страховку
  • Гибкий график работы
Доступно соискателям с инвалидностью

Ключевые навыки

  • Python
  • Data Analysis
  • Машинное обучение
  • Математическая статистика
  • Теория вероятностей
  • Линейная алгебра
  • LLM
  • RL
  • reinforcement learning
  • Rewards
  • data science
  • ds
  • gan
  • RLVR
  • RLHF
  • PPO
  • DPO
  • RLOO
  • GRPO
  • Transformers
  • Diffusion models
  • pre-train
  • Английский — C1 — Продвинутый

Задайте вопрос работодателю

Он получит его с откликом на вакансию

Где предстоит работать

Москва, Павелецкая, Павелецкая, Кольцевая линия, метро Павелецкая
Вакансия опубликована 19 ноября 2025 в Каменке (Ленинградская область)

Dream Job

Отзывы о компании