LLM Engineer (Python, RAG)

от 200 000 за месяц на руки

Выплаты: два раза в месяц

Опыт работы: 3–6 лет

Полная занятость
Оформление: Трудовой договор

График: 5/2

Рабочие часы: 8

Формат работы: удалённо

IT-компания
У работодателя есть аккредитация

Напишите телефон, чтобы работодатель мог связаться с вами

Пройдите капчу
Чтобы подтвердить, что вы не робот, введите текст с картинки:
captcha
Неверный текст. Пожалуйста, повторите попытку.

О компании:
Мы представляем компанию, занимающуюся разработкой сервиса по быстрому и качественному созданию презентационных материалов. Система работает с высокими нагрузками, ежедневно обслуживая около 20 000 пользователей.

Компания внесена в реестр аккредитованных IT-компаний

Будет плюсом, если в сопроводительном письме укажете свой Telegram.

Чем предстоит заниматься:
– Разворачивать и поддерживать LLM-модели в корпоративном контуре на базе Qwen, Llama, Mistral и аналогов
– Проектировать и реализовывать RAG-системы
– Интегрировать LLM в основной продукт компании — редактор презентаций
– Выполнять дообучение LLM-моделей (LoRA или QLoRA)
– Оптимизировать запросы к модели для снижения количества используемых токенов
– Писать и поддерживать техническую документацию

Что мы ждём от кандидата:
– Коммерческий опыт разработки на Python на уровне middle или выше
– Опыт развёртывания LLM-моделей в локальном или корпоративном контуре
– Опыт дообучения LLM-моделей (методами LoRA или QLoRA)
– Практический опыт проектирования и внедрения RAG-систем
– Уверенная работа с Git в командной разработке

Будет преимуществом:
– Опыт работы с vLLM, TGI, Ollama, HuggingFace Inference
– Работа с векторными базами Qdrant, Milvus, Weaviate
– Опыт оптимизации производительности LLM-сервисов
– Базовое понимание Docker, Linux и GPU-окружения
– Опыт работы с высоконагруженными сервисами

От компании:
– Официальное трудоустройство в аккредитованную IT-компанию.
– График работы 5/2 с возможностью гибкого начала и окончания рабочего дня.
– Полностью официальная заработная плата без задержек, с плановым увеличением в течение 2-х лет.
– Удаленный формат работы.

Ключевые навыки

  • Python
  • LLM
  • RAG
  • Git
  • LoRA / QLoRA
  • vLLM / TGI
  • Owen
  • Kandinsky
  • Llama
  • Mistral
  • MLOps

Задайте вопрос работодателю

Он получит его с откликом на вакансию
Вакансия опубликована 30 января 2026 в Санкт-Петербурге
Dream Job
Отзывы о компании
IT-компания
У работодателя есть аккредитация