Мы — сервисная IT-компания, занимаемся разработкой web-приложений для клиентов из Европы и Северной Америки.
Сейчас ищем AI-инженера, который сможет взять на себя весь цикл работы с LLM, RAG, генерацией текста, аудио и изображений для нашего нового продукта в сфере EdTech.

Нужен специалист, который умеет самостоятельно проектировать, разрабатывать и поддерживать полноценные AI-модули: от ingestion и RAG до QA, TTS и image generation.

Обязанности:

Работа над AI-частью крупного web-продукта (образовательная платформа).
Основные задачи:

1. Разработка AI-функционала

построение RAG-системы: ingestion, OCR, chunking, embeddings, vector store, retrieval;
генерация текстов при помощи LLM (TOC, главы, параграфы, переработки, QA);
построение citation-движка (привязка chunkId к абзацам, coverage%, distance rules);
реализация AI QA (проверка фактов, ссылок, структуры, стиля, автоматические исправления).

2. Оркестрация и пайплайны

разработка AI Orchestrator: очереди, ретраи, idempotency, fallback, SLA;
построение многошаговых процессов: генерация → цитирование → QA → упаковка.

3. Аудио и изображения

генерация аудиоконтента (TTS + SSML), сегментация, склейка, нормализация;
проверка аудио на ACX-совместимость, LUFS, Peak;
генерация изображений (обложки, иллюстрации) через DALL·E 3 / аналогичные сервисы.

4. Интеграции

работа с OpenAI API, ElevenLabs (или аналогами), DALL·E 3;
взаимодействие с backend через REST API;
работа с S3-хранилищами и векторными БД (Pinecone / Qdrant).

5. Аналитика, качество и стабильность

логирование, трассировка, мониторинг AI-метрик;
контроль стоимости (token budget), производительности, корректности генераций;
участие в планировании задач, оценке и улучшении архитектуры AI-модулей.

Требования

Python (обязательно)

Уверенный Senior-уровень:

Python 3.10+
FastAPI
Pydantic
Asyncio
Работа с очередями (Celery / RQ / Dramatiq / async pipeline)
Работа с Postgres (SQL, JSONB)

RAG (обязательно)

Опыт разработки полноценных RAG-систем:

chunking (token-based, semantic-based, overlap)
embeddings (OpenAI, Cohere, Sentence Transformers)
vector DB: Qdrant / Pinecone / PGVector
retrieval настройки (Top-K, similarity threshold, recency bias, boosts)
защита от галлюцинаций и blending
построение pipeline: ingestion → embeddings → vector store → retrieval → generation

LLM-engineer навыки

генерация длинных текстов (2–10k tokens)
многошаговые пайплайны (TOC → Chapters → QA → Regen)
JSON schema output
обработка markdown
промтинг для QA, стилевой обработки, факт-чека, TTS, изображений

Citation / Fact-grounding

привязка chunkId к тексту
coverage%
dedup
distance rules
обработка устаревших источников (staleness)

AI QA

правила проверки фактов, ссылок, структуры
LLM-classification
Heuristics-линтеры
автоисправления (autofix pipelines)

Audio (обязательно)

опыт работы с TTS (ElevenLabs / Play.ht / OpenAI)
SSML
ffmpeg, pydub, librosa
LUFS / Peak / noise validation

Image generation (обязательно)

DALL·E 3 / Midjourney / Stability API
генерация изображений по структуре
вариации, апскейлы
авто-alt-text

MLOps & Observability

работа с Docker
логирование, трассировка (OpenTelemetry, Sentry)
контроль токенов, стоимости, производительности

Условия:

- работа удаленная, гибкий график

- первый месяц испытательный период

- если проявите свою производительность и ответственность перейдём на работу full-time

- работа в команде программистов. Используeм в работе методологию управления проектов Scrum

- возможности для повышения квалификации и профессионального роста

Ключевые навыки

Python
Английский — B2 — Средне-продвинутый

Задайте вопрос работодателю

Он получит его с откликом на вакансию

Где располагается место работы?

Какой график работы?

Вакансия открыта?

Какая оплата труда?

Как с вами связаться?

Другой вопрос

Вакансия опубликована 19 ноября 2025 в Гродно

Откликнуться

Python AI Engineer (RAG / LLM / TTS / Image Generation)

Напишите телефон, чтобы работодатель мог связаться с вами

Ключевые навыки

Задайте вопрос работодателю

Похожие вакансии