Описание:
Мы — сервисная IT-компания, занимаемся разработкой web-приложений для клиентов из Европы и Северной Америки.
Сейчас ищем AI-инженера, который сможет взять на себя весь цикл работы с LLM, RAG, генерацией текста, аудио и изображений для нашего нового продукта в сфере EdTech.
Нужен специалист, который умеет самостоятельно проектировать, разрабатывать и поддерживать полноценные AI-модули: от ingestion и RAG до QA, TTS и image generation.
Обязанности:
Работа над AI-частью крупного web-продукта (образовательная платформа).
Основные задачи:
1. Разработка AI-функционала
-
построение RAG-системы: ingestion, OCR, chunking, embeddings, vector store, retrieval;
-
генерация текстов при помощи LLM (TOC, главы, параграфы, переработки, QA);
-
построение citation-движка (привязка chunkId к абзацам, coverage%, distance rules);
-
реализация AI QA (проверка фактов, ссылок, структуры, стиля, автоматические исправления).
2. Оркестрация и пайплайны
-
разработка AI Orchestrator: очереди, ретраи, idempotency, fallback, SLA;
-
построение многошаговых процессов: генерация → цитирование → QA → упаковка.
3. Аудио и изображения
-
генерация аудиоконтента (TTS + SSML), сегментация, склейка, нормализация;
-
проверка аудио на ACX-совместимость, LUFS, Peak;
-
генерация изображений (обложки, иллюстрации) через DALL·E 3 / аналогичные сервисы.
4. Интеграции
-
работа с OpenAI API, ElevenLabs (или аналогами), DALL·E 3;
-
взаимодействие с backend через REST API;
-
работа с S3-хранилищами и векторными БД (Pinecone / Qdrant).
5. Аналитика, качество и стабильность
-
логирование, трассировка, мониторинг AI-метрик;
-
контроль стоимости (token budget), производительности, корректности генераций;
-
участие в планировании задач, оценке и улучшении архитектуры AI-модулей.
Требования
Python (обязательно)
Уверенный Senior-уровень:
-
Python 3.10+
-
FastAPI
-
Pydantic
-
Asyncio
-
Работа с очередями (Celery / RQ / Dramatiq / async pipeline)
-
Работа с Postgres (SQL, JSONB)
RAG (обязательно)
Опыт разработки полноценных RAG-систем:
-
chunking (token-based, semantic-based, overlap)
-
embeddings (OpenAI, Cohere, Sentence Transformers)
-
vector DB: Qdrant / Pinecone / PGVector
-
retrieval настройки (Top-K, similarity threshold, recency bias, boosts)
-
защита от галлюцинаций и blending
-
построение pipeline: ingestion → embeddings → vector store → retrieval → generation
LLM-engineer навыки
-
генерация длинных текстов (2–10k tokens)
-
многошаговые пайплайны (TOC → Chapters → QA → Regen)
-
JSON schema output
-
обработка markdown
-
промтинг для QA, стилевой обработки, факт-чека, TTS, изображений
Citation / Fact-grounding
-
привязка chunkId к тексту
-
coverage%
-
dedup
-
distance rules
-
обработка устаревших источников (staleness)
AI QA
-
правила проверки фактов, ссылок, структуры
-
LLM-classification
-
Heuristics-линтеры
-
автоисправления (autofix pipelines)
Audio (обязательно)
-
опыт работы с TTS (ElevenLabs / Play.ht / OpenAI)
-
SSML
-
ffmpeg, pydub, librosa
-
LUFS / Peak / noise validation
Image generation (обязательно)
-
DALL·E 3 / Midjourney / Stability API
-
генерация изображений по структуре
-
вариации, апскейлы
-
авто-alt-text
MLOps & Observability
-
работа с Docker
-
логирование, трассировка (OpenTelemetry, Sentry)
-
контроль токенов, стоимости, производительности
Условия:
- работа удаленная, гибкий график
- первый месяц испытательный период
- если проявите свою производительность и ответственность перейдём на работу full-time
- работа в команде программистов. Используeм в работе методологию управления проектов Scrum
- возможности для повышения квалификации и профессионального роста
Ключевые навыки
- Python
- Английский — B2 — Средне-продвинутый