Мы в hh создаем продукты и AI-ассистентов для работодателей и соискателей на базе генеративных технологий. Уже сейчас мы используем LLM-модели для генерации текстов, ведения диалогов, классификации и анализа вакансий и резюме. Направление активно развивается, и сейчас мы ищем LLM/Prompt-инженера, который поможет нам создавать, тестировать внедрять GenAI-решения.
Если вам интересно развивать продукты на базе LLM — через промпты, дизайн llm-пайплайнов и системный подход к оценке качества, если вы готовы не только создавать прототипы, но и улучшать их в продакшене на основе обратной связи и метрик — мы будем рады видеть вас в нашей команде.
Чем предстоит заниматься:
-
Разрабатывать и тестировать AI-ассистентов и агентов для HR домена — от создания прототипов до оптимизации качества в продакшене;
-
Настраивать поведение моделей (без fine-tuning) — экспериментировать с промптами (CoT, Tree-of-thoughts, few-shot, structured outputs, tool calling, etc), контекстом, параметрами моделей и архитектурой llm-пайплайнов (один промпт, цепочка промптов, агенты, RAG и т.п.);
-
Совместно с продактами участвовать в дизайне диалоговых сценариев;
-
Анализировать логи, трейсы и фидбек по реальной работе ассистентов и улучшать их качество на основе найденных инсайтов;
-
Тестировать и оценивать качество LLM-систем на всех этапах — собирать golden‑датасеты, составлять инструкции для разметчиков, настраивать llm-as-a-judge, создавать валидационные метрики и бенчмарки, управлять качеством llm-ответов в продакшене;
-
Интегрировать LLM в продукты вместе с DS и разработчиками.
Требования:
-
Опыт решения реальных бизнес задач с использованием LLM (цепочки промптов, structured outputs, диалоговые ассистенты);
-
Знание Python, опыт работы с аналитическими инструментами (jupyter, pandas, matplotlib);
-
Опыт с git, sql, навыки работы с данными;
-
Опыт с OpenAI API и аналогами;
-
Опыт с фреймворками оркестрации llm (langgraph, langchain или аналоги);
-
Навыки тестирования и регресс‑проверок промптов, понимание подходов к оценке llm-систем (offline-метрики, human evaluation, llm-as-a-judge, A/B тестирование).
Будет плюсом:
- Опыт построения сложных агентных систем;
- Опыт использования алгоритмов автоматической оптимизации промптов (GEPA и др);
- Опыт построения RAG;
- Опыт организации процесса разметки, построения golden‑датасетов и автоматизации эвалов;
- Опыт использования валидационных фреймворков и инструментов observability (DeepEval, LangFuse, MlFlow, LangSmith и др.)
Условия:
-
Возможность выбора места работы: удаленно или из офиса;
-
Гибкий график рабочего дня;
-
Оформление в соответствии с ТК РФ, «Белая» заработная плата, выплачиваемая точно в срок;
-
Корпоративное ДМС с первого месяца работы (решаем вопросы со здоровьем быстро и удобно);
-
Возможность профессионального развития, обучение за счет компании, участие в специализированных конференциях.