Мы — команда, создающая ядро интеллектуальных сервисов для амбициозной международной аналитической платформы. Наш продукт помогает бизнесу принимать стратегические решения на глобальных рынках, предоставляя уникальные инструменты для поиска, анализа и прогнозирования на основе любых типов данных — от новостных лент до внутренних баз знаний.
Мы ищем опытного и системно мыслящего Data Engineer. Вам предстоит построить надежный фундамент данных для всей платформы, разрабатывая масштабируемые пайплайны и решая нетривиальные задачи по извлечению информации из самых разных источников.
Обязанности
- проектировать и разрабатывать автономных ИИ-агентов для решения конкретных бизнес-задач: оценка рисков, анализ контрагентов, поиск альтернативных рынков, санкционный комплаенс.
- развивать RAG (Retrieval-Augmented Generation) пайплайны для интеллектуального поиска по разнородным источникам данных (веб-сайты, документы, базы данных).
- создавать и оптимизировать высоконагруженные ML-сервисы, включая text-to-sql, системы суммаризации и прогнозной аналитики.
- участвовать в полном цикле жизни ML-решений: от ресерча и прототипирования новых подходов до внедрения в production и последующего мониторинга.
- интегрировать LLM-решения (как open-source, так и коммерческие) в микросервисную архитектуру платформы.
- оптимизировать производительность моделей и пайплайнов для работы в on-premise окружениях с высокими требованиями к скорости и надежности.
- сотрудничать с продуктовой командой и backend-разработчиками для бесшовной интеграции ИИ-функционала в платформу.
Требования
- практическим опытом разработки и вывода в production LLM-решений (RAG, fine-tuning, ИИ-агенты)
- уверенным владением фреймворками для создания LLM-приложений (например, LangGraph, LangChain, LlamaIndex)
- опытом работы с большими языковыми моделями (GPT, Llama, Mistral и др.) и пониманием их сильных и слабых сторон
- отличным знанием Python и ключевых библиотек для ML (PyTorch/TensorFlow, scikit-learn, Hugging Face)
- опытом работы с векторными базами данных (Milvus, Pinecone, Weaviate и т.п.)
- опытом разработки на Python с использованием фреймворков (FastAPI и др)
- уверенным знанием SQL и опытом работы с реляционными СУБД (PostgreSQL)
- пониманием принципов микросервисной архитектуры, REST API, WebSocket
- опытом контейнеризации приложений (Docker) и их оркестрации (Kubernetes)
- практикой настройки CI/CD пайплайнов (GitLab CI, GitHub Actions)
- опытом работы с инструментами мониторинга и логирования (Prometheus, Grafana, Loki)
будет плюсом:
- опыт работы с мультимодальными моделями (обработка изображений, аудио, видео)
- опыт разработки платформ или фреймворков для создания ИИ-решений (например, конструкторов агентов)
- опыт развертывания ML-систем в on-premise или гибридных средах
- Опыт использования инструментов для MLOps, таких как MLFlow.
Условия
- комфортный современный офис
- гибридный график работы
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера, отпуска и больничные.