Задачи:
- Разработка API на fastapi для ML-моделей и других приложений;
- Развёртывать и поддерживать ML-платформу (MLflow / Airflow, vLLM, Nexus Repo);
- Автоматизировать CI/CD для моделей и фичей (GitLab CI, Helm-чарты);
- Организовать мониторинг метрик качества и бизнес-метрик (Prometheus + Grafana);
- Настраивать кэширование и масштабирование инференса (GPU/CPU, A/B-testing, k8s).
- Знание Python; библиотек для web-разработки (fastapi), умение читать код на PyTorch / TensorFlow / numpy / scikit-learn;
- 3+ лет опыта в Python, DevOps;
- Уверенное владение Kubernetes, Docker, Helm;
- Опыт построения CI/CD пайплайнов.
Будет плюсом:
- Опыт работы с облаками (AWS / GCP / Yandex Cloud) и on-prem GPU-кластером;
- Опыт продакшн-инференса LLM (vLLM, Triton) или real-time рекомендаций.
- Профессиональный коллектив;
- Возможность работать над проектами, приносящими пользу для тысяч людей;
- Неограниченный рост;
- Комфортный офис в центре города;
- Скидки на фитнес, обучение английскому языку, подарки на праздники и дни рождения;
- Бонусы и уникальные предложения от компаний холдинга;
- Спонсирование профессионального обучения;
- Насыщенная корпоративная жизнь с выездами на природу, праздничными мероприятиями в офисе, играми и розыгрышами подарков.
Ключевые навыки
- Kubernetes
- DevOps
- Python
- CI/CD
Задайте вопрос работодателю
Он получит его с откликом на вакансию
Вакансия опубликована 2 сентября 2025 в Алматы