Ведущий SRE (тимлид, reliability инженер)

от 270 000 до 340 000 руб. на руки

Откликнуться
Вы откликаетесь на вакансию в другой стране

Страна размещения вакансии — Россия.

В резюме не указано, что вы готовы туда переехать.

Все равно откликнутьсяНе откликаться
Смотреть отклик

Требуемый опыт работы: 3–6 лет

Полная занятость, полный день

Mindbox — крупнейшая в России платформа автоматизации маркетинга. Мы помогаем компаниям, от ДоДо Пиццы и Ситилинка до ПИК и МИФ, стать полезнее через правильный маркетинг. Без спама и заваливания скидками.

Ищем ведущего SRE части инфраструктурой команды и лидера devOps / SRE гильдии. Отвечать за метрику инцидентов, обеспечивать надежность при быстром росте: нагрузке, постоянных изменениях и новых людях. Тренировки и хаосманки, мониторинг, безопасность. Совместная работа с CTO / архитекторами.

Возможно, самая интересная продуктовая разработка в России. Сложная архитектура, нагрузка, свои сервера. Переходим на новый стэк: Я.Облако, k8s. В планах: PostgreSQL. devOps и SRE внутри команд разработки, до 40% на технический бэклог.

Строим самоуправляемую бирюзовую организацию. Открыты зарплаты и финансы, нет руководителей. Без политики, мути и корпоративной шляпы.

Технологии и процессы

  • Infrastructure as Code

  • Kubernetes в Яндекс.Облаке и Azure (Traefik Ingress, Jaeger, Service mesh)

  • OctopusDeploy + kustomize + Helm

  • GitHub с протектед мастером и обязательным ревью

  • Prometheus, NewRelic + Grafana + AlertManager + Amixr.io

  • MS SQL который планируем мигрировать на PostgreSQL

  • RabbitMQ, Redis, InfluxDB, Kafka, Cassandra

  • Graylog (300Gb логов в день) + Sentry

  • Легаси стек на WindowsServer + HyperV + IIS

  • 4 стойки своих серверов в ЦОДе

  • Kanban, ретроспективы, демонстрации, ежемесячные общие спринты. Googledocs, Slack, Trello.

Размеры и нагрузка

  • 55 человек в разработке, 6 команд, 3 ML-специалиста, 6 SRE и DevOps-инженеров, 8 продуктов
  • 300 000+ RPM в среднем, 5 миллиардов запросов к API в месяц, 50 миллионов транзакций в день,
  • 300+ миллионов профилей в базах, десятки миллиардов фактов
  • Несколько тысяч касс по всей России, доступность 24/7

Задачи и ожидания

Отвечать за метрики и процессы надежности инфраструктуры.

  • Мониторинг, расследование инцидентов

  • Chaos engineering

  • Миграция легаси инфраструктуры в кубернетис

  • Автоматизации инфраструктуры (Terraform, Ansible)

  • Развертывание приложений (bash + powershell + yaml)

  • Дневные дежурства каждую 3ю неделю + участие в ночных эскалациях

  • Устранение ботлнеков и оптимизация перформанса, в том числе БД

  • Планирование нагрузки (модели и пороги потребления ресурсов)

  • Развертывание и поддержка локального kubernetes кластера: политики OPA, Lint и тесты, жизненный цикл операторов, версий инфраструктурного ПО

  • IT Security

  • Найм и обучение новых devOps и SRE

Что предлагаем

Прозрачные грейды, квартальные бонусы от прибыли.

  • Средний возраст 29 лет. Спорт, квесты, настолки, ЧГК, VR и караоке

  • Комнаты по 8-10 человек, i9 с SSD + 2 монитора или macbook pro.

  • На 100 000 ₽/год софинансируем образование (80%), спорт и здоровье (35%). Книги бесплатно

  • Экологичный офис класса A: панорамные окна, полезные перекусы и starbucks

  • Гибкий график, дополнительный отпуск, соблюдаем ТК

Ключевые навыки

GitLinuxBashkubernetesMS SQLСпособность обучать другихУмение принимать решенияPowerShellSREDevOps

Адрес

Белорусская, Савеловская, Москва, улица Правды, 26

Вакансия опубликована 4 февраля 2020 в Москве

Откликнуться
Вы откликаетесь на вакансию в другой стране

Страна размещения вакансии — Россия.

В резюме не указано, что вы готовы туда переехать.

Все равно откликнутьсяНе откликаться
Смотреть отклик
Написать сопроводительное письмоПисьмо отправлено

Сопроводительное письмо к отклику

Похожие вакансии