Группа НЛМК — лидирующий международный производитель высококачественной стальной продукции с вертикально-интегрированной моделью бизнеса. Наши производственные активы расположены в России, Европе и США.
Мы – команда, отвечающая за создание промышленной платформы, среди направлений развития которой можно выделить следующие две основные области:
- Управление жизненным циклом приложений, разворачиваемых в изолированных технологических контурах предприятий:
- эксплуатация сервисов, запускаемых в виде виртуальных машин в вычислительных центрах или на базе периферийных (edge) устройств
- централизованные решения для конфигурирования и инвентаризации сервисов
- Производственные данные:
- сбор и подъем различных типов данных: временные ряды (датчики, PLC-контроллеры), транзакционные данные (АСУТП-системы), геоданные (переносные устройства, передвижная техника)
- централизованные сервисы для управление метаданными и создания каталога данных
- оперативные и архивные хранилища данных
При создании промышленной платформы мы придерживаемся гибридного подхода к реализации:
- для решения типовых задач – использование различных opensource-решений
- разработка собственных сервисов – с учетом специфики распределенного производства НЛМК и для расширения функционала существующих решений за счет объединения их в одну комплексную систему, состоящую из взаимосвязанных компонент.
Наш стек
- работа с кодом и ci/cd-пайплайнами (Gitlab), артефактами поставки (Artifactory), анализ кода (Sonarqube)
- диагностика и мониторинг – логи (Elasticsearch), метрики (Prometheus), ошибки и исключения (Sentry), трассировка (Jaeger)
- среда запуска – Kubernetes / OKD
- интеграционная платформа – на базе Kafka, Confluent Schema registry
Основной стек разрабатываемых приложений:
- языки программирования – java, python, js
- хранение данных – Oracle (legacy-системы), PostgreSQL, Clickhouse (для временных рядов), S3-совместимые хранилища и Hadoop (для неструктурированных данных)
Для формирования отдела по обеспечению высокого уровня доступности создаваемых решений мы в поисках начальника отдела, в чью зону ответственности будет входить эксплуатация сервисов, как разрабатываемых нашей командой, так и внешними:
- Прикладные и тиражируемые интеграционные сервисы, запускаемые как централизованно, так и в изолированных технологических контурах (11 локаций)
- Централизованные общекорпоративные сервисы, работающие в одном экземпляре
С учетом распределенного характера производственных локаций, на каждой из них присутствуют локальные команды, отвечающие за поддержку существующих информационных систем.
Мы предполагаем, что специалисты данных команд будут также вовлекаться в задачи развертывания и сопровождении новых систем и от руководителя на этой позиции потребуется выстраивание процессов взаимодействия с ними.
Помимо эксплуатации прикладных решений необходимо будет вовлечение при внедрении платформенных инструментов и компонентов для изолированных технологических контуров:
- Доставка, конфигурирование и развертывание приложений на базе изолированных технологических вычислительных центров, отдельных граничных (edge) устройств
- Решения для эксплуатации приложений: сбор и передача диагностических данных, наблюдения за их состоянием
- Компоненты как сервис – базовых решения, которые могут использоваться в составе развертываемых приложений (например, СУБД, S3-совместимые хранилища данных)
Вас ждет:
- Создание и управление командой по сопровождению сервисов и прикладных решений:
- Сбор метрик и диагностических данных, фиксация доступности бизнес-функционала, организация мониторинга
- Реакция на оповещения, решение инцидентов и RCA-анализ их причин
- Настройка резервного копирования данных и их восстановление из копий
- Проведение периодических работ по тестированию восстановления работоспособности приложений и их данных на периодической основе
- Моделирование поведения сервисов при отказе различных компонентов, проработка механизмов повышения их отказоустойчивости
- Аудит работы приложений для оптимизации их архитектуры и конфигурации
- Формирование базы знаний для обработки инцидентов
- Участие в создании приложений на всех этапах:
- Оценка ресурсов, необходимых для обеспечения требуемого уровня доступности
- Разработка и контроль соблюдения технических требований для передачи в эксплуатацию, включая вопросы ИБ и актуальность документации
- Разработка ci/cd-пайплайнов, подготовка стендов для запуска приложений
- Участие в проектировании и валидация принимаемых архитектурных решений
- Управление изменениями: анализ влияния, планирование и координация работ по развертыванию новых версий
- Выстраивание процессов и взаимодействия с командами, вовлеченных в поддержку приложений на своих уровнях (инфраструктура, локальные команды, hotline)
- Развертывание и сопровождение сервисов, необходимых для доставки и эксплуатации
Мы ждем от Вас:
- Проактивная позиция – готовность взаимодействия с командами разработки для совершенствования их приложений, постановки задач на создание инструментов эксплуатации
- Практический опыт использования различных сервисов и инструментов:
- работа с кодом и ci/cd-пайплайнами (Gitlab), артефактами (Artifactory / Nexus)
- платформы оркестрации (Kubernetes / OKD)
- диагностика и мониторинг – логи (ELK), метрики (Grafana+Prometheus), ошибки и исключения (Sentry), трассировка (Jaeger)
- веб-серверы (Nginx / HAProxy / Traefik)
- брокеры сообщений (Kafka)
- СУБД (PostgreSQL, Clickhouse)
- Обработка данных (Airflow)
- решений для управления секретами (HashiCorp Vault), конфигураций (Consul) и автоматизации (Ansible)
- Опыт организации эксплуатации прикладных решений:
- разработанных на java / python / go / javascript
- запускаемых в контейнерах (docker), в том числе в средах оркестрации (Kubernetes / OKD)
- имеющих распределенную архитектуру и использующих очереди для асинхронного взаимодействия
- Опыт работы в роли team-лида / начальника отдела с практическим опытом управления командой и разработки технических решений – от 2 лет
Будет плюсом
- Понимание подходов к проектированию solution-архитектуры разрабатываемого ПО
- Понимание принципов инструментирования приложений для повышения уровня наблюдаемости, опыт использования библиотек и подходов для отправки диагностических данных (Prometheus, Sentry, Opentracing)
- Понимание стандартов OAuth 2.0 / OIDC
- Знание и понимание ITIL. Опыт выстраивания процессов обработки обращений, ведения задач, инвентаризации и учета изменений
- Опыт организации сквозного (end-2-end) мониторинга распределенных систем
Мы предлагаем:
- Возможность стать частью команды цифровизации реального сектора экономики;
- Полностью удаленный график работы;
- Конкурентный уровень заработной платы и ежегодная индексация.
- Корпоративные льготы: ДМС, льготное страхование родственников, банковские продукты сотрудникам и скидки партнеров.
- Обучение и развитие: английский язык в лучших языковых школах, большое количество обучающих курсов от внутреннего корпоративного университета, посещение митапов и конференций;
- Возможность принять участие в интересных и сложных проектах с лучшими специалистами индустрии.