Развитие в IT с заботой о себе
Технологический партнер для крупного бизнеса. Поставляем IT-ресурсы и разрабатываем ПО
- Резидент Сколково
- 360+ проектов
- Аккредитация Минцифры
- +300 сотрудников
- Резидент Сколково
- 360+ проектов
- Аккредитация Минцифры
- +300 сотрудников
- Служба заботы о сотрудниках
- В рейтингах работодателей Forbes, РБК, hh.ru
- Маскот IT-тигр
- Служба заботы о сотрудниках
- В рейтингах работодателей Forbes, РБК, hh.ru
- Маскот IT-тигр
Ваша зона ответственности:
- Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка.
- Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения
- Разработка и поддержание в актуальном состоянии документации по разработанному функционалу
- Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных
- Своевременное отражение статуса выполнения задач в Jira.
Необходимые навыки:
- Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП
- Опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas
- Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников
- Способность разобраться с API поставщиков данных, используя доступную документацию
- SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum
- Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow
- Опыт разработки сложных, высоконагруженных приложений обработки данных на основе PySpark, уверенное знание настроек Spark и их влияния на производительность приложений Spark.
Мы предлагаем:
Программы менторства и митапы, компенсация затрат на обучение и оплата подписок на фильмы, книги и музыку
Служба заботы о сотрудниках, корпоративный психолог, ДМС со стоматологией, подарки детям и 5 relax days в год — отгулы за наш счет
Работа в аккредитованной IT-компании, ежегодная индексация зарплаты, 28 дней отпуска и техника
Команда прокаченных специалистов, внутренние события и уникальная корпоративная культура с маскотом-тигром
Ключевые навыки
- PySpark
- Spark
- ORACLE
- PostgreSQL
- Greenplum
- Apache Airflow
- SQL
- pandas
- Numpy
- Python
- DataLake
- SandBox
- FeatureStore