Data Engineer

з/п не указана

Требуемый опыт работы: 1–3 года

Полная занятость, полный день

Не будем повторять то, что написано о нас на страничке «О компании». Там ты найдешь ответы на вопросы "Кто мы?", "Почему сейчас ищем людей?" и "Что стратегически нами задумано?", букв немного, вся суть передана, цифры говорят сами за себя!

Какой человек нам нужен?

Самостоятельный, убедительный, амбициозный, с лидерскими качествами (или умением сделать так, чтобы управлять не приходилось:) стремящийся к построению качественных процессов и, как следствие, качественному сбору, хранению и поставке данных.

Что мы предлагаем:

  • Заниматься упорядочиванием и структурированием потоков данных
  • Работать в компании, где тебя слышат и ценят твой вклад
  • Влиять на технические решения и планомерно повышать качество сбора, хранения и поставки данных
  • Работать с командой людей, умеющих принимать решения, амбициозных, увлеченных своим делом и проектом
  • Разрабатывать востребованный продукт и получать четкий фидбэк от пользователей
  • Решать амбициозные задачи
  • Получить профессиональный рост (у нас есть тренинги, конференции, сильная команда, которая готова делиться знаниями и в которой можно быстро расти)

Немного о том, что уже сделали и что нам еще предстоит :)

На текущий момент мы подготовили инфраструктуру на базе Hadoop и GreenPlum для загрузки, обработки и построения витрин данных. Описали и загрузили данные одного из продуктов холдинга и приступили к описанию и загрузке следующего. Дальше планируем развивать и масштабировать инфраструктуру, запускать потоковое получение данных и увеличивать количество подключенных источников и доверие к данным.

Что планируем сделать:

  • Структурируем и замониторим потоки данных
  • Построим единое хранилище для данных
  • Сделаем централизованную и прозрачную обработку данных
  • Подготовим витрины данных для конечных пользователей

На практике это значит, что мы будем решать следующие задачи:

  • Загрузка данных из различных источников в Hadoop и GreenPlum, как Batch так и Stream

  • Обработка полученных данных

  • Построение витрин данных

  • Настройка мониторинга

  • Доработка инструментов DataQuality

  • Написание документации

Что для нас важно в тебе:

  • Знание Open Source фреймворков Big Data: (Hadoop, MapReduce, Spark & Spark Streaming, Hive, Kafka)

  • Базовые знания SQL, python

  • Опыт работы с системами контроля версий(Git)

  • Умение организовать процесс загрузки, обработки и доставки обработанных данных конечным потребителям

Не обязательно, но будет очень здорово, если:

  • Знаешь GreenPlum и Apache Airflow

  • Имел опыт работы со Scala

Что есть у нас и чем готовы делиться:

  • Белая, своевременная и конкурентоспособная заработная плата
  • ДМС (включая стоматологию)
  • Удобное место для работы и современное “железо” (хочешь с яблоком, хочешь без)
  • Гибкий график. Начало работы с 8 до 11
  • Профессиональный рост (у нас есть внутреннее обучение, возможность посещать конференции и митапы, мы спонсируем))
  • Корпоративная библиотека (огромное количество профессиональной литературы - бери, читай, наслаждайся)
  • Еда в офис после 21.00. Если вдруг работаешь допоздна - это не повод оставаться голодным!
  • Мы понимаем, что переезд - штука непростая, поэтому мы готовы всячески помочь уже сейчас) Мы оплатим билеты для тебя и твоего багажа, услуги риэлтора для поиска жилья и первый месяц арендной платы. Мы же команда)

Адрес

Дмитровская, Москва, Новодмитровская улица, 5Ас8

Вакансия опубликована 2 декабря 2019 в Москве

Смотреть отклик
Написать сопроводительное письмоПисьмо отправлено

Сопроводительное письмо к отклику