Мы используем файлы cookie, чтобы обеспечивать правильную работу нашего веб-сайта и анализировать сетевой трафик.
Правила использования файлов cookie

Мы используем файлы cookie. Правила использования файлов cookie

Для работы с нашим сайтом необходимо, чтобы Вы включили JavaScript в вашем браузере.

Работодателям

Big Data Engineer

Уровень дохода не указан

Опыт работы: 1–3 года

Полная занятость

Оформление:

Трудовой договор

График: 5/2

Рабочие часы: 8

Формат работы: удалённо или гибрид

Откликнуться

Lamoda Tech

IT-компания

У работодателя есть аккредитация

№ 1
в e-commerce¹

в сегментах fashion & lifestyle

700
инженеров

создают и развивают онлайн-платформу

200+
систем

разрабатываются внутри компании

3,5 ПБ
данных

в нашем DWH и Data Lake Hadoop

Команда Lamoda Tech совершает цифровую революцию в fashion и e-commerce: разрабатывает ML-решения для каталога из сотен тысяч товаров, автоматизирует распределительные центры, по всему СНГ налаживает систему доставки и движение курьеров так, чтобы клиент мог получить заказ в течение выбранных 15 минут.

Мы ищем тех, кто с удовольствием пробует новое, не боится спросить совета у коллег и сам готов делиться опытом.

Мы в поиске Инженера по работе с большими данными в команду дата-инжиниринга, который будет участвовать в ключевых проектах Lamoda, обеспечивая стабильную и масштабируемую инфраструктуру для обработки и анализа данных.

В рамках этой роли вы будете решать задачи продуктового направления навигации, которое:

Развивает поиск, каталог, саджесты, ранжирование товаров и AI-инструменты навигации.
Улучшает качество поиска и навигации через аналитику, работу с поисковыми запросами и ML-модели (DL, NLP, CV).
Обеспечивает эффективную интеграцию алгоритмов с продуктовым дизайном.
Реализует data-driven инициативы, помогая пользователю быстрее находить нужные товары и информацию.

Чем предстоит заниматься:

Разрабатывать и развивать платформу данных электронной коммерции нового поколения;
Проектировать и реализовывать ETL-пайплайны в Airflow для Spark, Streaming, Hive, Trino;
Оптимизировать существующие пайплайны и Spark-джобы: следить за нагрузкой на кластер, ресурсами и производительностью;
Взаимодействовать с аналитиками и ML-инженерами, оптимизировать SQL-запросы, развивать культуру осознанной работы с данными;
Развивать Action Storage — слой событий кликстрима, используемый в аналитике и моделях;
Анализировать и внедрять новые инструменты для эффективной работы с данными.

Мы ожидаем:

Опыт работы со стеком Hadoop (YARN, HDFS, Hive);
Уверенные навыки в Spark;
Опыт разработки на Python;
Отличное понимание SQL и принципов работы с СУБД;
Инженерный подход, интерес к системам данных и внимание к деталям.

Будет плюсом:

Опыт с Docker;
Знакомство с Kafka, Iceberg.

Почему с нами хорошо

Заботимся

ДМС со стоматологией и страхование жизни с первого месяца