Data Scientist

з/п не указана

Требуемый опыт работы: 1–3 года

Полная занятость, полный день

500+ профессионалов в IT поделены
по 100 продуктовым командам

Леруа Мерлен — платформа для обустройства дома. Мы делаем улучшение и обустройство своего дома возможным для каждого клиента, поддерживая и развивая экосистему партнеров.

Мы про продуктовый подход и agile, используем в работе scrum и kanban.

Основной стек

Frontend:React, Typescript, React Native, Flow, Vue
Backend:Java, Kotlin, Node.JS, Go, Python
Android:Kotlin, Clean, Kotlin Multiplatform
iOS:Swift, Clean, Rx, Kotlin Multiplatform
Data Engineering:Kafka, NiFi, S3, Spark, Greenplum, ClickHouse, Airflow
Data Transport:Debezium, Kafka, NiFi, S3, Greenplum
ML:Catboost, LightGBM, TensorFlow, OpenCV, DVC, MLFlow
DevOps:Docker, Kubernetes, Jenkins, Artifactory, Ansible, Helm, Prometheus, ELK
Прочитать статью
об IT-проектах компании

Мы – команда в Леруа Мерлен, которая занимается разработкой системы предиктивной аналитики (на основе ML) под ITSM систему для обработки пользовательских обращений. Ежемесячно мы обрабатываем 20K+ обращений по каналам email, chatbot, телефон, self-service portal от 39K+ пользователей, а также от интегрированных систем по API.

Мы планируем расширить диапазон применения нашего продукта, а также улучшить текущий функционал. Уже в этом году мы планируем внедрение ComputerVision, RPA и повысить степень взаимодействия с пользователем через chatbot. Сейчас мы ищем Data Scientist'а для реализации всех этих и будущих проектов. Также мы приветствуем твою инициативу по применению различных технологий для развития наших продуктов

Обязанности:

  • Разработка моделей для анализа текстовой информации и классификации обращений; моделей для анализа изображений и фото;
  • Формализация требований к сбору обучающей выборки;
  • Генерация и проверка гипотез;
  • Проведение исследований алгоритмов машинного обучения;
  • Дизайн, разработка и тюнинг моделей машинного обучения;
  • Построение и оптимизация пайплайнов от формирование признаков до обучения моделей;
  • Продуктивизация ML-решений.

Требования:

  • Техническое образование;
  • Опыт работы в аналитике/ data science от 2 лет;
  • Знание тервера, математикии линейной алгебры, достаточного для чтения научных статей и проведения экспериментов;
  • Умение проверять статистические гипотезы, знание основных критериев;
  • Знание и понимание основных метрик и принципов оценки качества моделей и получаемого с их помощью результата, способов валидации моделей;
  • Знание основ SQL, опыт работы с реляционными СУБД на уровне пользователя;
  • Уверенное знание python (+ классический набор библиотек для анализа данных/ машинного обучения: scikit-learn, numpy, pandas, plotly/ matplotlib/ seaborn), опыт разработки API);
  • Опыт обучения моделей градиентного бустинга, использования одной из библиотек (Catboost, LightGBM, XGBoost).

Плюсом будет:

  • Опыт продуктивизации моделей, поддержки ML-решений;
  • Опыт успешного участия в соревнованиях по машинному обучению;
  • Опыт разработки чат-ботов / опыт работы с алгоритмами классификации обращений.

Мы предлагаем:

  • Работу в стабильной компании-лидеров DIY рынка с уникальной корпоративной культурой;
  • Участие в конференциях вместе с нашей международной командой;
  • Возможности для профессионального развития и изучения иностранных языков;
  • Белую заработную плату, систему премирования, ДМС, расширенный социальный пакет и компенсацию питания;
  • Офис около м. Шаболовская (сейчас работаем преимущественно удаленно, в будущем планируем переход на частично удаленную работу).

Ключевые навыки

SQL
Прогнозирование
Анализ данных

Контактная информация

Вакансия опубликована 14 апреля 2021 в Москве

Похожие вакансии