В команде Ozon Tech 2 500 инженеров — и мы продолжаем расти. Десятки миллионов людей пользуются нашими сервисами, наша IT-инфраструктура управляет миллионами процессов каждый час.
Мы решаем сложные и интересные задачи в области кибербезопасности, хранения и обработки данных, совершенствуем и автоматизируем системы, которыми пользуются продавцы, покупатели, партнёры и сотрудники Ozon.
Под капотом у Ozon Tech микросервисы на Go и C#, в стеке технологий есть Vue.js, Swift и Kotlin, Kubernetes, Kafka, Hadoop и ClickHouse. Мы стремимся делать лучший в России e-commerce и вкладываем время и силы в развитие IT-сообщества.

Наша команда занимается разработкой сервисов для поиска на сайте Ozon: находим и ранжируем товары, формируем поисковые подсказки, исправляем опечатки.

Стек: Python, xgboost, CatBoost, lightGBM, Pytorch, Airflow, Hadoop stack (pySpark, yarn, hive, hdfs), ClickHouse

Что вам предстоит:

  • Создание и улучшение алгоритмов ранжирования товаров на сайте (learning to rank);

  • ML-задачи от идеи до реализации в production: изучение статей, поиск и обработка данных, обучение и валидация моделей, автоматизация расчетов;

  • Персонализация результатов поиска для пользователей;

  • Автоматическое понимание и обогащение текстовых запросов пользователей;

  • Работа с действительно большими данными поисковых логов на hadoop-инфраструктуре (~3.5 млрд пользовательских событий в день);

  • Развитие инфраструктуры и архитектуры поискового ранжирования: масштабирование системы добавления фичей, автоматизация сбора датасетов и переобучения.

Что мы ожидаем от вас:

  • Хорошее знание Python;
  • Опыт решения production DS-задач в интернет-бизнесе (желателен опыт с задачами ранжирования или рекомендаций);
  • Наличие фундаментальной математической базы, знание алгоритмов;
  • Опыт работы с большей частью нашего стека технологий.

Что мы предлагаем:

  • В первую очередь, интересные задачи. Примеры проблем, с которыми борется наша команда: "холодный старт" товаров и запросов (как понять, куда поставить товар в выдаче, когда у нас нет по нему статистики); позиционный и другие bias в ранжировании (товары, которые стоят выше, видят чаще, поэтому у них больше "хорошей" статистики); релевантность vs заказы: (зачастую люди покупают мелочевку и аксессуары, но хотят видеть в топе основные и дорогие товары); предсказание категории, типа товара и других сущностей по тексту запроса;
  • Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce;
  • Свободу действий в принятии решений;
  • Достойный уровень заработной платы;
  • Профессиональную команду, которой мы гордимся;
  • Возможность развиваться вместе с нашим бизнесом.

Data Scientist, Поиск

В архиве с 27 ноября 2021
з/п не указана

Вакансия в архиве

Работодатель, вероятно, уже нашел нужного кандидата и больше не принимает отклики на эту вакансию

Показать описание вакансии

Похожие вакансии