Вакансия в архиве
Работодатель, вероятно, уже нашел нужного кандидата и больше не принимает отклики на эту вакансию
Исследование и разработка статистических моделей для анализа данных
Получение данных (Data-mining), работа с данными в виде Rest-API сервисов и реляционными базами данных (MySQL, PostgreSQL)
Обработка изображений OCR
Обработка звука ASR
Обработка OCR и ASR-моделей , построение пайплайнов обработки, векторизация, матрицы свёртки
Тестирование гипотез, корреляционный анализ, факторный анализ, фиче-инжининиг, поиск структуры в данных
Проектирование и разработка моделей машинного обучения, тренировка классификаторов
Доведение моделей машинного обучения до прода
А/В тестирование моделей и выбор наилучшего решения, разработка платформы A / B-тестирования качества создаваемых моделей
написание статей, отчетов по исследованиям и документации к моделям
Изучение потребности компании и разработка решении, в сотрудничестве с отделами управления продуктами и инженерными отделами
Обсуждение результатов и статистических концепций с руководителями
Разработка пользовательских моделей данных и алгоритмов
Создание процессов и инструментов, помогающих отслеживать и анализировать производительность и точность данных
Применение прогнозного моделирования для улучшения и оптимизации клиентского опыта, получения дохода, таргетинга рекламы и т. д.
Требования:
Высшее техническое или физико-математическое образование
Сильные математические навыки. Прекрасное знание теорвера, линала и матстата (умение объяснить теорему Байеса, определить, что такое статистически значимая выборка, доказать Центральную предельную теорему, объяснить суть быстрого и обратного преобразования Фурье)
Знание передовых статистических методов и концепций
Сильные аналитические навыки
Совершенное владение матрицами и тензорами (SVD, тензорный поезд)
Понимание оценок качества классификаторов (ROC-AUC, PR, F1)
Умение работать с методами кластеризации данных: иерархическая (дендрограмма), PCA, t-SNE
Опыт использования статистических методов и методов интеллектуального анализа данных (таких как градиентный бустинг, обобщенные линейные модели / регрессия, случайные леса, деревья и анализ социальных сетей)
5-7 лет опыта построения статистических моделей и обработки наборов данных
Наличие профиля в Kaggle не моложе 2х лет, участие, как минимум, в трёх соревнованиях Kaggle
Владение Python, умение строить REST-API с помощью фреймворков Flask, Fast-API и т.д.
Использование numpy, pandas - умение векторизировать алгоритмы матричными операциями
Владение Tensorflow, Sklearn, PyTorch
Опыт в построении моделей классификации (kNN, DTree, FastForward-NN, SGD, GB, RandomForest, SVM)
Опыт в тренировке моделей машинного обучения: обработка пропусков, кросс-валидация, разделение выборок
Знание типов слоёв для преобразований данных (пуллинг) в Keras
Умение строить собственные функции потерь, коллбеки в Tensorflow и Scikit-learn
Практическое применение ансаблирование методов машинного обучения: беггинг, бустинг, стекинг, мажоритарное голосование
Опыт анализа данных от сторонних поставщиков, таких как AdWords, Coremetrics, Crimson, Facebook Insights, Google Analytics, Hexagon и Site Catalyst.
Опыт работы с распределенными данными и вычислительными инструментами, такими как Hadoop, Hive, Gurobi, Map / Reduce, MySQL и Spark
Опыт по визуализации и представлению данных с помощью Business Objects, D3, ggplot и Periscope.
Работа в «ПризываНет» — это:
Стабильность оформление по ТК РФ
Развитиепрофессиональный и карьерный рост
Возможности релокациис нашей финансовой и моральной поддержкой
Обучение развитая система наставничества
Отдых развитая
корпоративная
культура
ООО МПК представляет бренд Призыванет.Ру
Работодатель, вероятно, уже нашел нужного кандидата и больше не принимает отклики на эту вакансию