AVsoft — динамично развивающаяся IT‑компания, специализирующаяся на разработке инновационных программных решений в сфере информационной безопасности и анализа данных. Мы создаём высокотехнологичные продукты для корпоративного сегмента, сочетая передовые алгоритмы машинного обучения с практическими бизнес‑задачами.
Мы ищем ML‑инженера для участия в разработке интеллектуальных систем анализа данных. Вам предстоит работать над коммерчески успешными продуктами, внедрять современные ML‑подходы и оптимизировать существующие решения.
Продукты над которыми тебе предстоит работать:
ATHENA
Интеллектуальная система анализа киберугроз, использующая ML для:
- Выявления аномалий в сетевом трафике;
- Прогнозирования атак на основе поведенческого анализа;
- Автоматической классификации вредоносного ПО;
- Детектирования фишинга
KAIROS
Почтовый шлюз для анализа входящей почты, использующая МЛ для:
- Детекции спама
- Детекции фишинга и его техник
- Визуального анализа сайта
- Поведенческого анализа сайта
В твои обязанности будет входить:
- Участвовать в полном цикле разработки — от понимания бизнес-задачи и подготовки данных до обучения, тестирования, деплоя
- Сбор, очистка, нормализация данных, построение признаков (feature engineering) и разработка ETL-пайплайнов для задач классификации и детектирования аномалий.
- Разработка и обучение ML-моделей (включая классические алгоритмы и deep learning) для решения задач классификации, детектирования аномалий и предсказания.
- Упаковка моделей в контейнеры (Docker), их деплой в виде REST-сервисов, оптимизация скорости инференса.
- Обеспечение стабильной работы моделей, мониторинг качества, выявление data drift и concept drift, планирование и проведение переобучения моделей.
- Опыт разработки и деплоя ML-моделей в продакшн.
- Уверенное знание Python и основных библиотек: numpy, pandas, scikit-learn, PyTorch, CatBoost, XGBoost, LightGBM, transformers.
- Опыт работы с классическими ML-моделями (XGBoost, LightGBM, Random Forest) и SOTA-подходами (включая NLP/CV).
- Навыки работы с SQL и системами контроля версий (Git).
- Практический опыт работы с Docker и развертыванием сервисов (REST API).
- Опыт оркестрации пайплайнов (Airflow или аналоги).
- Знание Linux как рабочей среды.
- Понимание принципов MLOps, управления экспериментами и версионирования данных/моделей.
- Умение писать читаемый, тестируемый и эффективный код.
- Английский язык на уровне чтения технической документации.
- Будет плюсом: • Опыт оптимизации и оптимизации DL-моделей с помощью ONNX, TensorRT • Знание методов интерпретации моделей (SHAP, LIME) и уязвимостей ML-моделей • Опыт интеграции ML-моделей в реальные сервисы и взаимодействия с командами разработки • Опыт работы с несбалансированными задачами и аномалиями (unsupervised/semi-supervised anomaly detection)• Желание расти, предлагать новые решения и улучшать продукты.
- оформление по ТК в аккредитованной ИТ компании
- гибкое начало рабочего дня с 9:00 или с 10:00 (работа в офисе). Возможен гибрид после испытательного срока.
- оформление ДМС после 2 года работы в компании
- ведение задач в единой системе, актуализация вики и гайдов
- обучение по продуктам компании и корпоративная библиотека
- возможность приобретения обучающих курсов за счет компании
- проекты в области информационной безопасности и коммуникации
- уютный офис в шаговой доступности от ст. метро Окружная
Ключевые навыки
- Python
- Git
- Работа с базами данных
- Английский язык
- PostgreSQL
- Docker
- Numpy
- pandas
- CatBoost
- PyTorch
- nlp
- cv
- MLOps
- Apache Airflow
- Английский — B2 — Средне-продвинутый