
Был вчера в 13:31
Миннебаев Руслан Ильдусович
Мужчина, 31 год, родился 17 мая 1994
Не ищет работу
Киров (Кировская область), не готов к переезду, не готов к командировкам
Контакты

Указан примерный район поиска работы
Data scientist
Специализации:
- Врач
- Дата-сайентист
Занятость: частичная занятость, проектная работа, стажировка
График работы: удаленная работа
Опыт работы 1 год 10 месяцев
Сентябрь 2022 — Июнь 2024
1 год 10 месяцев
Московский физико-технический институт (Государственный университет)
Москва
Образовательные учреждения... Показать еще
Магистр
Выполнение проектов по Data Science
1. Computer Vision:
1.1. "Автоматизированное определение тубулита на основании критериев Banff-классификации патологии аллотрансплантата почки". Анализ скан-изображений гистологических препаратов пункционных биоптатов трансплантированных почек. Разработаны модели сегментации на архитектурах U-Net, YOLOv8, SegFormer. На валидационной выборке Recall 0.663, Precision 0.543. Использован комбинированный метод, основанный на каскаде моделей YOLOv8 (инстанс сегментация и детекция) с достижением Recall 0.69 и Precision 0.581.
1.2. Нейросеть "Клетки мозга". Задача: разработка нейросети для детекции нейронов в области гиппокамка головного мозга и подсчет их количества в случайной области размером 300 мкм для решения прикладных вопросов о наличии нейродегенаритвных заболеваний головного мозга. Роль в проекте: подготовка датасета, разработка скрипта на языке Python для подсчета количества клеток после предсказания нейросети. Детекция нейронов на архитектуре YOLOv8. Результат: mAP50
0.742.
2. Проект рекомендательной системы для аптек. Задача: подобрать оптимальные 5 рекомендаций для купленного товара в чеке. Использована векторная модель Word2Vec.
3. Хакатон от компании Медси. Работа с NLP. Задача команды заключалась в автоматизации разбора текстов гарантийных писем с целью определения перечня услуг, оплачиваемых страховой компанией. Сложность была обусловлена большим объемом текстовой информации, особенностями форматов писем различных страховых компаний и индивидуальностью покрытия услуг для каждого клиента. Решение требовало соотнесении извлеченную текстовую информацию о согласованных услугах с перечнем услуг компании Медси.
Выполняемые задачи: предобработка текста и аугментация датасета с помощью библиотек pymophy3, pandas ntlk, nlpaug. Результат: Создан телеграмм-бот, классифицирующий письмо с Hamming Score 97%. Победители хакатона в составе команды.
4. Выполнение работ, связанных с анализом больших данных. В рамках учебной практики проведен хакатон от компании ОнкоАтлас. Разработка модели предсказания первичной опухоли по молекулярному профилю. Роль в проекте: подготовка и расширение датасета. Дополнительно: решение задачи на основе библиотеки XGBoost с оптимизацией на Optuna. Результат: победители в составе команды.
5. Основы Data Engineering (понимание ETL-процессов, работа с микросервисами на основе Flask)
Навыки
Уровни владения навыками
Базовый уровень
Уровень не указан
Опыт вождения
Имеется собственный автомобиль
Права категории BОбо мне
Опыт работы клиническим врачом в течение 5 лет. Более 1,5 лет занимаюсь Data Science. В настоящее время интересно развитие в области Computer Vision и Recommendation System на стыке с медициной.
Высшее образование (Магистр)
2024
Центр дополнительного, дополнительного профессионального и онлайн-образования "Пуск" (Центр "Пуск"), Прикладной анализ данных в медицинской сфере
2024
Цифровая кафедра, Специалист по анализу медицинских данных
Знание языков
Электронные сертификаты
2024
Гражданство, время в пути до работы
Гражданство: Россия
Разрешение на работу: Россия
Желательное время в пути до работы: Не имеет значения