Вакансия № 20323055 добавлена в базу данных сайта Работа в Москве и Московской области (МО, Подмосковье): Вторник, 3 сентября 2024 года.
Дата обновления вакансии № 20323055 на сайте Работа в Москве и Московской области (МО, Подмосковье): Пятница, 20 сентября 2024 года.
Обращаем Ваше внимание, что на момент обращения к работодателю вакансия № 20323055 может быть уже занята. Администрация сайта Работа в Москве и Московской области (МО, Подмосковье) приносит извинения за доставленные неудобства.
-
ые функции сотрудника:
-
Исследование и разработка статистических моделей для анализа данных
-
Получение данных (Data-mining), работа с данными в виде Rest-API сервисов и реляционными базами данных (MySQL, PostgreSQL)
-
Обработка изображений OCR
-
Обработка звука ASR
-
Обработка OCR и ASR-моделей , построение пайплайнов обработки, векторизация, матрицы свёртки
-
Тестирование гипотез, корреляционный анализ, факторный анализ, фиче-инжининиг, поиск структуры в данных
-
Проектирование и разработка моделей машинного обучения, тренировка классификаторов
-
Доведение моделей машинного обучения до прода
-
А/В тестирование моделей и выбор наилучшего решения, разработка платформы A / B-тестирования качества создаваемых моделей
-
написание статей, отчетов по исследованиям и документации к моделям
-
Изучение потребности компании и разработка решении, в сотрудничестве с отделами управления продуктами и инженерными отделами
-
Обсуждение результатов и статистических концепций с руководителями
-
Разработка пользовательских моделей данных и алгоритмов
-
Создание процессов и инструментов, помогающих отслеживать и анализировать производительность и точность данных
-
Применение прогнозного моделирования для улучшения и оптимизации клиентского опыта, получения дохода, таргетинга рекламы и т. д.
-
Высшее техническое или физико-математическое образование
-
Сильные математические навыки. Прекрасное знание теорвера, линала и матстата (умение объяснить теорему Байеса, определить, что такое статистически значимая выборка, доказать Центральную предельную теорему, объяснить суть быстрого и обратного преобразования Фурье)
-
Знание передовых статистических методов и концепций
-
Сильные аналитические навыки
-
Совершенное владение матрицами и тензорами (SVD, тензорный поезд)
-
Понимание оценок качества классификаторов (ROC-AUC, PR, F1)
-
Умение работать с методами кластеризации данных: иерархическая (дендрограмма), PCA, t-SNE
-
Опыт использования статистических методов и методов интеллектуального анализа данных (таких как градиентный бустинг, обобщенные линейные модели / регрессия, случайные леса, деревья и анализ социальных сетей)
-
5-7 лет опыта построения статистических моделей и обработки наборов данных
-
Наличие профиля в Kaggle не моложе 2х лет, участие, как минимум, в трёх соревнованиях Kaggle
-
Владение Python, умение строить REST-API с помощью фреймворков Flask, Fast-API и т.д.
-
Использование numpy, pandas - умение векторизировать алгоритмы матричными операциями
-
Владение Tensorflow, Sklearn, PyTorch
-
Опыт в построении моделей классификации (kNN, DTree, FastForward-NN, SGD, GB, RandomForest, SVM)
-
Опыт в тренировке моделей машинного обучения: обработка пропусков, кросс-валидация, разделение выборок
-
Знание типов слоёв для преобразований данных (пуллинг) в Keras
-
Умение строить собственные функции потерь, коллбеки в Tensorflow и Scikit-learn
-
Практическое применение ансаблирование методов машинного обучения: беггинг, бустинг, стекинг, мажоритарное голосование
-
Опыт анализа данных от сторонних поставщиков, таких как AdWords, Coremetrics, Crimson, Facebook Insights, Google Analytics, Hexagon и Site Catalyst.
-
Опыт работы с распределенными данными и вычислительными инструментами, такими как Hadoop, Hive, Gurobi, Map / Reduce, MySQL и Spark
-
Опыт по визуализации и представлению данных с помощью Business Objects, D3, ggplot и Periscope.