от компании (организации): Сбер. IT в городе (населённом пункте): Москва, Россия
в отрасли экономики "Информационные технологии, интернет, телеком" → "Развитие бизнеса"
с заработной платой: по договоренности
Вакансия № 22264123 добавлена в базу данных сайта Работа в Москве и Московской области (МО, Подмосковье): Суббота, 12 октября 2024 года.
Дата обновления вакансии № 22264123 на сайте Работа в Москве и Московской области (МО, Подмосковье): Четверг, 14 ноября 2024 года.
Обращаем Ваше внимание, что на момент обращения к работодателю вакансия № 22264123 может быть уже занята. Администрация сайта Работа в Москве и Московской области (МО, Подмосковье) приносит извинения за доставленные неудобства.
Требования к опыту работы:
1–3 года
Тип занятости:
полная занятость
График работы:
полный день
Дополнительные сведения о вакансии: Data analyst (middle/senior)
SberDevices - инновационное направление компании, которое создает умные устройства, виртуальных ассистентов и другие продукты в области Speech Recognition, NLP, Computer Vision.
Команда речевых технологий ищет Аналитика данных. У нас сильная и активная команда (ex-Yandex, выпускники МФТИ, МГУ, ВШЭ, ШАД). Мы создаем технологическую платформу: занимаемся созданием и развитием голосовых технологий (ASR, TTS, Keyword Spotting, Emotion Recognition). В последние годы эта область развивается быстрыми темпами, и мы активно следим и внедряем лучшие решения в наши продукты.
Помимо всего этого, девайсы активно опенсорсят в комьюнити (датасет Golos, GPT-3, SBERT - крутые эмбеддинги текстов), пишут статьи (https://arxiv.org/pdf/2106.10161.pdf, https://www.mdpi.com/1424-8220/21/20/6744), двигают рынок.
Кстати говоря, разметка и human in the loop очень горячая тема сейчас, так что потенциально можно сделать крутую работу.
Основные задачи:
- Keyword Spotting (Wake-word detection) - важный компонент речевых технологий, через который проходит любое взаимодействие пользователя с устройством. Цель алгоритма keyword spotting - выявить ключевое слово в условиях шума и не допустить ложных активаций. Сейчас у нас делают много ML экспериментов, но не хватает человека, который очень хорошо разберется в данных, найдет косяки разметки, проверит качество разметки, придумает новые полезные сценарии для записи звука, придумает вместе с нами, как улучшить тест сеты, чтобы они лучше отображали реальность;
- ASR - распознавание речи, automatic speech recognition. Краеугольная задача нашего отдела - сделать качественный, быстрый и стабильный ASR. Дата аналитик в этой команде должен будет работать бок о бок с нашими DL инженерами и ресечерами, предлагать сценарии экспериментов в части данных, разбираться, где наши слабые и сильные стороны. Строить дата-пайплайны, улучшать разметку.
Требования к работнику на вакансии: Data analyst (middle/senior)
- Уверенное владение Python, Git, Linux;
- Хорошо писать код;
- Драйв. Дата аналитики могут стать центром ML движухи, мы ищем очень активных людей;
- Базовое знание статистики;
- Хорошее верхнеуровневое понимание ML систем, отличное знание метрик (будем спрашивать, что такое precision, recall!).
Будет плюсом:
- Обучение в ШАД;
- Опыт с краудсорсингом;
- Опыт работы с моделями распознавания речи;
- Базовое понимание цифровой обработки сигналов.
Условия труда для работника на вакансии: Data analyst (middle/senior)
- Мощные сервера, терабайты данных;
- Свой сервис разметки, прямое влияние на данные и соответственно весь ML;
- Конференции и обучение, возможность выступать на внутренних и внешних мероприятиях;
- Офис или удаленка;
- ДМС, сниженные ставки по кредитованию, программы лояльности для сотрудников.
Откликнуться на эту вакансию: Data analyst (middle/senior)
Предыдущая вакансия:
Вакансия № 22264121 на должность Бухгалтер на первичную документацию от компании ООО ОЗСАР ОРМЕ КУМАШ в городе (населенном пункте) Дзержинский