от компании (организации): Cellar door в городе (населённом пункте): Москва, Россия
в отрасли экономики "Наука, образование" → "Информатика, информационные системы"
с заработной платой: по договоренности
Вакансия № 19981543 добавлена в базу данных сайта Работа в Москве и Московской области (МО, Подмосковье): Вторник, 10 сентября 2024 года.
Дата обновления вакансии № 19981543 на сайте Работа в Москве и Московской области (МО, Подмосковье): Суббота, 21 сентября 2024 года.
Обращаем Ваше внимание, что на момент обращения к работодателю вакансия № 19981543 может быть уже занята. Администрация сайта Работа в Москве и Московской области (МО, Подмосковье) приносит извинения за доставленные неудобства.
Требования к опыту работы:
1–3 года
Тип занятости:
полная занятость
График работы:
полный день
Дополнительные сведения о вакансии: Data scientist (NLP/NLU, в Санкт-Петербург)
Мы в поисках опытных Data science инженеров на NLP направление с переездом в Санкт-Петербург для нашего клиента, компании Just AI.
Just AI на рынке с 2016 года. Это продуктовая разработка разговорного AI.
Фокус Just AI — технологии понимания естественного языка, инструменты для создания голосовых ассистентов, машинного обучения, speech synthesis and voice cloning, системы управления диалогом, NLU/NLP/DM/ODQA/CDQA.
Клиенты Just AI — банки, телеком, ритейл, IT-компании. Среди них Yandex, Mail.ru Group, Сбер, МТС, Мегафон, Альфа-банк, HH.ru, Qiwi, BNP Paribas. SAAS-платформы и инженерные фреймворки используют 40 000 разработчиков и МСБ по всему миру.
Штат компании — 170 человек, 7 команд разработки. Головной офис в Питере. Часть разработчиков работает на удаленке.
DevOps инженеры и тех.писатели кросскомандные.
Есть DS команда, которая занимается TTS, развитием синтеза речи.
Just AI развивает и активно продвигает продукты на зарубежных рынках. Поэтому создают новое выделенное направление в DS. Цель — разработка новых моделей и алгоритмов решения NLP-задач в диалоговых системах и развитие разговорного AI.
1 продукт — NLP-провайдер CAILA.
Сейчас им пользуется более 250 компаний в облаке и контуре. Ежедневно облачный провайдер обрабатывает 400 тыс. сообщений в день с пиками до 1k RPS на русском, английском, китайском и португальском языках
Продуманные ML алгоритмы помогают работать с датасетами, создавать классификаторы вручную или из необработанных логов, распознавать именованные сущности, классифицировать интенты.
Продукт позволяет умным чат-ботам и голосовым ассистентам понимать пользователей.
Задачи
-
Исследование, бенчмаркинг и отбор существующих NLP-библиотек (NER, Intent Classification, препроцессинг и т.п.) для интеграции в мультилингвальный NLP-провайдер.
-
Анализ диалоговых данных, оценка существующих алгоритмов и моделей, разработка предложений по улучшению.
-
Разработка новых и доработка и поддержка текущих библиотек, моделей и алгоритмов по замечаниям лингвистов и пользователей.
-
Подбор ML инженеров себе в команду.
Примеры задач на ближайший год
1. Найти, протестировать, оценить на бенчмарках готовые библиотеки для токенизации, выделения сущностей, классификации диалоговых фраз на 15-ти новых языках.
2. Провести сравнительную оценку наших NLU-решений с существующими аналогами на рынке. Проверить на бенчмарк-тестах и проприетарных данных. Найти сильные и слабые стороны каждого решения.
3. Оценить применимость (по качеству и скорости) ML-моделей для решения NLU задач.
4. Решать проблемы обработки NLP на примере: "The words "?", "?", "?" after "?" are stop words or auxiliary words, which do not affect the meaning of the sentence, so they should also match the "?" in the intent. Предложить решение в рамках существующего стека технологий.
5. Участвовать в проектировании NLP-провайдера.
6. Построение MLOps платформы.
2 продукт — Chit-Chat.
Он обеспечивает общение на свободные темы от имени голосового ассистента, в соответствии с его образом.
Задачи
-
Разработка моделей для Chit-Chat'a: generative model, retrieving model, ranking model, classifiers и т.д.;
-
Обучение моделей, их валидация, написание сервисов и интерфейсов к разработанным модулям, постановка А/Б тестов;
-
Анализ диалоговых данных, оценка существующих алгоритмов и моделей, разработка предложений по улучшению;
-
Доработка и поддержка библиотек, моделей и алгоритмов по замечаниям лингвистов и пользователей.
Ваши задачи на ближайший год
-
Организовать сбор данных для создания Chit-Chat-моделей;
-
Обучить retrieving модель Chit-Chat'а;
-
Организовать и провести эксперимент по оценке Chit-Chat'ов с помощью асессоров;
-
Создать сервис кастомизируемого Chit-Chat'а на основе сценариев и retrieving-модели;
-
Обучить generative модель Chit-Chat'а.
Для нас важно
-
Коммерческий опыт в роли Data scientist/ ML/ DL engineer от 2 лет.
-
Навык работы с классическим ML Python стеком (scikit-learn/SciPy/pandas/NumPy/PyTorch).
-
Опыт с библиотеками для NLP: NLTK, DeepPavlov, Spacy, Gensim, UDPipe.
-
Отличный технический английский (для чтения и понимания).
Супер, если у вас есть опыт в MLOps.
От компании
-
Официальное трудоустройство.
-
Переезд в Санкт-Петербург. При релокации оплата переезда и проживания первый месяц.
-
Офис на Петроградке.
-
Возможен гибридный формат: 3 дня удаленно, 2 офис.
-
Зарплата зависит от вашего опыта и ожиданий.
-
Технологичность — кажется, что в сфере AI всегда много проф.вызовов.
-
Отсутствие легаси и множество новых фич.
-
Выход продуктов на международный уровень.
-
Участие в научных и прикладных конференциях в России и за рубежом.
-
Кафетерий льгот (на выбор): ДМС/частный врач/спорт/обучение.
-
Обилие ивентов по обмену опытом, митапов.
-
Корпоративные вечеринки, джаз-концерты, совместные кинопросмотры.
Откликнуться на эту вакансию: Data scientist (NLP/NLU, в Санкт-Петербург)
Предыдущая вакансия:
Вакансия № 19981539 на должность Преподаватель курса "Первый сайт" от компании АНО УКЦ Новая волна в городе (населенном пункте) Дмитров