от компании (организации): Сбер. IT в городе (населённом пункте): Москва, Россия
в отрасли экономики "Маркетинг, реклама, PR" → "PR, маркетинговые коммуникации"
с заработной платой: по договоренности
Вакансия № 32496099 добавлена в базу данных сайта Работа в Москве и Московской области (МО, Подмосковье): Пятница, 18 октября 2024 года.
Дата обновления вакансии № 32496099 на сайте Работа в Москве и Московской области (МО, Подмосковье): Четверг, 14 ноября 2024 года.
Обращаем Ваше внимание, что на момент обращения к работодателю вакансия № 32496099 может быть уже занята. Администрация сайта Работа в Москве и Московской области (МО, Подмосковье) приносит извинения за доставленные неудобства.
Требования к опыту работы:
1–3 года
Тип занятости:
полная занятость
График работы:
полный день
Дополнительные сведения о вакансии: Middle CV/DL инженер-исследователь
Цифровые поверхности Салют (SberDevices) — уникальное IT-пространство внутри Сбера. Мы занимаемся разработкой голосовых продуктов, умных устройств и виртуальных персонажей.
Ищем Middle CV/DL инженера-исследователя на направление видео в межкомандном проекте по мультимодальности. Мы обучаем большие языковые модели (LLM) понимать не только тексты на естественном языке, но и видео, картинки, звук.
Основные направления работы:
-
дообучение больших языковых моделей для понимания модальности видео, в т.ч. визуальной и звуковой составляющих
-
эксперименты с различными архитектурами видео-энкодеров и адаптеров
-
оптимизация кодирования длинного контекста для обработки длинных видео
-
генерация и фильтрация синтетических инструктивных данных для обучения
-
генерация синтетических видео-данных для обучения и валидации
-
сбор бенчмарка на русском языке для оценки моделей
Что предстоит делать:
-
имплементировать новые модули для видео модальности в рамках фреймворка обучения LLM на базе открытых решений и статей
-
проводить эксперименты с различными архитектурами энкодеров и конфигурациями датасетов
-
рассчитывать метрики качества в задачах video и image understanding
-
дорабатывать подходы к синтезу инструктивных данных для обучения
-
читать актуальные статьи на английском по направлениям video encoders, video understanding
Необходимые навыки:
-
опыт работы в CV/NLP от 2-лет
-
тех. стек: Python, Pytorch, OpenCV, Transformers
-
знание и понимание базовых архитектур моделей для решения CV задач
-
базовое понимание подходов к дообучению LLM (SFT, LoRA, QLoRA)
-
хорошие навыки написания кода
-
умение вести разработку в команде
-
английский для чтения документации
Будет плюсом:
-
-
имеете опыт с задачами NLP, особенно LLM
-
работали с библиотеками Mosaic ML (llm-foundry, streaming и т.д.) и FSDP
-
имеете опыт работы с аудио-модальностью
Почему тебе понравится работать с нами:
-
-
очень сильная молодая команда, с которой можно расти вместе, в команде происходит ооооочень много интересного - будет на что посмотреть и у кого поучиться
-
масштабные, сложные и разнообразные задачи, есть возможность влиять на развитие проекта и результат
-
знаменитый офис на Кутузовском проспекте с парковкой и спортзалом, возможность выбора формата работы
-
расширенная программа ДМС (возможность подключения родственников), страхование жизни, специальные условия по кредитам/ипотеке, скидки от компаний-партнёров
-
атмосфера стартапа и надёжность гиганта.
Откликнуться на эту вакансию: Middle CV/DL инженер-исследователь
Предыдущая вакансия:
Вакансия № 32496098 на должность IT Data Engineer от компании Schlumberger. АО ИКФ-Сервис в городе (населенном пункте) Москва