от компании (организации): Сбер для экспертов в городе (населённом пункте): Москва, Россия
в отрасли экономики "Информационные технологии, интернет, телеком" → "Web инженер"
с заработной платой: по договоренности
Вакансия № 25499370 добавлена в базу данных сайта Работа в Москве и Московской области (МО, Подмосковье): Суббота, 7 сентября 2024 года.
Дата обновления вакансии № 25499370 на сайте Работа в Москве и Московской области (МО, Подмосковье): Воскресенье, 22 сентября 2024 года.
Обращаем Ваше внимание, что на момент обращения к работодателю вакансия № 25499370 может быть уже занята. Администрация сайта Работа в Москве и Московской области (МО, Подмосковье) приносит извинения за доставленные неудобства.
Требования к опыту работы:
1–3 года
Тип занятости:
полная занятость
График работы:
полный день
Дополнительные сведения о вакансии: Junior Data Scientist NLP
Наша команда занимается задачами, связанными с интеллектуальной обработкой документов, созданием систем извлечения информации из текста документов (NER, QA, MRC) и структурных элементов, например таблиц.
Помимо проектов с обработкой документов, мы также создаем фреймворки для типовых задач в области CV и NLP, которыми пользуются многие команды банка.
У нас открывается новое направление по созданию мультимодальных (картинка+текст) и генеративных NLP моделей для извлечения информации, которые можно использовать с минимальным размером обучающего датасета.
Задачи:
- Развитие собственного фреймворка для NLP и NER задач - AutoNER
- Research Meta-learning, Few-shot NER, Active Learning, MRC и другие модные способы обучения на маленьких датасетах
- Разработка AutoML сервиса на основе AutoNER для подбора процесса обучения на основе данных
Обязанности:
- Имплементация и обучение моделей NLP: классификации, NER, QA, RE и суммаризация.
- Чтение статей и перекладывание SOTA на пром рельсы
- Запуск распределенного обучения на GPU кластере MLSpace (Кристофари)
- Организация циклов дообучения на новых данных (постановка задач разметчикам, запуск crowdsource майнинга данных и т.д)
- Оптимизация моделей для исполнения: квантизация, прунинг и дистилляция моделей. Портирование на :tensorrt: и :openvino:
- Релизы новых моделей и фреимворков в среды исполнения
Ожидаем от кандидата:
- Отличное знание одного из :pytorch1-0:, :tf: + numpy, sklearn, pandas
- Опыт разработки/обучения/внедрения одной или нескольких типов моделей: Text classification, NER, QA
- Хорошее знание классического и нейросетевого NLP
- Хорошее знание алгоритмов, python3, ООП, SOLID, git, docker
- Желание изучать новые подходы, модели и технологии
Плюсом будет:
- Хороший профиль на :github:
- Медальки на :kaggle:
- Участие в open-source проектах
Условия труда для работника на вакансии: Junior Data Scientist NLP
- ипотека выгоднее для каждого сотрудника и льготные условия кредитования;
- бесплатная подписка СберПрайм+;
- скидки на продукты компаний-партнеров: Okko, Сбер Маркет, Delivery Club, Самокат, Ситимобил, Сбер Еаптека и другие;
- ДМС с первого дня и льготное страхование для близких;
- корпоративная пенсионная программа;
- курсы для будущих родителей, материальная поддержка и тематическое сообщество для молодых мам;
- детский отдых и подарки за счет Компании;
- обучение за счет Компании: онлайн курсы в Виртуальной школе Сбера и неограниченный доступ к библиотеке, обучение в Корпоративном университете, тренинги, митапы и возможность получить новую квалификацию;
- реферальная программа для сотрудников: можно пригласить в команду знакомых профессионалов и получить вознаграждение до 100 тыс. рублей;
- скидки на отдых в лучшем в мире курортном комплексе «Mriya Resort & SPA» в Ялте.
Откликнуться на эту вакансию: Junior Data Scientist NLP
Предыдущая вакансия:
Вакансия № 25499367 на должность Инженер DevOps от компании Samsung Research Russia в городе (населенном пункте) Москва