от компании (организации): SL Soft в городе (населённом пункте): Москва, Россия
в отрасли экономики "Информационные технологии, интернет, телеком" → "Программирование, разработка"
с заработной платой: по договоренности
Вакансия № 29956181 добавлена в базу данных сайта Работа в Москве и Московской области (МО, Подмосковье): Вторник, 5 ноября 2024 года.
Дата обновления вакансии № 29956181 на сайте Работа в Москве и Московской области (МО, Подмосковье): Среда, 13 ноября 2024 года.
Обращаем Ваше внимание, что на момент обращения к работодателю вакансия № 29956181 может быть уже занята. Администрация сайта Работа в Москве и Московской области (МО, Подмосковье) приносит извинения за доставленные неудобства.
Требования к опыту работы:
3–6 лет
Тип занятости:
полная занятость
График работы:
гибкий график
Дополнительные сведения о вакансии: Data Scientist
SL Soft — разработчик импортонезависимых полнофункциональных бизнес-приложений. Линейка продуктов включает в себя ECM, HRM, RPA, BI и AI-инструменты.
Приглашаем дата-сайентиста на проект Сойка https://soica.ru/
Компания Сойка входит в группу компаний SLSoft и занимается разработкой продуктов для решения задач в сфере интеллектуальной обработки документов. Главным продуктом является одноимённая платформа “Soica”, предназначенная для потокового распознавания документов в больших объемах. Эффективность платформы была доказана крупными федеральными проектами. Клиентами компании являются такие крупные клиенты как Tele2, Рэйл Альянс, ФНС и другие.
Одним из продуктов компании является OCR движок с расширенной функциональностью (предобработка изображений, детектирование и классификация нетекстовых объектов), далее SDK.
SDK разрабатывается на языке C++. В связи с расширением круга решаемых задач, компания ищет дата-сайентиста, ML-инженера для работы в команде разработки SDK. Расширение и углубление исследований планируется по следующим направлениям:
- Детекция текста;
- Детекция нетекстовых объектов;
- Распознавание текста (OCR);
- Структурный анализ документа (Document Layout Analysis);
- Классификация типов документов;
- Классификация шумов и дефектов документов;
- Нормализация документов;
- Реставрация документов.
Обязанности работника на вакансии: Data Scientist
- Проведение исследования литературы по направлениям.
- Организация пайплайна обучения ML моделей.
- Трансформация пайплайна обучения в продакшн пайплайн на CPU.
- Взаимодействие со специалистами, отвечающими за встраивание ML алгоритмов в SDK на C++.
- Организация процесса разметки данных.
Требования, технические навыки:
- Основной язык: Python.
- Основной ML фрэймворк: Pytorch.
- Системы разметки данных для CV: CVAT (или другая подобная).
- Библиотеки обработки изображений и тензоров: OpenCV, numpy, pillow.
- Запуск ML модели в продакшн под CPU: Onnx, OnnxRuntime, OpenVino.
- Общие инструменты разработки: Git, Docker.
Будет плюсом:
- Опыт решения задач детекции текста, OCR, DLA и т.д.
- Опыт работы с OpenMMLab: MMEngine, MMCV, MMOCR, MMDetection
- Опыт переноса ML пайплайна с Python на C++
- Опыт работы с другими ML фрэймворками: Tensorflow, keras, PaddlePaddle и т.д.
- Понимание принципов разработки в ООП парадигме.
- Умение организовать процесс обучения и в Linux, и в Windows.
- Исследовательский опыт, публикация статей.
Условия труда для работника на вакансии: Data Scientist
- Официальное трудоустройство в штат компании с первого рабочего дня.
- Зарплата "белая", фиксированный оклад.
- Удаленная работа или можем предложить комфортный офис SL Soft. Удобное расположение делового квартала "Новоспасский" (м. Пролетарская, м. Павелецкая).
- Рабочий день начинается не позже 10:00 по Москве.
- ДМС после первого месяца работы в компании.
Откликнуться на эту вакансию: Data Scientist
Предыдущая вакансия:
Вакансия № 29956171 на должность QA Engineer Middle+ / Тестировщик от компании ООО Интеллектуальные Динамические Системы в городе (населенном пункте) Москва