от компании (организации): Альфа-Банк в городе (населённом пункте): Москва, Россия
в отрасли экономики "Искусство, развлечения, масс-медиа" → "Фотография"
с заработной платой: по договоренности
Вакансия № 32130932 добавлена в базу данных сайта Работа в Москве и Московской области (МО, Подмосковье): Воскресенье, 21 июля 2024 года.
Дата обновления вакансии № 32130932 на сайте Работа в Москве и Московской области (МО, Подмосковье): Пятница, 20 сентября 2024 года.
Обращаем Ваше внимание, что на момент обращения к работодателю вакансия № 32130932 может быть уже занята. Администрация сайта Работа в Москве и Московской области (МО, Подмосковье) приносит извинения за доставленные неудобства.
Требования к опыту работы:
1–3 года
Тип занятости:
полная занятость
График работы:
полный день
Дополнительные сведения о вакансии: Старший инженер данных (Департамент продвинутой аналитики)
Цель: создание и поддержка решений по подготовке больших данных в целях применения в моделях Продвинутой Аналитики (ПА)
Чем предстоит заниматься
- Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка
- Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения
- Разработка и поддержание в актуальном состоянии документации по разработанному функционалу
- Разработка контролей качества данных
- Своевременное отражение статуса выполнения задач в Jira
- Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных
- Заполнение информации по витринам данных ДПА в OpenMetaData (инструмент ДУД для процессов управления данными DataGovernance)
Что мы ждем от вас
- Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП (Функциональное программирование), опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas
- Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников
- Способность разобраться с API поставщиков данных, используя доступную документацию
- SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum, Cassandra
- Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow/Oozie
- Опыт разработки сложных, высоконагруженных приложений обработки данных на основе Spark (scala, pyspark), уверенное знание настроек Spark и их влияния на производительность приложений Spark, умение профилировать приложения Spark для оптимизации их производительности
- Опыт разработки приложений и сервисов потоковой обработки данных (real-time) на основе Kafka, Flink
- Владеет навыком ориентироваться в коде, написанном другими разработчиками
Linux - Продвинутые навыки работы с командной строкой
Что мы предлагаем взамен
- Гибридный график работы - 1-2 дня в офисе
- Интересные и амбициозные задачи — создаем лучшие финансовые сервисы для наших клиентов
- Сильная команда дизайнеров и чувство плеча на удалёнке — каждый участвует в развитии процессов, знает кто чем занимается и взаимодействует с другими дизайнерами каждый день
- Собственная Usability-лаборатория с нейросетью, распознающей эмоции, и имитацией локаций: дом, метро, отделение — где можно заказать и участвовать в исследованиях
- Развитая дизайн-система и собственные плагины для Figma
- Забота о вашем здоровье: программа ДМС с первых дней работы, куда входит стоматология, обслуживание в лучших клиниках города, страхование и компенсация 10-ти дней больничного
- Оплата посещения профильных конференций и курсов, помогаем с подготовкой к публичным выступлениям и написанием статей на Хабр
- Доступ к бесплатным корпоративным библиотекам Alpina Digital, MyBook и бизнес-изданий
- Скидки у партнеров: обучение английскому, фитнес-клубы и многое другое
Откликнуться на эту вакансию: Старший инженер данных (Департамент продвинутой аналитики)
Предыдущая вакансия:
Вакансия № 32130926 на должность Продуктовый аналитик (образовательные продукты) от компании МАКСИМА в городе (населенном пункте) Москва