Your browser is out of date. The site might not be displayed correctly. Please update your browser.

Data Engineer (DS Team) | SEMrush

Data Engineer (DS Team)

Saint Petersburg, Russia

SEMrush – продуктовая IT-компания. С 2008 года мы разрабатываем свою собственную онлайн-платформу для интернет-маркетологов, и у нас неплохо получается! Доказательством этому является премия WORLD’S BEST SEARCH SOFTWARE, которую мы получаем уже три года подряд. С помощью SEMrush можно отслеживать эффективность сайта, оценивать положение продукта в сети, анализировать конкурентов и многое другое.

Сегодня нашим сервисом пользуются 6 000 000+ клиентов из Америки, Европы, Азии и Австралии, а над созданием трудятся более 900 человек по всему миру. С самого основания мы привержены своим фундаментальным ценностям: всегда отдавать приоритет людям, а не процессам, приспосабливаться к переменам, а не следовать строгому плану.

Сейчас у нас есть команда DS по анализу данных, в обязанности которой входит поддержка команд, занимающихся SEO-направлением. Несмотря на то что команда является внутренней, результаты работы отражаются в продуктах компании. В команде: Product Owner, 2 Data Scientist и Data Engineer. Но задач становится больше, поэтому мы в поисках Data Engineer.

Наш стек частично зависит от других команд, но в общем выглядит так: данные на железных серверах/в Google Cloud; Хранилища данных: ClickHouse, Postgres, BigQuery; язык: Python; инструменты: Airflow, k8s, Dataproc, Artifactory, DVC для выстраивания ML-пайплайнов, DVC для версионирования датасетов, в остальном - полная свобода выбора.

Основные задачи:

  • Автоматизация рутины;
  • Помощь DSам в организации ETL-пайплайнов и деплое моделей;
  • Организация инфраструктуры для проведения экспериментов, хранения результатов, переобучения моделей, мониторинга качества, алертинга;
  • Написание парсеров/работа с API поставщиков данных;
  • Проведение Code Review.

    Мы ждём от тебя: 

    • Опыт работы на аналогичной позиции от двух лет;
    • Опыт разработки ETL-процессов;
    • Высокий уровень владения Python;
    • Знание SQL на высоком уровне;
    • Знание реляционных баз данных, например Postgres или MySQL;
    • Опыт работы с NoSQL хранилищами;
    • Базовые знания в области анализа данных и машинного обучения.

    Преимуществом будет:

    • Опыт работы с Gitlab CI;
    • Опыт работы с Docker и k8s;
    • Опыт работы с GCP/AWS;
    • Опыт работы с DVC, MLFlow, Airflow, Dash;
    • Опыт работы с ClickHouse, BigQuery;
    • Знание Ansible.

    Мы предлагаем:

    • На данный момент наши сотрудники придерживаются формата “работа из дома“, а вообще СПб офис располагается совсем рядом со ст.м. Московские ворота (10 минут прогулочным шагом). Надеемся, скоро мы все туда вернемся.
    • Гибкое начало рабочего дня, которое подойдет как жаворонку, так и сове. Ты можешь начать день в период с 9:00 до 12:00.
    • Agile-подход в работе (с удовольствием всему научим).
    • Различные тренинги/онлайн-курсы/конференции/книги для прокачивания твоих hard- и soft-скиллов.
    • Поддержка твоих спортивных увлечений и компенсация до 50% от стоимости абонемента (зал/танцы/скалодромы и прочее на твой выбор).
    • Занятия по английскому языку. Сейчас они проводятся в формате онлайн.
    • Крутые вечеринки и корпоративы! Да, тоже в онлайн-режиме, но нам все равно весело:)

    Apply for this job

    We'd love to hear from you. Drop us a line and we'll contact you.
    Name
    Email
    Phone
    Commentoptional
    Resume