можно начать в любое время

APACHE SPARK ADVANCED ▶️ видео-отзыв

Hardcore-программа
Поможет разобраться в работе датафреймов «под капотом» и покажет, как ускорить обработку данных в своих проектах
Первый вектор обучения
Взаимодействие с внешними источниками, которые не поддерживаются Spark из коробки или для которых нет уже кем-то разработанных коннекторов

Второй вектор обучения

Пользовательские функции — как писать быстро, какие подходы можно использовать, что можно из них выжать и какие есть паттерны их использования
Видео-лекции
по 3 часа с тайм-метками
Можно пройти в своем темпе в любое
время в течение 2-х месяцев
2 месяца практики в инфраструктуре
и помощь координатора
4 лабы для отработки новых навыков и знаний, которые сможете сразу применять в работе
Проверка знаний и 2 месяца обратной связи от эксперта из индустрии
На связи два раза в неделю с вами будет координатор, который поможет разобраться с лабами и пройти программу успешно
Dataframe API
Spark Structured Streaming API
org.apache.spark.sql.Row
py4j в pyspark
Scala UDF в pyspark
ВЫ
НАУЧИТЕСЬ
  1. работать с внутренними структурами Spark 2
  2. использовать py4j для взаимодействия со структурами Spark 2 из Python в JVM
  3. писать хорошие высокопроизводительные Scala UDF
  4. писать нативные UDF на internal row
  5. работать с планировщиками запускать и синхронные действия на dataframe
  6. выбирать оптимальные ресурсы для Spark 2 приложения
  7. разрабатывать коннекторы к источникам с помощью static UPS и с помощью стримов
ДЛЯ КОГО
Для дата-инженеров, кому не хватает понимания, что скрыто "под капотом" и кто испытывает сложности в понимании корневых технологий в Spark 2.
ВХОДНЫЕ
ТРЕБОВАНИЯ
  • Опыт построения ETL и стриминг пайплайнов с помощью Spark 2.4
  • Базовые знания Python
  • Понимание архитектуры распределенных вычислений с использованием HDFS, YARN
  • Практический опыт разработки на Scala
  • Базовые навыки Linux
  • Знание основ TCP/IP

ПРАКТИКА

В этой программе есть четыре лабораторных работы, которые необходимо выполнить самостоятельно в нашей инфраструктуре. Лабы проверяются автоматическими чекерами и количество попыток неограниченно. Преподаватель и координатор будут отвечать на ваши вопросы и всегда помогут по техническим вопросам.

Лабы объединены в пайплайн и за 4 недели вам нужно будет разработать коннектор к гибридному хранилищу, который для хранения данных использует одновременно Mongo и файловую систему. Вы будете самостоятельно разрабатывать статическую часть этого коннектора для работы со Static Dataframe API, стримовую часть и малую часть и добавлять туда Predicate Pushdown фильтры. Лабы проверяется автоматически, количество попыток не ограничено.

ИНФРАСТРУКТУРА ПРОГРАММЫ

Кластер
Каждый участник получает доступ к облачному кластеру для решения лаб с доступом через SSH и JupyterHub
GitHub
Все материалы занятий, инструкции к лабам и мануалы размещаются в закрытом репозитории программы
Личный кабинет
В нем вы сможете проверить правильность выполнения лаб, используя автоматические чекеры, а также отслеживать свою успеваемость для получения сертификата
Видеозаписи занятий
Вам будут доступны все восемь занятий предыдущего потока
ПОДРОБНЕЕ
О ПРОГРАММЕ*

Андрей Титов, автор программы и преподаватель первых трех потоков, рассказывает о программе: какие задачи вы будете решать во время обучения, как происходит обучение, как устроена инфраструктура и практика.

* - запись перед стартом первого потока (ноябрь 2021 года)
ПРЕПОДАВАТЕЛЬ ПРОГРАММЫ
Андрей Титов, Senior Spark Engineer
Вам предоставляется доступ к лекциям потока весны 2022
КООРДИНАТОР ПРОГРАММЫ
Координатор
Поможет в выполнении лаб и будет на связи в течение всей программы

ЗАНЯТИЯ

CЕРТИФИКАТ
НА АНГЛИЙСКОМ
ЯЗЫКЕ
Мы выдаем сертификат только участникам, которые пройдут программу успешно и выполнят любые три лабы из четырех в срок.

Наш сертификат на английском языке и он подтверждает ваши навыки работы с Apache Spark для задач дата-инжиниринга на продвинутом уровне.

Сертификат можно будет добавить в свое резюме или в свой Linkedin-профиль, указав уникальный номер.
CЕРТИФИКАТ
НА АНГЛИЙСКОМ
ЯЗЫКЕ
Мы выдаем сертификат только участникам, которые пройдут программу успешно и выполнят любые три лабы из четырех в срок.

Наш сертификат на английском языке и он подтверждает ваши навыки работы с Apache Spark для задач дата-инжиниринга на продвинутом уровне.

Сертификат можно будет добавить в свое резюме или в свой Linkedin-профиль, указав уникальный номер.
ВАРИАНТЫ УЧАСТИЯ
ВИДЕО + ЛАБЫ

59 000 руб
8 видео занятий
4 лабы
помощь координатора
2 месяца для прохождения
сертификат
материалы остаются навсегда
ВЫБРАТЬ
ТОЛЬКО ВИДЕО

32 000 руб
8 видео занятий
лаб нет
сертификата нет
видео остаются навсегда
ВЫБРАТЬ
Оставляйте заявку или звоните +74951288675, чтобы узнать подробности.
Сейчас платить не нужно. Оплата только после общения с менеджером.
Можно оплатить иностранной картой.

ОТЗЫВЫ ВЫПУСКНИКОВ

Роман Друзык
Оценка ★★★★☆
Понял, как копаться в кишках спарка и переиспользовать классы. Буду применять некоторые фишки в рабочих процессах. К сожалению, было сложно найти время для лабораторных работ.
Максим Башаров
Оценка ★★★★★
В результате программы приобрел более глубокое понимание работы спарка. Долго копался с монгой и долго копался с итератором.) Всем занятиям ставлю 5 из 5 баллов. Планирую применять полученные знания в работе.
Михаил Килинский
Оценка ★★★★★
Ожидания от программы оправдались. Удалось узнать больше про внутренние структуры спарка, научиться с ними работать. Понял, как писать свои коннекторы к источникам данных, использовать scala udf в pyspark. Буду использовать знания в рабочих проектах. Уже порекомендовал ваши программы своим знакомым в разных компаниях. Спасибо!
Данил Кусакин
Оценка ★★★★★
Высокое качество материала, идеальный баланс между теорией и практическими примерами. Порадовали оперативные ответы в Телеграм. Главный результат обучения – понимание некоторых нюансов по Cпарку, о которых ранее не задумывался, так как не приходилось сталкиваться на практике. На текущей работе лично мне не требуется столь глубокий уровень Спарка, так как пайплайны достаточно простые и не нагруженные. Для меня сейчас – это скорее теоретические знания, к которым можно будет обратиться в будущем. Лабы были сложные.
Антон Юдин
Оценка ★★★★★
Это первая программа, которая захватывают разработку коннекторов, можно сказать что больше таких программ наверное нигде нет. Для меня такой точно первая.

Я пытался до этого разбираться с API коннекторов, но это довольно-таки сложная штука. Сам я бы еще очень долго с ними разбирался. Сейчас все гораздо проще стало. Я стал лучше понимать внутреннюю логику Spark, как он работает и вообще про Spark узнал некоторые вещи, которые раньше не знал. Я и раньше не проходил некоторые собеседования, а теперь точно любые пройду. Большое спасибо!
Олег Андреев
Оценка ★★★★★
Мне понравилась программа, мне нравятся челенджи, мне нравится делать, когда непонятно что делать. Рамки были узкие и времени мало. Задачи очень интересные, очень понравилось ковыряться. У меня это уже третяя программа от Newprolab – уже знаешь куда идешь!

ЧАСТЫЕ ВОПРОСЫ