Алгоритмы. Технологии. Бизнес-кейсы

Расписание занятий:
- вт, чт 19:00–22:00,
- сб 11:00–14:00

Место проведения:
Офис компании МегаФон,
Оружейный пер. 41, Москва
17 сентября – 10 декабря

СПЕЦИАЛИСТ ПО БОЛЬШИМ ДАННЫМ 11.0

Легендарная программа по анализу больших данных теперь по частям
С возможностью проходить разные модули по отдельности, выбрав только нужные
Программа, выдержавшая проверку временем: 4 года и 10 запусков. Постоянно обновляемая и актуальная запросам рынка. 80% участников доходят до конца и получают сертификат. Средняя вероятность порекомендовать программу знакомым – 9,3.
Мы используем файлы cookie, чтобы улучшить работу сайта, и показывать вам контент, согласно вашим интересам. Продолжая использовать сайт, вы соглашаетесь с условиями использования файлов cookie.
Да, соглашаюсь
Close
Для кого эта программа?
-1-
Разработчики
У вас есть опыт программирования, но не хватает знаний и умений в анализе данных? На программе вы научитесь использовать различные алгоритмы машинного обучения, в том числе в Apache Spark.
-2-
Аналитики
Вы умеете анализировать данные, но требуется знание новых инструментов? Уже после первой недели вы научитесь разворачивать Hadoop-кластер в облаке и сможете использовать эти знания для пилотного проекта на работе.
-3-
Менеджеры
Вы занимаетесь развитием продукта или подразделения? На программе вы получите серьезное погружение в сферу анализа больших данных, попробовав многие вещи своими руками.
1
2
3
4
5
6
7
NLP
ML
Программа доступна отдельными модулями
Можно взять любое количество
Лабы, доступные вместе с модулями
По итогам только первой недели обучения вы научитесь разворачивать Hadoop-кластер в облаке, используя дистрибутив HortonWorks. Сможете написать свой первый MapReduce-джоб, используя Hadoop Streaming и Python.
В этой лабе вам нужно будет отфильтровать логи, расположенные на HDFS (распределенная файловая система) и положить их в таблицу в HBase (колоночная база данных), используя map-only джоб.
Используя простые эвристики, вам нужно будет классифицировать пользователей по интересам (автомобилисты, предприниматели, домохозяйки и др.). В этот раз необходимо будет использовать Hive.
Используя обезличенные данные клиентов банка, вам нужно будет предсказать вероятность ухода из банка каждого из них в ближайшие несколько месяцев.
В этой лабе вам нужно будет найти похожие тексты вакансий. Суперачивка — участие в соревновании на Kaggle по определению эмоциональной окраски отзывов в интернете.
Задача — построить различного рода топы для рекомендации фильмов пользователям, по которым еще нет никаких данных.
Вам нужно будет, рассчитывая похожесть описаний онлайн-курсов, выявить те, которые можно рекомендовать в дополнение пользователям.
Используя матричные разложения, разработать рекомендации, учитывающие жанр, стиль и другие неявные факторы фильма.
Соревнование, в котором вам нужно будет добиться наилучшего скора, используя вместе разные алгоритмы рекомендательных систем.
Используя данные по просмотру телепередач разных пользователей, сделать рекомендации фильмов по подписке.
Наши преподаватели — только практики из индустрии, умеющие объяснять сложные вещи простыми словами
Антон Пилипенко
Data Engineer, Lamoda
Николай Марков
Senior Data Engineer, Aligned Research Group
Организатор конференции PyData и Data Science завтраков
Андрей Зимовнов
Старший разработчик, Яндекс.Дзен
Александр Ульянов
Data Science Executive Director, Сбербанк
Олег Хомюк
Head of R&D, Lamoda
Александр Филатов
Product Analytics Manager, VISA
Владимир Опанасенко
Исполнительный директор, Газпромбанк
Кирилл Данилюк
Engineering Manager,
Self-Driving Car, Yandex
Инфраструктура программы
То, с чем вы будете работать каждый день
Кластер
Наша программа — про большие данные, поэтому на ней вы будете работать с Hadoop-кластером, который мы администрируем, конфигурируем, поддерживаем.
GitHub
Все презентации, jupyter-ноутбуки, лабы, мануалы мы выкладываем в закрытый репозиторий на GitHub. Этот инструмент стал стандартом работы в среде программистов и профессионалов в сфере данных.
Личный кабинет
В нем вы можете проверить правильность выполнения лаб, используя автоматические чекеры. Там же можно смотреть прямые трансляции и видеозаписи занятий.
Slack
Общение во время программы происходит в Slack — удобный мессенджер для команд. Там можно задавать вопросы во время трансляции, общаться с преподавателями, организаторами, друг с другом. Следить за апдейтами в GitHub и быть в курсе новостей.
Стоимость всей программы целиком
200 000 руб. 170 000 руб.
Стоимость действительна до 1 сентября 2019

Возможна рассрочка
1 модуль Hadoop
Занятия (4)
Даты
Преподаватели
Cтоимость
HDFS

MapReduce

HBase

Hive
Антон Пилипенко Кирилл Данилюк
24 сентября – 3 октября 2019
28 000 ₽
Content Oriented Web
Make great presentations, longreads, and landing pages, as well as photo stories, blogs, lookbooks, and all other kinds of content oriented projects.
2 модуль Spark
Занятия (6)
Даты
Преподаватели
Cтоимость
Введение

Dataframes

Spark ML: пайплайны

Практический ML
на Spark

Spark GraphX

Spark Streaming
Наталья Притыковская
29 октября – 3 декабря 2019
42 000 ₽
Content Oriented Web
Make great presentations, longreads, and landing pages, as well as photo stories, blogs, lookbooks, and all other kinds of content oriented projects.
3 модуль ML
Занятия (7)
Даты
Преподаватели
Cтоимость
Введение в ML

Практический ML

ML алгоритмы

ML на текстах

Сентимент-анализ

Ансамбли в ML

Введение в Deep Learning
Владимир Опанасенко Кирилл Данилюк Дмитрий Коробченко
10 октября – 19 октября,
31 октября,
7 декабря 2019
49 000 ₽
Content Oriented Web
Make great presentations, longreads, and landing pages, as well as photo stories, blogs, lookbooks, and all other kinds of content oriented projects.
4 модуль Time Series
Занятия (2)
Даты
Преподаватели
Cтоимость
Введение в анализ временных рядов

Обработка данных
для временных рядов
Денис Димитров
28–30 ноября 2019
14 000 ₽
Content Oriented Web
Make great presentations, longreads, and landing pages, as well as photo stories, blogs, lookbooks, and all other kinds of content oriented projects.
5 модуль NLP
Занятия (5)
Даты
Преподаватели
Cтоимость
Введение в NLP

Парсинг сайтов
и расчет похожести

ML на текстах

Сентимент-анализ

Тематическое моделирование
Владимир Опанасенко
5–8 октября, 17–22 октября 2019
35 000 ₽
Content Oriented Web
Make great presentations, longreads, and landing pages, as well as photo stories, blogs, lookbooks, and all other kinds of content oriented projects.
6 модуль Recommenders
Занятия (4)
Даты
Преподаватели
Cтоимость
Введение в рек. системы и неперсонализи-
рованные РС

Content-based

SVD, BMF, факторизация

Оценка качества РС
Андрей Зимовнов
26 октября – 23 ноября
2019
28 000 ₽
Content Oriented Web
Make great presentations, longreads, and landing pages, as well as photo stories, blogs, lookbooks, and all other kinds of content oriented projects.
7 модуль Вusiness Track
Занятия (4)
Даты
Преподаватели
Cтоимость
Процесс анализа
данных и анализ требований

Выбор метрик и финансовый эффект

A/B-тестирование

Мастер-класс + сторителлинг
и визуализация данных
Олег Хомюк
Александр Ульянов
Кирилл Данилюк
Александр Филатов
7 – 21 ноября, 5 декабря
2019
28 000 ₽
Content Oriented Web
Make great presentations, longreads, and landing pages, as well as photo stories, blogs, lookbooks, and all other kinds of content oriented projects.
Запись вебинара о программе
Отзывы
Где работают наши выпускники
Здесь они живут и работают

Наши принципы обучения
Чтобы обучение было эффективным и интересным, мы используем андрагогику
-1-
Материал ориентирован на конкретные задачи
Наша цель — научить вас решать задачи из реальной жизни, а не покрыть список тем. Теория — это инструмент необходимый для решения задач, а не самоцель.
-2-
Возможность сразу же применять знания
Уже после первой недели вы научитесь разворачивать свой Hadoop-кластер в облаке и сможете использовать эти знания для пилотного проекта на работе.
-3-
Самостоятельность в решении
Наши задания сформулированы так, что вам часто нужно будет что-то загуглить. После программы у вас будет свой багаж из качественных ресурсов.
F.A.Q.
Можно ли взять несколько модулей?
Да, вы можете взять любое количество модулей. Однако, если хотите взять все, то лучше брать программу целиком, потому что получится дешевле.
Из чего состоит модуль?
Модуль состоит из нескольких занятий, где вы сможете получить знания, и одной или нескольких лаб, на которых вы сможете получить практические навыки.
Что если я по ходу программы понял, что хочу пойти на еще один модуль?
Нет проблем. Можете принять решение по ходу и приобрести еще один модуль программы. Если он уже прошел, то придется подождать следующего запуска.
Чем ваша программа отличается от других программ по data science?
1. Наша программа не просто про анализ данных, а про анализ больших данных. И такой программы больше нет. Анализ больших данных требует умения работы со специализированными инструментами и наличия инфраструктуры. Например, в течение 6 недель вы будете работать с Apache Spark. Все практические задания выполняются на кластере, который мы администрируем и поддерживаем.
2. Это офлайновая программа (этим отличается от онлайн-курсов). На офлайн-программах, как правило, обучение строится эффективнее: есть поддерживающая среда из сокурсников, преподавателей, координатора. По статистике, доля успешно завершивших онлайн-курс редко превышает 25%. На нашей программе свыше 70% получают по итогам сертификат.
Остались вопросы?
Задайте их, и мы с радостью вам ответим
Оставьте контакты ниже
Мы с вами свяжемся
Интересующие модули
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Интересующие модули
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте свой вопрос и контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.