Мы используем файлы cookie, чтобы улучшить работу сайта, и показывать вам контент, согласно вашим интересам. Продолжая использовать сайт, вы соглашаетесь с условиями использования файлов cookie.
Да, соглашаюсь
Close
Алгоритмы. Технологии. Soft skills
г. Москва, Оружейный пер., д.41, офис ПАО "МегаФон"

Расписание: вт., четв. 19:00-22:00, суб. 11:00-14:00 по Москве
17 сентября - 10 декабря

СПЕЦИАЛИСТ ПО БОЛЬШИМ ДАННЫМ 11.0

Big Data — это больше не хайп
А необходимость для многих компаний и специалистов
Объем данных в организациях растет экспоненциально. Анализировать их стандартными инструментами становится все сложнее. В этом случае на помощь приходят технологии распределенной обработки: экосистема Hadoop (HDFS, MapReduce, Hive, HBase), Apache Spark.

10 лаб
Каждую неделю вашим сотрудникам нужно будет решить лабораторную работу и суперачивку. Это реальные задачи, которые ежедневно решают компании
2 проекта
Помимо лаб они работают в командах над большими проектами по 6 недель
36 занятий
С трансляциями в прямом эфире и видеозаписями в личном кабинете
Для кого эта программа?
-1-
Разработчики
У вас есть люди с опытом программирования, но им не хватает знаний и умений в анализе данных? На программе они научатся использовать различные алгоритмы машинного обучения, в том числе в Apache Spark.
-2-
Аналитики
Есть те, кто уже умеет анализировать данные, но требуется знание новых инструментов? Уже после первой недели они научится разворачивать Hadoop-кластер в облаке и смогут использовать эти знания для пилотного проекта на работе.
-3-
Менеджеры
У вас есть сотрудники, отвечающие за развитие продукта или подразделения? На программе они получат серьезное погружение в сферу анализа больших данных, сделав многие вещи своими руками.
Чему научатся ваши сотрудники
В нашей программе есть три составляющих
Алгоритмы
Научатся обрабатывать данные в Pandas, строить модели машинного обучения (логистическая регрессия, деревья, случайный лес) в Scikit-learn, анализировать текстовые данные, применять разные алгоритмы рекомендательных систем. Решать задачи прогнозирования оттока клиентов, пола и возрастной категории пользователей сайта, их интересы, оценивать эмоциональную окраску отзывов.
Технологии
Научатся писать MapReduce-джобы на Python с использованием Hadoop Streaming, писать SQL-like запросы в Hive для решения аналитических задач, работать с колоночной базой данных HBase, обращаться к данным на HDFS, анализировать данные в Apache Spark. Все это необходимо, если у вас уже есть большие данные или появятся на горизонте в несколько лет.
Soft skills
Научатся выбирать правильную метрику качества для вашей задачи, собирать требования перед стартом проекта, оценивать финансовый эффект от внедрения модели, использовать сторителинг для презентации своих результатов. Также на программе они научатся работе в команде, управлению временем, искать информацию в интернете. Выйдут с майндсетом "я смогу разобраться и выполнить любую задачу".
Модуль 1. Построение DMP-системы
Проект: прогнозирование пола и возрастной категории пользователей в интернете по их логам
По итогам только первой недели обучения ваши сотрудники научатся разворачивать Hadoop-кластер в облаке, используя дистрибутив HortonWorks. Смогут написать свой первый MapReduce-джоб, используя Hadoop Streaming и Python.
В этой лабе членам вашей команды нужно будет отфильтровать логи, расположенные на HDFS (распределенная файловая система) и положить их в таблицу в HBase (колоночная база данных), используя map-only джоб.
Используя простые эвристики, коллегам нужно будет классифицировать пользователей по интересам (автомобилисты, предприниматели, домохозяйки и др.). В этот раз необходимо будет использовать Hive.
Используя обезличенные данные клиентов банка, вашим сотрудникам нужно будет предсказать вероятность ухода из банка каждого из клиентов в ближайшие несколько месяцев.
В этой лабе им нужно будет найти похожие тексты вакансий. Суперачивка — участие в соревновании на Kaggle по определению эмоциональной окраски отзывов в интернете.
Модуль 2. Разработка рекомендательной системы
Проект: рекомендательная система товаров в интернет-магазине
Задача — построить различного рода топы и рейтинги для рекомендации фильмов пользователям, по которым еще нет никаких данных.
Вашим коллегам нужно будет, рассчитывая похожесть описаний онлайн-курсов, выявить те, которые можно рекомендовать в дополнение пользователям.
Используя матричные разложения, ваши сотрудники разработают рекомендации, учитывающие жанр, стиль и другие неявные факторы фильма.
Соревнование, в котором им нужно будет добиться наилучшего скора, используя вместе разные алгоритмы рекомендательных систем.
Используя данные по просмотру телепередач разных пользователей, вашим коллегам нужно будет сделать рекомендации фильмов по подписке.
Наши преподаватели — только практики из индустрии, умеющие объяснять сложные вещи простыми словами
Антон Пилипенко
Старший backend разработчик, haut.ai
Николай Марков
Senior Data Engineer, Aligned Research Group
Организатор конференции PyData и Data Science завтраков
Павел Клеменков
Chief Data Scientist (Data Platform), NVIDIA
Организатор митапов Moscow Spark
Андрей Зимовнов
Старший разработчик, Яндекс.Дзен
Александр Ульянов
Data Science Executive Director, Сбербанк
Олег Хомюк
Head of R&D, Lamoda
Александр Филатов
Product Analytics Manager, VISA
Владимир Опанасенко
Исполнительный директор, Газпромбанк
Инфраструктура программы
То, с чем ваши сотрудники будут работать каждый день
Кластер
Наша программа — про большие данные, поэтому на ней они будут работать с Hadoop-кластером, который мы администрируем, конфигурируем, поддерживаем.
GitHub
Все презентации, jupyter-ноутбуки, лабы, мануалы мы выкладываем в закрытый репозиторий на GitHub. Этот инструмент стал стандартом работы в среде программистов и профессионалов в сфере данных.
Личный кабинет
В нем коллеги смогут проверить правильность выполнения лаб, используя автоматические чекеры. Там же они смогут смотреть прямые трансляции и видеозаписи занятий.
Slack
Общение во время программы происходит в Slack — удобный мессенджер для команд. Там можно задавать вопросы во время трансляции, общаться с преподавателями, организаторами, друг с другом. Следить за апдейтами в GitHub и быть в курсе новостей.
Стоимость для early birds
200 000 руб. 150 000 руб.
Скидка действует до 1 июля 2019

Для учебы сотрудникам потребуются
Входные требования
Умение программировать на Python 3
Это основной язык программирования, используемый на программе. Хорошо, если они уже будут знакомы с базовым синтаксисом, циклами, условными операторами, функциями, чтением и записью файлов.
Базовые знания Linux
В командной строке Linux они тоже будут много времени проводить, работая с нашим кластером. Хорошо, если они уже будут уметь перемещаться по директориям, создавать и редактировать файлы, заходить на удаленный сервер по ssh.
SQL
На программе они будете использовать такие инструменты как Hive и Apache Spark. Для работы с ними им пригодится умение писать запросы на этом языке: селекты, джойны, фильтры, подзапросы.
Статистика и линейная алгебра
На программе мы будем рассматривать продвинутые методы анализа данных, поэтому хорошо, если они будут знать основы статистики и линейной алгебры: средние, дисперсия, вероятность, теорема Байеса, корреляция, ранг матрицы.
Отзывы
Где работают наши выпускники
Здесь они живут и работают

Наши принципы обучения
Чтобы обучение было эффективным и интересным, мы используем андрагогику
-1-
Материал ориентирован на конкретные задачи
Наша цель — научить ваших сотрудников решать задачи из реальной жизни, а не покрыть список тем. Теория — это инструмент, необходимый для решения задач, а не самоцель.
-2-
Возможность сразу же применять знания
Уже после первой недели они научатся разворачивать свой Hadoop-кластер в облаке и смогут использовать эти знания для пилотного проекта на работе.
-3-
Самостоятельность в решении
Наши задания сформулированы так, что им часто нужно будет что-то загуглить. После программы у них будет свой багаж из качественных ресурсов.
Запись вебинара о программе
F.A.Q.
Почему программа столько стоит?
1. На нашей программе участники работают на кластере. Сама инфраструктура требует затрат, плюс мы его конфигурируем и поддерживаем. Для этого нужен человек.
2. Все занятия транслируются в личном кабинете. Есть специальный человек, который на занимается трансляцией занятия.
3. Наши преподаватели — практики из индустрии, работающие data scientist'ами и дата инженерами. Помимо них есть также координатор, который помогает и отвечает на основную часть технических вопросов.
4. Это офлайновая программа с площадкой в центре Москвы.
Сколько времени потребуется для обучения?
Занятия проходят 3 раза в неделю по 3 часа. Это 9 часов. Плюс 4-10 часов потребуется на решение лабораторных работ в зависимости от задания и вашего изначального уровня подготовки.
Я смогу пройти программу, если совсем новичок и никогда не программировал?
Да, но будет сложно. Среди наших выпускников есть те, кто познакомился с программированием непосредственно на программе. Было непросто. Приходилось больше тратить время на задания, испытывать сложности. Но если есть высокая мотивация, то это все выполнимо.
Чем ваша программа отличается от других программ по data science?
1. Наша программа не просто про анализ данных, а про анализ больших данных. И такой программы больше нет. Анализ больших данных требует умения работы со специализированными инструментами и наличия инфраструктуры. Например, в течение 6 недель вы будете работать с Apache Spark. Все практические задания выполняются на кластере, который мы администрируем и поддерживаем.
2. Это офлайновая программа (этим отличается от онлайн-курсов). На офлайн-программах, как правило, обучение строится эффективнее: есть поддерживающая среда из сокурсников, преподавателей, координатора. По статистике, доля успешно завершивших онлайн-курс редко превышает 25%. На нашей программе свыше 70% получают по итогам сертификат.
Остались вопросы?
Задайте их, и мы с радостью вам ответим
Оставьте свой вопрос и контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.