Заявка на участие
Пожалуйста, оставьте свои контакты и мы свяжемся с вами в ближайшее время
Отправляя данную форму, вы подтверждаете свое
согласие на обработку персональных данных.

Специалист
по большим данным 17.0

Комплексные знания технологий распределенной обработки данных
Работа со всеми значимыми
инструментами экосистемы больших данных
NVidia, Сбер, Яндекс, Ozon...
12 недель
Онлайн В Zoom
осень 2022
Наши преподаватели - практикующие эксперты ведущих компаний
Занятия проходят 3 раза в неделю по 3 часа
Можно задавать вопросы преподавателям
Даты проведения программы
Мы занимаемся обучением работе с данными с 2015 года
Широкая линейка программ по обучению работе с данными на всех этапах
Используем андрагогику и практикоориентированные программы
Наши программы — это путь героя, где кроме навыков и знаний мы погружаем в неизвестный мир и показываем, как справляться с реальными задачами
О программе
Путь героя
Инфраструктура
Что нужно для учебы
Полное погружение в мир больших данных за 12 недель
  1. Алгоритмы
    Научитесь обрабатывать данные в Pandas, строить модели машинного обучения (логистическая регрессия, деревья, случайный лес) в Scikit-learn, анализировать текстовые данные, применять разные алгоритмы рекомендательных систем.
  2. Технологии
    Научитесь писать MapReduce-джобы на Python с использованием Hadoop Streaming, писать SQL-like запросы в Hive для решения аналитических задач, обращаться к данным на HDFS, анализировать данные в Apache Spark.
  3. Бизнес
    Научитесь выбирать правильную метрику качества для вашей задачи, собирать требования перед стартом проекта и ценивать финансовый эффект от внедрения моделей.
Как проходит обучение
  1. Online в зуме
    Учитесь у лучших специалистов, общайтесь с преподавателями в режиме реального времени. Задать вопрос и разобрать релевантный кейс можно в прямом эфире
  2. Есть видеозаписи занятий
    Если нет возможности присутствовать на занятиях — изучайте материалы в удобном формате и комфортных условиях, без отрыва от работы в соответствии с вашим ритмом жизни
  3. Практика – лабораторные работы
    Каждую неделю вы решаете лабораторную работу с использованием реальных датасетов и на основе кейсов из реальной жизни.
  4. Проекты, которые лягут в основу вашего портфолио
    На протяжении 12 недель вы работаете над большими проектами, которые помогают вам объединить инструменты из разных разделов программы и отработать навыки, необходимые для реализации сложных многоуровневых проектов.
  1. Кластер
    Наша программа — про большие данные, поэтому на ней вы будете работать с облачным кластером, который мы администрируем, конфигурируем, поддерживаем.
  2. GitHub
    Все презентации, jupyter-ноутбуки, лабы, мануалы мы выкладываем в закрытый репозиторий на GitHub.
  3. Личный кабинет
    В нем вы можете проверить правильность выполнения лаб, используя автоматические чекеры. Там же Будут проставляться все статусы ваших зачетов и ачивок.
  4. Slack
    Там мы поддерживаем общение — можно будет задавать вопросы координатору, а еще общаться между собой и помогать друг другу.
  1. Умение программировать на Python 3
    Это основной язык программирования, используемый на программе. Хорошо, если вы уже будете знакомы с базовым синтаксисом, циклами, условными операторами, функциями, чтением и записью файлов.
  2. Базовые знания Linux
    В командной строке Linux вы тоже будете много времени проводить, работая с нашим кластером. Хорошо, если вы уже будете уметь перемещаться по директориям, создавать и редактировать файлы, заходить на удаленный сервер по ssh.
  3. SQL
    На программе вы будете использовать такие инструменты как Hive и Apache Spark. Для работы с ними вам пригодится умение писать запросы на этом языке: селекты, джойны, фильтры, подзапросы.
  4. Статистика и линейная алгебра
    На программе мы будем рассматривать продвинутые методы анализа данных, поэтому хорошо, если вы знаете основы статистики и линейной алгебры: среднее, дисперсия, вероятность, теорема Байеса, корреляция, ранг матрицы.
Ресурсы для подготовки
Пожалуйста, оставьте свои контакты и мы пришлем ресурсы для подготовки к курсу в ближайшее время
Отправляя данную форму, вы подтверждаете свое
согласие на обработку персональных данных.
НАШИ ВЫПУСКНИКИ
Частные лица
За это время более 900 человек из разных регионов России, стран СНГ, а также Латвии, Эстонии, Израиля, Польши, Великобритании, Германии, Нидерландов, ОАЭ и США прошли обучение на открытых программах.
Сотрудники компаний
Среди наших клиентов, регулярно направляющих своих сотрудников на открытые программы: Сбербанк, МегаФон, Райффайзен банк, Альфа-Банк, ТВЦ, S7, КРОК и др.
Корпоративные программы
Корпоративные программы разной длительности, для разной аудитории и с решением разных задач Newprolab проводил для СИБУРа, Газпром нефти, Газпромбанка, Сбербанка и банка BGL BNP Paribas в Люксембурге. Их прошли более500 человек.
VISA
ГазпромНефть
Сбербанк
Qiwi
Мегафон
Авито
S7
Ростелеком
КРОК
airbnb
zalando
Rambler&Co
ECONTENTA
Accenture
ТВЦ
Альфа-Банк
СИБУР
Райффазен Банк
Booking.com
Microsoft
LinguaLeo
@Mail.ru Group
М.Видео
МТС
ЧТО ВХОДИТ В ПРОГРАММУ
36 занятий
Преподаватели-практики, работающие в ведущих компаниях, проводят занятия в прямом эфире, отвечают на вопросы и разбирают релевантных кейсы. Видеозаписи занятий доступны в личном кабинете.
9 лаб
Каждую неделю вы решаете лабораторную работу с использованием реальных датасетов и на основе кейсов из реальной жизни. Дополнительно вы можете решать суперачивки.
2 проекта
На протяжении 6 недель вы работаете над большими проектами, которые помогают вам объединить инструменты из разных разделов программы и отработать навыки, необходимые для реализации сложных многоуровневых проектов.
Часть 1. Построение DMP-системы

Проект: прогнозирование пола и возрастной категории пользователей в интернете по их логам.

  • Лаба 1. Деплой кластера в облаке и запуск MapReduce
    По итогам только первой недели обучения вы научитесь разворачивать Hadoop-кластер в облаке, используя дистрибутив HortonWorks. Сможете написать свой первый MapReduce-джоб, используя Hadoop Streaming и Python.
  • Лаба 2. Классификация пользователей по интересам в Hive
    Используя простые эвристики, вам нужно будет классифицировать пользователей по интересам (автомобилисты, предприниматели, домохозяйки и др.). Для выполнения лабы необходимо будет использовать Hive.
  • Лаба 3. Прогнозирование оттока клиентов банка
    Используя обезличенные данные клиентов банка, вам нужно будет предсказать вероятность ухода из банка каждого из них в ближайшие несколько месяцев.
  • Лаба 4. Похожесть текстов вакансий
    В этой лабе вам нужно будет найти похожие тексты вакансий. Суперачивка — участие в соревновании на Kaggle по определению эмоциональной окраски отзывов в интернете.
Часть 2. Разработка рекомендательной системы

Проект: рекомендательная система товаров в интернет-магазине

  • Лаба 5. Неперсонализированные рек. системы
    Задача — построить различного рода топы для рекомендации фильмов пользователям, по которым еще нет никаких данных.
  • Лаба 6. Коллаборативная фильтрация
    Используя матричные разложения, разработать рекомендации, учитывающие жанр, стиль и другие неявные факторы фильма.
  • Лаба 7. Content-based рек. системы
    Вам нужно будет, рассчитывая похожесть описаний онлайн-курсов, выявить те, которые можно рекомендовать в дополнение пользователям.
  • Лаба 8. Рекомендации фильмов по телесмотрению
    Используя данные по просмотру телепередач разных пользователей, сделать рекомендации фильмов по подписке.
  • Лаба 9. A/B-тестирование
    Используя данные и модель прогнозирования оттока лабораторной работы 4, необходимо проэмулировать настоящий АБ тест по удержанию клиентов банка и получить значимое улучшение метрик в тестовой группе.
СТОИМОСТЬ ПРОГРАММЫ
140 000 руб.
  • Полная стоимость не учитывает скидку по промокоду – не забудьте указать в заявке!
  • Для физических лиц возможна рассрочка.
  • Для корпоративных клиентов – специальные условия при регистрации групп из более чем 3 участников.
  • Для выпускников наших программ и их друзей предусмотрены скидки.
  • За ваше обучение может заплатить ваш работодатель – обратитесь с таким запросом к вашему руководителю

Оставляйте заявку или звоните +7 495 128 86 75, чтобы узнать подробности!
УЧИТЕСЬ У ЛУЧШИХ ПРАКТИКОВ
Наши преподаватели — это практики из ведущих российских и международных компаний: Lamoda, Яндекс, NVIDIA, 1C Битрикс, Cбербанк, ЦИАН, CleverDATA и др.
Q&A О ПРОГРАММЕ
Партнер по инфраструктуре
Экосистема облачных сервисов от VK Cloud Solutions помогает строить надежные IT-системы. Входящие в VK Cloud Solutions решения — виртуальные сервера, объектное хранилище, управляемые базы данных, кластеры Kubernetes и многое другое — позволяют запускать приложения и сервисы, работать с большими объемами данных и решать другие задачи крупного, среднего и малого бизнеса.