Деревья решений, лог. регрессия, SVM, XGBoost, Scikit-learn, Pandas

Расписание занятий:
- вт, чт 19:00–22:00,
- сб 11:00–14:00

Место проведения:
Офис компании МегаФон,
Оружейный пер. 41, Москва
Апрель - май 2020

Курс "Машинное обучение"

Мы используем файлы cookie, чтобы улучшить работу сайта, и показывать вам контент, согласно вашим интересам. Продолжая использовать сайт, вы соглашаетесь с условиями использования файлов cookie.
Да, соглашаюсь
Close
Что входит в курс
Это один из курсов флагманской программы "Специалист по большим данным"
3 лабы
Каждую неделю вам нужно будет решить лабораторную работу и суперачивку
7 занятий
Оффлайн с трансляциями в прямом эфире и видеозаписями в личном кабинете
Для кого этот курс?
-1-
Разработчики
У вас есть опыт программирования, но по работе требуется понимать, что происходит в машинном обучении? В этом курсе вы научитесь строить модели машинного обучения и анализировать данные в Python.
-2-
Аналитики
Вы умеете анализировать данные, но требуется знание новых инструментов? Вы научитесь делать не только базовую аналитику, но и строить модели машинного обучения, прогнозирующие различные показатели.
-3-
Менеджеры
Вы занимаетесь развитием продукта или подразделения? В этом курсе вы получите погружение в машинное обучение, поймете юзкейсы использования и его ограничения, попробовав многие вещи своими руками.
Чему вы научитесь
В курсе есть четыре составляющих
Классический ML
Научитесь решать задачи регрессии и классификации при помощи различных алгоритмов машинного обучения, работая со структурированным типом данных. Узнаете, как правильно предобрабатывать и готовить данные для повышения качества прогноза моделей.
ML на текстах
Научитесь представлять текст в векторном виде и решать задачи машинного обучения в классическом виде. Узнаете, как проводить сентимент-анализ отзывов в интернете, для чего нужен word2vec и bag of words.
Ансамбли моделей
Научитесь создавать ансамбли из моделей, объединяя базовые классификаторы в один большой и повышая качество этой мета-модели. Узнаете, чем стэкинг отличается от блендинга, а также об их достоинствах и недостатках.
Введение в Deep learning
Узнаете о современных достижениях в области Deep Learning и какие виды задач можно решать при помощи глубоких нейронных сетей.
Лабы этого курса
Используя обезличенные данные клиентов банка, вам нужно будет предсказать вероятность ухода из банка каждого из них в ближайшие несколько месяцев.
В этой лабе вам нужно будет найти похожие тексты вакансий. Суперачивка — участие в соревновании на Kaggle по определению эмоциональной окраски отзывов в интернете.
Используя данные по просмотру телепередач разных пользователей, сделать рекомендации фильмов по подписке, используя классические алгоритмы машинного обучения.
Преподаватели этого курса
Владимир Опанасенко
Исполнительный директор,
Газпромбанк
Кирилл Данилюк
Engineering Manager,
Self-Driving Car, Yandex
Дмитрий Коробченко
Deep Learning R&D Engineer,
NVIDIA
Инфраструктура курса
То, с чем вы будете работать каждый день
Кластер
Этот курс посвящен машинному обучению, поэтому на нем вы будете работать с нашим сервером, оснащенным JupyterHub для удобной работы с Python.
GitHub
Все презентации, лабы, мануалы мы выкладываем в закрытый репозиторий на GitHub. Этот инструмент стал стандартом работы в среде программистов и профессионалов в сфере данных.
Личный кабинет
В нем вы можете проверить правильность выполнения лаб, используя автоматические чекеры. Там же можно смотреть прямые трансляции и видеозаписи занятий.
Slack
Общение во время курса происходит в Slack — удобный мессенджер для команд. Там можно задавать вопросы во время трансляции, общаться с преподавателями, организаторами, друг с другом. Следить за апдейтами в GitHub и быть в курсе новостей.
Стоимость курса
49 000 руб.
Для коллег/ друзей выпускников 20% скидка
Партнер по инфраструктуре
Для учебы вам потребуются
Входные требования
Умение программировать на Python 3
Это основной язык программирования, используемый на курсе. Хорошо, если вы уже будете знакомы с базовым синтаксисом, циклами, условными операторами, функциями, чтением и записью файлов.
Базовые знания Linux
В командной строке Linux вы тоже будете много времени проводить, работая с нашим кластером. Хорошо, если вы уже будете уметь перемещаться по директориям, создавать и редактировать файлы, заходить на удаленный сервер по ssh.
SQL
В курсе вы будете использовать такой инструмент как Hive. Для работы с ним вам пригодится умение писать запросы на этом языке: селекты, джойны, фильтры, подзапросы.
Линейная алгебра и статистика
В курсе мы будем рассматривать продвинутые методы анализа данных, поэтому хорошо, если вы знаете основы статистики и линейной алгебры: среднее, дисперсия, вероятность, теорема Байеса, корреляция, ранг матрицы.
1
2
3
4
5
6
7
NLP
ML
Интересны другие курсы?
Возьмите всю программу целиком
Отзывы
Где работают наши выпускники
Здесь они живут и работают

Наши принципы обучения
Чтобы обучение было эффективным и интересным, мы используем андрагогику
-1-
Материал ориентирован на конкретные задачи
Наша цель — научить вас решать задачи из реальной жизни, а не покрыть список тем. Теория — это инструмент необходимый для решения задач, а не самоцель.
-2-
Возможность сразу же применять знания
Уже после первой недели вы научитесь решать задачи при помощи алгоритмов машинного обучения и сможете использовать эти знания для пилотного проекта на работе.
-3-
Самостоятельность в решении
Наши задания сформулированы так, что вам часто нужно будет что-то загуглить. После программы у вас будет свой багаж из качественных ресурсов.
F.A.Q.
Могу ли я взять другие курсы?
Да, вы можете набрать любое количество курсов программы. Они не пересекаются, поскольку являются частью одной длинной 12-недельной программы. При этом с какого-то момента может оказаться, что дешевле будет взять программу целиком.
Сколько времени потребуется для обучения?
Занятия проходят 3 раза в неделю по 3 часа. Это 9 часов. Плюс 4-10 часов потребуется на решение лабораторных работ в зависимости от задания и вашего изначального уровня подготовки.
Я смогу пройти курс, если совсем новичок и никогда не программировал?
Да, но будет сложно. Среди наших выпускников есть те, кто познакомился с программированием непосредственно на программе. Было непросто. Приходилось больше тратить время на задания, испытывать сложности. Но если есть высокая мотивация, то это все выполнимо. Также у нас есть отдельный подготовительный курс с основами Python и Linux.
Чем ваша программа отличается от других курсов по data science?
1. Наша программа не просто про анализ данных, а про анализ больших данных. И такой программы больше нет. Анализ больших данных требует умения работы со специализированными инструментами и наличия инфраструктуры. Все практические задания выполняются на кластере, который мы администрируем и поддерживаем.
2. Это курс офлайновой программы (этим отличается от онлайн-курсов, хотя по стоимости курс сопоставим). На офлайн-программах, как правило, обучение строится эффективнее: есть поддерживающая среда из сокурсников, преподавателей, координатора. По статистике, доля успешно завершивших онлайн-курс редко превышает 25%. На нашей программе свыше 70% получают по итогам сертификат.
Остались вопросы?
Задайте их, и мы с радостью вам ответим
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте свой вопрос и контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.