Деревья решений, лог. регрессия, SVM, XGBoost, Scikit-learn, Pandas

Расписание занятий:
- вт, чт 19:00–22:00,
- сб 11:00–14:00

Место проведения:
Онлайн-формат - Zoom
Октябрь - ноябрь 2020

Курс "Машинное обучение"

Мы используем файлы cookie, чтобы улучшить работу сайта, и показывать вам контент, согласно вашим интересам. Продолжая использовать сайт, вы соглашаетесь с условиями использования файлов cookie.
Да, соглашаюсь
Close
Что входит в курс
Это один из курсов флагманской программы "Специалист по большим данным"
2 лабы
Каждую неделю вам нужно будет решить лабораторную работу и суперачивку
1 проект
Помимо лаб вы работаете в командах над большим проектом на протяжении всего модуля
7 занятий
С трансляциями в прямом эфире и видеозаписями в личном кабинете

Для кого этот курс?
-1-
Разработчики
У вас есть опыт программирования, но по работе требуется понимать, что происходит в машинном обучении? В этом курсе вы научитесь строить модели машинного обучения и анализировать данные в Python.
-2-
Аналитики
Вы умеете анализировать данные, но требуется знание новых инструментов? Вы научитесь делать не только базовую аналитику, но и строить модели машинного обучения, прогнозирующие различные показатели.
-3-
Менеджеры
Вы занимаетесь развитием продукта или подразделения? В этом курсе вы получите погружение в машинное обучение, поймете юзкейсы использования и его ограничения, попробовав многие вещи своими руками.
Чему вы научитесь
В курсе есть четыре составляющих
Классический ML
Научитесь решать задачи регрессии и классификации при помощи различных алгоритмов машинного обучения, работая со структурированным типом данных. Узнаете, как правильно предобрабатывать и готовить данные для повышения качества прогноза моделей.
ML на текстах
Научитесь представлять текст в векторном виде и решать задачи машинного обучения в классическом виде. Узнаете, как проводить сентимент-анализ отзывов в интернете, для чего нужен word2vec и bag of words.
Ансамбли моделей
Научитесь создавать ансамбли из моделей, объединяя базовые классификаторы в один большой и повышая качество этой мета-модели. Узнаете, чем стэкинг отличается от блендинга, а также об их достоинствах и недостатках.
Введение в Deep learning
Узнаете о современных достижениях в области Deep Learning и какие виды задач можно решать при помощи глубоких нейронных сетей.
Лабы этого курса
Используя обезличенные данные клиентов банка, вам нужно будет предсказать вероятность ухода из банка каждого из них в ближайшие несколько месяцев.
В этой лабе вам нужно будет найти похожие тексты вакансий. Суперачивка — участие в соревновании на Kaggle по определению эмоциональной окраски отзывов в интернете.
В этом проекте вам нужно будет сделать прогноз по полу и возрастной категории пользователей на основании логов их посещения разных сайтов, решив задачу мультиклассовой классификации.
Преподаватели этого курса
Владимир Опанасенко
Начальник управления алгоритмов машинного обучения, Газпромбанк
Кирилл Данилюк
Engineering Manager,
Self-Driving Car, Yandex
Дмитрий Коробченко
Deep Learning R&D Engineer,
NVIDIA
Инфраструктура курса
То, с чем вы будете работать каждый день
Кластер
Этот курс посвящен машинному обучению, поэтому на нем вы будете работать с нашим сервером, оснащенным JupyterHub для удобной работы с Python.
GitHub
Все презентации, лабы, мануалы мы выкладываем в закрытый репозиторий на GitHub. Этот инструмент стал стандартом работы в среде программистов и профессионалов в сфере данных.
Личный кабинет
В нем вы можете проверить правильность выполнения лаб, используя автоматические чекеры. Там же можно смотреть прямые трансляции и видеозаписи занятий.
Slack
Общение во время курса происходит в Slack — удобный мессенджер для команд. Там можно задавать вопросы, общаться с преподавателями, организаторами, друг с другом. Следить за апдейтами в GitHub и быть в курсе новостей.
Стоимость курса 49 000 руб.
28 000 руб.
Возможна рассрочка до 30 декабря 2020 г.

Стоимость повышать до полной не будем ввиду онлайн-формата
Партнер по инфраструктуре
Для учебы вам потребуются
Входные требования
Умение программировать на Python 3
Это основной язык программирования, используемый на курсе. Хорошо, если вы уже будете знакомы с базовым синтаксисом, циклами, условными операторами, функциями, чтением и записью файлов.
Базовые знания Linux
В командной строке Linux вы тоже будете много времени проводить, работая с нашим кластером. Хорошо, если вы уже будете уметь перемещаться по директориям, создавать и редактировать файлы, заходить на удаленный сервер по ssh.
SQL
В курсе вы будете использовать такой инструмент как Hive. Для работы с ним вам пригодится умение писать запросы на этом языке: селекты, джойны, фильтры, подзапросы.
Линейная алгебра и статистика
В курсе мы будем рассматривать продвинутые методы анализа данных, поэтому хорошо, если вы знаете основы статистики и линейной алгебры: среднее, дисперсия, вероятность, теорема Байеса, корреляция, ранг матрицы.
1
2
3
4
5
6
7
NLP
ML
Интересны другие курсы?
Возьмите всю программу целиком
Отзывы
Где работают наши выпускники
Здесь они живут и работают

Наши принципы обучения
Чтобы обучение было эффективным и интересным, мы используем андрагогику
-1-
Материал ориентирован на конкретные задачи
Наша цель — научить вас решать задачи из реальной жизни, а не покрыть список тем. Теория — это инструмент необходимый для решения задач, а не самоцель.
-2-
Возможность сразу же применять знания
Уже после первой недели вы научитесь решать задачи при помощи алгоритмов машинного обучения и сможете использовать эти знания для пилотного проекта на работе.
-3-
Самостоятельность в решении
Наши задания сформулированы так, что вам часто нужно будет что-то загуглить. После программы у вас будет свой багаж из качественных ресурсов.
F.A.Q.
Могу ли я взять другие курсы?
Да, вы можете набрать любое количество курсов программы. Они не пересекаются, поскольку являются частью одной длинной 12-недельной программы. При этом с какого-то момента может оказаться, что дешевле будет взять программу целиком.
Сколько времени потребуется для обучения?
Занятия проходят 3 раза в неделю по 3 часа. Это 9 часов. Плюс 4-10 часов потребуется на решение лабораторных работ в зависимости от задания и вашего изначального уровня подготовки.
Я смогу пройти курс, если совсем новичок и никогда не программировал?
Да, но будет сложно. Среди наших выпускников есть те, кто познакомился с программированием непосредственно на программе. Было непросто. Приходилось больше тратить время на задания, испытывать сложности. Но если есть высокая мотивация, то это все выполнимо. Также у нас есть отдельный подготовительный курс с основами Python и Linux.
Чем ваша программа отличается от других курсов по data science?
1. Наша программа не просто про анализ данных, а про анализ больших данных. И такой программы больше нет. Анализ больших данных требует умения работы со специализированными инструментами и наличия инфраструктуры. Все практические задания выполняются на кластере, который мы администрируем и поддерживаем.
2. Мы используем механики и образовательные инструменты, которые позволяют вам приобрести знания и навыки с максимальной вероятностью. По статистике, доля успешно завершивших обычный онлайн-курс редко превышает 25%. На нашей программе, вне зависимости в оффлайне она проходит или в онлайне – стабильно свыше 70% участников получают по ее итогам сертификат.
Остались вопросы?
Задайте их, и мы с радостью вам ответим
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.
Оставьте свой вопрос и контакты ниже
Мы с вами свяжемся
Отправляя данную форму, вы подтверждаете свое согласие на обработку персональных данных, которая осуществляется в целях предоставления дополнительной информации об образовательных услугах, а также для записи на программы. Мы гарантируем конфиденциальность получаемой нами информации.