Обработка изображений и текстов с помощью нейронных сетей. Решение ранее трудных задач с использованием современных архитектур
Занятия онлайн в зуме по пн и ср 19:00 — 22:00
Весна 2023 DEEP LEARNING
Обработка изображений и текстов с помощью нейронных сетей. Решение ранее трудных задач с использованием современных архитектур
Занятия онлайн в зуме по пн и ср 19:00 — 22:00
ОСТАВИТЬ ЗАЯВКУ
Новые архитектуры и техники обучения
Появившиеся в последнее время новые архитектуры и техники обучения в CV и NLP обеспечивают прогресс в решении задач, которые до этого считались трудными. Отдельно стоит упомянуть архитектуру Transformer-ов, которая постепенно вытесняет другие архитектуры. В результате точность решения трудных задач повышается и запускается разработка новых продуктов, реализация которых раньше была невозможной.
После нашего курса вы сможете получить актуальные знания в новой профессии: быстро применять готовые модели и решения буквально в 2 строчки кода, а также поработать с новейшими задачами, которые стали доступны только сейчас благодаря новым архитектурам и техникам обучения.
Это откроет для вас дорогу в самые перспективные стартапы, а также вы сможете сами создать новый продукт, которого еще нет на рынке.
Для компаний наш курс поможет спланировать первые шаги по внедрению Deep Learning или обновить уже существующие пайплайны.
НОВЫЕ АРХИТЕКТУРЫ И ТЕХНИКИ ОБУЧЕНИЯ
Появившиеся в последнее время новые архитектуры и техники обучения в CV и NLP обеспечивают прогресс в решении задач, которые до этого считались трудными. Отдельно стоит упомянуть архитектуру Transformer-ов, которая постепенно вытесняет другие архитектуры. В результате точность решения трудных задач повышается и запускается разработка новых продуктов, реализация которых раньше была невозможной.
После нашего курса вы сможете получить актуальные знания в новой профессии: быстро применять готовые модели и решения буквально в 2 строчки кода, а также поработать с новейшими задачами, которые стали доступны только сейчас благодаря новым архитектурам и техникам обучения.
Это откроет для вас дорогу в самые перспективные стартапы, а также вы сможете сами создать новый продукт, которого еще нет на рынке.
Для компаний наш курс поможет спланировать первые шаги по внедрению Deep Learning или обновить уже существующие пайплайны.
ЧТО ВХОДИТ В ПРОГРАММУ
В нашей программе есть две составляющих
2 проекта
Проекты выполняются в рамках домашнего задания (7−10 часов в неделю) и основаны на реальных кейсах.
8 занятий
Проводятся в прямом эфире. Видеозаписи доступны в личном кабинете. Занятия устроены так, что преподаватель проводит обзор трендов, рассказывает об устройстве архитектур, демонстрирует практические кейсы, показывая подводные камни и best practices.
ЧЕМУ ВЫ НАУЧИТЕСЬ
В нашей программе есть две составляющих
Computer Vision
Научитесь решать задачи из активно развивающихся областей компьютерного зрения Проект: обучение нейросети на DensePose датасете для задачи виртуальной примерки одежды
Natural Language Processing
Научитесь задачам генерации и классификации текстов с использованием Deep Learning и машинному переводу. Проект: классификация интентов для чат-бота в рамках задачи по созданию голосового ассистента службы поддержки
ЛАБОРАТОРНЫЕ РАБОТЫ
Все задания включают в себя живые датасеты и основаны на задачах из реальной жизни
Часть 1. Computer Vision
Пройдем теоретическую базу, необходимую для понимания всех современных архитектур:
- устройство сетей в целом - обучение сетей - сверточные сети - вариационные автоэнкодеры
Рассмотрим актуальные задачи в CV и архитектуры для них
- первая продвинутая архитектура ResNet и последующие решения, появившиеся на ее основе: семейство сетей RegNet - transfer learning - segmentation, pose recognition, dense pose
Наиболее заметные и актуальные архитектуры GAN-ов
- GAN, Progressive GAN, StyleGAN и другие
Рассмотрим два важных результата в развитии использования transformer-ов в CV
Результат 1
Для CLIP - сетки 2020-го года сообществом было собран open-source датасет LAION-5b, который позволил многим командам воспроизвести результаты DALL-E 2 и развить его. Так вышла сетка Stable Diffusion и на ее основе появилось много интересных работ и так же новых продуктов.
Разберем как сам CLIP и zero-shot learning, так и Stable Diffusion.
Результат 2
Трансформеры из тяжеловесных сеток пришли в real-time модели: появился гибридная сетка на основе сверток и трансформеров EfficientFormer
Часть 2. Natural Language Processing
Архитектуры в до-трансформерскую эру: CNN и RNN (LSTMs). Реализация классификатора на основе обеих архитектур
Sequence-to-sequence tagging на примере чат-бота
Encoder-decoder, появление attention и машинный перевод
Архитектура трансформеров. Языковые модели на основе трансформеров: от BERT до DeBERTa и T5
Автоэнкодеры. Кластеризация и topic modelling
Практические моменты: обучение на нескольких GPU на примере lightning and deepspeed (multi GPU training)
ДЛЯ КОГО ЭТА ПРОГРАММА
Data Scientists
У вас уже есть опыт работы с классическим машинным обучением и NLP? После прохождения программы вы получите практические навыки для работы с современными архитектурами нейронных сетей и научитесь использовать эти знания для анализа данных.
Технические руководители
Вы занимаетесь развитием продукта или направления? Программа позволит вам глубже разобраться в трендах и технологиях глубокого обучения, а также понять, как Deep Learning поможет монетизировать ваш продукт.
ML-инженеры
Программа позволит глубоко погрузиться в теорию и практику глубокого обучения, с возможностью научиться разработке нейронных сетей на основе наиболее современных архитектур.
ПРЕПОДАВАТЕЛИ ПРОГРАММЫ
Наши преподаватели — только практики из индустрии, умеющие объяснять сложные вещи простыми словами
Станислав Капулкин
Основатель и Data Science Specialist AppliedML
Анатолий Востряков
Researcher, Chattermill
ВХОДНЫЕ ТРЕБОВАНИЯ
Для учебы вам потребуется
Умение программировать на Python 3
Это основной язык программирования, используемый на программе. Необходимы знания базового синтаксиса, а также опыт программирования на нем.
Базовые знания Linux
Какое-то количество времени вы будете проводить в командной строке Linux, работая с GPU-виртуалкой. Хорошо, если вы умеете перемещаться по директориям, создавать и редактировать файлы, заходить на удаленный сервер по ssh.
Статистика и линейная алгебра
На программе мы будем рассматривать продвинутые методы анализа данных, поэтому хорошо, если вы знаете основы статистики и линейной алгебры: среднее, дисперсия, вероятность, теорема Байеса, корреляция, ранг матрицы.
Машинное обучение
Мы не будем объяснять с нуля, что такое машинное обучение и погружаться в классические алгоритмы. Вам нужно обладать опытом построения таких моделей при помощи библиотек Python.
ПАРТНЕР ПО ИНФРАСТРУКТУРЕ
Экосистема облачных сервисов от VK Cloud Solutions помогает строить надежные IT-системы. Входящие в VK Cloud Solutions решения — виртуальные сервера, объектное хранилище, управляемые базы данных, кластеры Kubernetes и многое другое — позволяют запускать приложения и сервисы, работать с большими объемами данных и решать другие задачи крупного, среднего и малого бизнеса.
Заявка на участие
Пожалуйста, оставьте свои контакты и мы свяжемся с вами в ближайшее время
Для корпоративных клиентов — специальные условия при регистрации групп из более чем 3 участников.
Для выпускников наших программ и их друзей предусмотрены скидки.
Оставляйте заявку или звоните+74951288675, чтобы узнать подробности!
ОТПРАВИТЬ ЗАЯВКУ
ЧАСТЫЕ ВОПРОСЫ
Мы создаем все условия для того, чтобы максимально приблизить опыт участников к реальным условиям работы (Project Based Learning). Поэтому основу наших программ составляют лабы (лабораторные работы) – системные большие практические задания, которые максимально приближены к реальным задачам специалистов по работе с данными.
Наша цель — научить вас решать задачи из реальной жизни, а не покрыть список тем. Теория — это инструмент, необходимый для решения задач, а не самоцель.
Возможность сразу же применять полученные знания в работе и своих проектах.
На пути будут встречаться сложности, которые вы преодолеете и откроете в себе новые качества, а также получите незабываемый эмоциональный опыт! Вы пройдете настоящий путь героя!
Наши программы длятся от 5 до 12 недель – они максимально интенсивны и полностью погружают в работу с данными.
Основной формат наших программ – синхронные онлайн-занятия с преподавателями в Zoom, самостоятельное выполнение лаб и тестов вне занятий онлайн. Занятия 2 раза в неделю по 3 часа и возможность задать вопросы преподавателю «здесь и сейчас» и получить ответы.
В среднем, на прохождение программы нужно закладывать от 15 часов в неделю – на занятия и выполнение лаб.
Наши программы рассчитаны на специалистов среднего и высокого уровня в области работы с данными – разработчиков, дата-инженеров, аналитиков, дата-сайентистов и менеджеров.
В зависимости от программы, входные требования могут отличаться. Практически во всех программах требуются уверенные навыки программирования на Python/Scala/Java, знание SQL и Linux.
Все презентации, jupyter-ноутбуки, лабы и мануалы мы выкладываем в закрытый репозиторий на GitHub. Для выполнения лаб всем участникам мы даем доступ к облачному кластеру. Проверка лаб проводится автоматически чекерами в личном кабинете – такой формат дает возможность быстро проверять лабы и в случае неуспеха внести правки и проверить снова. В каждой программе для участников также создаются чаты – удобное пространство для общения и обсуждения.
Наши преподаватели – только действующие эксперты-практики по работе с данными из российских и международных компаний, которые могут объяснять сложные вещи простыми словами
Для того, чтобы прохождение программы было максимально комфортным и интересным, во всех программах есть координаторы. Они отвечают на технические вопросы по лабам и помогают советами как «старшие товарищи» – координаторы сами проходили программы и знают о возможных сложностях и их преодолении на собственном опыте.
Наша программа не про использование стандартных инструментов анализа данных, а про работу именно с большими данными с использованием Apache Spark.
Мы используем механики и образовательные инструменты, которые позволяют вам приобрести знания и навыки с максимальной вероятностью. По статистике, доля успешно завершивших обычный онлайн-курс редко превышает 25%. На нашей программе, вне зависимости в офлайне она проходит или в онлайне — стабильно свыше 70% участников получают по итогам сертификат.
Для физических лиц возможна рассрочка
Для корпоративных клиентов – специальные условия при регистрации групп из более чем 3 участников
Для выпускников наших программ и их друзей предусмотрены скидки
Также есть промокоды, которые вы сможете найти в наших социальных сетях и у наших партнеров. Промокоды не суммируются с другими предложениями и скидками
Мы создаем все условия для того, чтобы максимально приблизить опыт участников к реальным условиям работы (Project Based Learning). Поэтому основу наших программ составляют лабы (лабораторные работы) – системные большие практические задания, которые максимально приближены к реальным задачам специалистов по работе с данными.
Наша цель — научить вас решать задачи из реальной жизни, а не покрыть список тем. Теория — это инструмент, необходимый для решения задач, а не самоцель.
Возможность сразу же применять полученные знания в работе и своих проектах.
На пути будут встречаться сложности, которые вы преодолеете и откроете в себе новые качества, а также получите незабываемый эмоциональный опыт! Вы пройдете настоящий путь героя!
Наши программы длятся от 5 до 12 недель – они максимально интенсивны и полностью погружают в работу с данными.
Основной формат наших программ – синхронные онлайн-занятия с преподавателями в Zoom, самостоятельное выполнение лаб и тестов вне занятий онлайн. Занятия 2 раза в неделю по 3 часа и возможность задать вопросы преподавателю «здесь и сейчас» и получить ответы.
В среднем, на прохождение программы нужно закладывать от 15 часов в неделю – на занятия и выполнение лаб.
Наши программы рассчитаны на специалистов среднего и высокого уровня в области работы с данными – разработчиков, дата-инженеров, аналитиков, дата-сайентистов и менеджеров.
В зависимости от программы, входные требования могут отличаться. Практически во всех программах требуются уверенные навыки программирования на Python/Scala/Java, знание SQL и Linux.
Все презентации, jupyter-ноутбуки, лабы и мануалы мы выкладываем в закрытый репозиторий на GitHub. Для выполнения лаб всем участникам мы даем доступ к облачному кластеру. Проверка лаб проводится автоматически чекерами в личном кабинете – такой формат дает возможность быстро проверять лабы и в случае неуспеха внести правки и проверить снова. В каждой программе для участников также создаются чаты – удобное пространство для общения и обсуждения.
Наши преподаватели – только действующие эксперты-практики по работе с данными из российских и международных компаний, которые могут объяснять сложные вещи простыми словами
Для того, чтобы прохождение программы было максимально комфортным и интересным, во всех программах есть координаторы. Они отвечают на технические вопросы по лабам и помогают советами как «старшие товарищи» – координаторы сами проходили программы и знают о возможных сложностях и их преодолении на собственном опыте.
Наша программа не про использование стандартных инструментов анализа данных, а про работу именно с большими данными с использованием Apache Spark.
Мы используем механики и образовательные инструменты, которые позволяют вам приобрести знания и навыки с максимальной вероятностью. По статистике, доля успешно завершивших обычный онлайн-курс редко превышает 25%. На нашей программе, вне зависимости в офлайне она проходит или в онлайне — стабильно свыше 70% участников получают по итогам сертификат.
Для физических лиц возможна рассрочка
Для корпоративных клиентов – специальные условия при регистрации групп из более чем 3 участников
Для выпускников наших программ и их друзей предусмотрены скидки
Также есть промокоды, которые вы сможете найти в наших социальных сетях и у наших партнеров. Промокоды не суммируются с другими предложениями и скидками
НУЖНА ПОМОЩЬ В ВЫБОРЕ ПРОГРАММЫ?
Оставьте ваши контакты — и мы вас проконсультируем и ответим на все вопросы