- #1
Голосов: 0
0.0
5
0
0
https://rwnd.pro/threads/geekbrains-%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B5-%D0%BE%D0%B1%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B5-%D0%A7%D0%B0%D1%81%D1%82%D1%8C-1-%D0%B8%D0%B7-5-2020.76211/
Автор: GeekBrains
Название: Машинное обучение. Часть 1 из 5 (2020)
Программа
30+ онлайн-уроков, более 65 часов обучающего контента и практика после каждого занятия
Длительность: 5 месяцев.
Модуль 1. Теория вероятностей и математическая статистика
Модуль 2. Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
Модуль 3. Библиотеки Python для Data Science: продолжение
Модуль 4. Алгоритмы анализа данных
Модуль 5. Системы машинного обучения в Production
Теория вероятностей и математическая статистика
Курсовой проект
Разведочный анализ данных (EDA) на основе выбранного датасета: визуализация, корреляционный, дисперсионный и факторный анализ
Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
Курсовой проект
Соревнование на платформе Kaggle по предсказанию цены на недвижимость, решение задачи регрессии
Библиотеки Python для Data Science: продолжение
Курсовой проект
Соревнование на платформе Kaggle по кредитному скорингу, решение задачи классификации
Алгоритмы анализа данных
Курсовой проект
Участие в одном или двух соревнованиях на Kaggle: предсказать средний балл на экзамене по математике, который получают ученики репетиторов (задача регрессии); предсказать, подойдет ли репетитор для подготовки к экзамену по математике (задача классификации)
Системы машинного обучения в Production
Курсовой проект
Оценка потенциального влияния на бизнес ML-решения, построение модели оттока клиентов в игровых проектах и подготовка кода для Production в PyCharm
Подробнее:
Скачать:
Название: Машинное обучение. Часть 1 из 5 (2020)
Программа
30+ онлайн-уроков, более 65 часов обучающего контента и практика после каждого занятия
Длительность: 5 месяцев.
Модуль 1. Теория вероятностей и математическая статистика
Модуль 2. Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
Модуль 3. Библиотеки Python для Data Science: продолжение
Модуль 4. Алгоритмы анализа данных
Модуль 5. Системы машинного обучения в Production
Теория вероятностей и математическая статистика
- Случайные события. Условная вероятность. Формула Байеса. Независимые испытания
- Дискретные случайные величины. Закон распределения вероятностей. Биномиальный закон распределения. Распределение Пуассона
- Описательная статистика. Качественные и количественные характеристики популяции. Графическое представление данных
- Непрерывные случайные величины. Функция распределения и плотность распределения вероятностей. Равномерное и нормальное распределение. Центральная предельная теорема
- Проверка статистических гипотез. P-значения. Доверительные интервалы. A/B-тестирование
- Взаимосвязь величин. Параметрические и непараметрические показатели корреляции. Корреляционный анализ
- Многомерный статистический анализ. Линейная регрессия
- Дисперсионный анализ. Логистическая регрессия
Курсовой проект
Разведочный анализ данных (EDA) на основе выбранного датасета: визуализация, корреляционный, дисперсионный и факторный анализ
Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
- Введение в курс. Вебинар
- Вычисления с помощью Numpy. Работа с данными в Pandas. Видеоурок
- Вычисления с помощью Numpy. Работа с данными в Pandas. Вебинар
- Визуализация данных в Matplotlib. Видеоурок
- Визуализация данных в Matplotlib. Вебинар
- Обучение с учителем в Scikit-learn. Видеоурок
- Обучение с учителем в Scikit-learn. Вебинар
- Обучение без учителя в Scikit-learn. Видеоурок
- Обучение без учителя в Scikit-learn и введение в итоговый проект. Вебинар
- Консультация по итоговому проекту. Вебинар
Курсовой проект
Соревнование на платформе Kaggle по предсказанию цены на недвижимость, решение задачи регрессии
Библиотеки Python для Data Science: продолжение
- Введение в задачу классификации. Постановка задачи и подготовка данных
- Анализ данных и проверка статистических гипотез
- Построение модели классификации
- Оценка и интерпретация полученной модели. Обсуждение курсового проекта
Курсовой проект
Соревнование на платформе Kaggle по кредитному скорингу, решение задачи классификации
Алгоритмы анализа данных
- Алгоритм линейной регрессии. Градиентный спуск
- Масштабирование признаков. L1- и L2-регуляризация. Стохастический градиентный спуск
- Логистическая регрессия. Log Loss
- Алгоритм построения дерева решений
- Случайный лес
- Градиентный бустинг (AdaBoost)
- Классификация с помощью KNN. Кластеризация K-means
- Снижение размерности данных
Курсовой проект
Участие в одном или двух соревнованиях на Kaggle: предсказать средний балл на экзамене по математике, который получают ученики репетиторов (задача регрессии); предсказать, подойдет ли репетитор для подготовки к экзамену по математике (задача классификации)
Системы машинного обучения в Production
- Введение в задачу предсказания оттока. Формализация задачи и сбор сырых данных
- Загрузка данных и построение обучающей выборки. Анализ и предобработка датасета. Балансировка классов
- Выбор и обучение модели на отобранных признаках. Сравнение качества и оценка модели
- Оценка потенциального влияния на бизнес. Масштабирование решения
- Подготовка к продакшену. Планировщик задач и перенос проекта из Jupyter в PyCharm
Курсовой проект
Оценка потенциального влияния на бизнес ML-решения, построение модели оттока клиентов в игровых проектах и подготовка кода для Production в PyCharm
Подробнее:
Для просмотра содержимого вам необходимо авторизоваться.
Скачать:
Скрытое содержимое могут видеть только члены группы Премиум.