Описание [stepik] [Алексей Кожакин] Машинное обучение - Подготовка данных (Модуль 1) (2024):
Этот курс — первый модуль из серии обучающих программ по машинному обучению (ML). В рамках курса рассматривается прогнозирование в футбольной аналитике. Основное внимание уделяется сбору данных, которые будут использованы для прогнозирования в последующих модулях. Также будут применены методы предварительной обработки данных.
Программа курса включает следующие разделы:
- Введение: информация о курсе и среде разработки.
- Сбор данных с использованием парсинга: выбор источника данных, методов парсинга, определение целевых данных, разработка скрипта парсинга и использование библиотеки для работы с данными.
- Обзор данных: изучение датасета и библиотек для анализа данных.
- Очистка данных: важность и цели очистки данных, устранение дубликатов, заполнение пропущенных данных, определение целевой переменной и входных параметров.
- Валидация данных: проверка качества данных после очистки и обработки, оценка точности моделей, анализ важности признаков.
- Кластерный анализ: понижение размерности, кластерный анализ, добавление новых параметров и оценка качества модели после применения кластеризации.
- Нормализация и стандартизация данных: приведение данных к единому формату, преобразование категориальных признаков и оценка качества модели после нормализации.
- Балансировка данных: статистический анализ и балансировка данных.
Подробнее:
Для просмотра содержимого вам необходимо авторизоваться
Скачать курс [stepik] [Алексей Кожакин] Машинное обучение - Подготовка данных (Модуль 1) (2024):
Для просмотра содержимого вам необходимо авторизоваться
Последнее редактирование модератором:
Симпатии:
Это понравилось dmitrykgd