Программирование [Вячеслав Колосков] [Stepik] Разработка LLM с нуля (2025)

SliwKa · Пятница в 07:03

Описание [Вячеслав Колосков] [Stepik] Разработка LLM с нуля (2025):

Этот практический курс познакомит студентов с созданием современных языковых моделей (LLM) на примере архитектуры GPT.

Участники с нуля освоят все ключевые компоненты Трансформера, включая токенизацию (BPE), механизмы Внимания и генерацию текста. Для разработки будут использоваться только Python и низкоуровневый PyTorch без привлечения сторонних библиотек.

Чему вы научитесь:

Читать схемы архитектур, основанных на Трансформере.
Проектировать современные LLM.
Понимать алгоритм токенизации текста.
Реализовывать ключевые компоненты GPT.
Управлять креативностью модели.
Собирать и подготавливать данные для обучения.
Настраивать цикл обучения Pre-train для LLM.

Для кого предназначен курс:

Курс рассчитан на разработчиков, инженеров машинного обучения и исследователей, стремящихся глубоко изучить архитектуру современных языковых моделей (LLM).

Начальные требования:

Базовые знания Python, включая понимание ООП (классы, функции).
Основы машинного обучения: train/test, таргет, фичи, градиент, функции потерь, метрики и т.д.
Базовые знания по PyTorch: линейные слои, активации, нормализация, дропаут, обратное распространение ошибки.
Желательно иметь опыт реализации простой полносвязной сети для задачи многоклассовой классификации.

Преподаватель: Вячеслав Колосков

Вячеслав Колосков — Machine Learning Engineer с более чем 15-летним опытом работы в IT. Последние 5 лет он занимается машинным обучением в телекоммуникационной сфере. Его опыт включает работу с большими данными (Spark, Hadoop) и активное участие в проектах, связанных с NLP, включая разработку RAG-системы.

Программа курса:

Введение

Инструкция.
Что такое LLM?
Архитектура LLM.

Токены и эмбединги

Byte-Pair Encoding.
Эмбединги.

Transformer

Механизм «Внимание».
Feed-Forward Network.
Decoder.

LLM

Сборка GPT.
Сэмплирование.

Обучение

Подготовка датасета.
Train/Eval.
Применение модели.

Другие модели

GPT-2.
LLama.
Mistral.
Mixtral.
Gemma.

Подробнее:

Скачать курс [Вячеслав Колосков] [Stepik] Разработка LLM с нуля (2025):

Для просмотра содержимого вам необходимо авторизоваться

RaSvet78 · Вчера в 21:23

Спасибо админам за новый курс!

Похожие темы	Форум	Ответов	Дата
Здоровье и спорт [Вячеслав Гуцалюк] Серия «Здоровое утро» (2020)	Йога	2	22 Сен 2025
Здоровье и спорт [Вячеслав Гуцалюк] Суставы и позвоночник (2019)	Йога	0	16 Июл 2025
Здоровье и спорт [Вячеслав Гуцалюк] Онлайн-тренировки по йоге №1-20 (2021)	Йога	0	16 Июл 2025
Здоровье и спорт [Вячеслав Гуцалюк] Всё о лотосе (падмасане) (2019)	Йога	0	16 Июл 2025
Здоровье и спорт [Вячеслав Гуцалюк] Оздоровление позвоночника (2020)	Йога	0	16 Июл 2025