Программирование [ВigData Тeam] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive (2023)

Moderator
29 Мар 2020
230,492
854,863
113
Голосов: 0
#1
1700214587350-png.64355


Описание [ВigData Тeam] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive (2023):



Кому подойдет этот курс:
  • Разработчикам
    Вы программируете, но хотите расширить профессиональные возможности и получить практические навыки работы с большими данными? На курсе вы научитесь работать с Hadoop, MapReduce, Hive, Spark, Kafka, Cassandra и будете выполнять задания на реальном кластере.
  • Data Engineers
    Хотите расширить свой арсенал для работы с данными и структурировать свои знания в DE? Вы узнаете о современных технологиях работы с Big Data, научитесь грамотно их использовать и понимать, какую технологию в каких случаях лучше применять.
  • Аналитикам
    Хотите освоить работу с большими данными, чтобы решать более сложные и интересные аналитические задачи? Вы научитесь использовать инструменты работы с большими данными, проводить аналитику с помощью SQL и NoSQL инструментов, готовить данные и отчеты на основе больших массивов информации.
  • Data Scientists
    Ловите себя на мысли, что качество модели во многом зависит от правильного сбора и предобработки данных? Вы получите базу по современным инструментам и подходам, необходимым для сбора, хранения и обработки данных; изучите особенности укладки данных для оптимизации вычислений, подготовки фичей и масштабирования ML-моделей.
Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.

Часть 1. HDFS, Map Reduce, Hive
В этом модуле вы изучите:
  • вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
  • распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
  • чтение и запись в HDFS. HDFS APIs: Web, shell.
  • Hadoop Streaming;
  • элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
  • приложения с несколькими Hadoop-задачами;
  • тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
  • задачи с несколькими входами. Joins в Hadoop.
  • архитектура Hive, виды таблиц, форматы хранения данных;
  • трансляция Hive-запросов в MapReduce-задачи;
  • сериализация и десериализация;
  • тюнинг Join'ов в Hive;
  • партиционирование, бакетирование, семплирование;
  • User defined functions, Hive Streaming.

Подробнее:
Для просмотра содержимого вам необходимо авторизоваться

Скачать курс - [ВigData Тeam] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive (2023):


Для просмотра содержимого вам необходимо авторизоваться
 
Последнее редактирование модератором:

О нас
  • Скачивайте бесплатно курсы со слив форума через торрент!

    Наш слив форум был создан для того, чтобы каждый желающий мог в любой момент бесплатно найти и скачать необходимый слив курсов обучения, а, следовательно, получить полезные знания и навыки, тем самым улучшить свое благосостояние.

    Sliwbl.Com регулярно публикует:

    • различные обучающие курсы и инфопродукты от известных бизнес тренеров и коучей;
    • тренинги, вебинары и мануалы от популярных авторов на тему саморазвития;
    • видео уроки, книги и обучения по дизайну, продвижению и созданию сайтов, программированию, бизнесу и другим популярным напрпавлениям

    Мы ежедневно обновляем базу слитых курсов, добавляем новые темы и свежие сливы складчин на форум, чтобы у Вас всегда под рукой была библиотека для освоения новой информации и развития. Материалы для скачивания доступны через торрент и облачные сервисы.

    Контакты: [email protected]
Меню