1. Присоединяйся к лучшим! Пройди - РЕГИСТРАЦИЮ!

Скачать [ВigData Тeam] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive (2023)

Тема в разделе "Администрирование и программирование", создана пользователем Shark Mafia, 12 ноя 2023.

  1. Shark Mafia

    By:Shark Mafia12 ноя 2023
    Moderator
    Команда форума Модератор

    Регистрация:
    18 май 2021
    Сообщения:
    16.025
    Симпатии:
    38.261
    [ВigData Тeam] Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive (2023)
    2023-11-12_14-23-01

    Практический курс по Big Data. Часть 1. HDFS, Map Reduce, Hive [bigdata team]

    Кому подойдет этот курс:

    • Разработчикам
      Вы программируете, но хотите расширить профессиональные возможности и получить практические навыки работы с большими данными? На курсе вы научитесь работать с Hadoop, MapReduce, Hive, Spark, Kafka, Cassandra и будете выполнять задания на реальном кластере.
    • Data Engineers
      Хотите расширить свой арсенал для работы с данными и структурировать свои знания в DE? Вы узнаете о современных технологиях работы с Big Data, научитесь грамотно их использовать и понимать, какую технологию в каких случаях лучше применять.
    • Аналитикам
      Хотите освоить работу с большими данными, чтобы решать более сложные и интересные аналитические задачи? Вы научитесь использовать инструменты работы с большими данными, проводить аналитику с помощью SQL и NoSQL инструментов, готовить данные и отчеты на основе больших массивов информации.
    • Data Scientists
      Ловите себя на мысли, что качество модели во многом зависит от правильного сбора и предобработки данных? Вы получите базу по современным инструментам и подходам, необходимым для сбора, хранения и обработки данных; изучите особенности укладки данных для оптимизации вычислений, подготовки фичей и масштабирования ML-моделей.
    Вы научитесь работать с распределенными файловыми системами, познакомитесь с экосистемой Hadoop, разберетесь с оптимизацией MapReduce вычислений и работой с Hive.

    Часть 1. HDFS, Map Reduce, Hive

    В этом модуле вы изучите:
    • вводная часть: знакомство (задачи, оценки, дедлайны), подробности курса;
    • распределенные файловые системы (GFS, HDFS). Их составляющие, достоинства, недостатки и сфера применения;
    • чтение и запись в HDFS. HDFS APIs: Web, shell.
    • Hadoop Streaming;
    • элементы Hadoop-задачи (Mapper, reducer, combiner, partitioner, comparator).
    • приложения с несколькими Hadoop-задачами;
    • тюнинг Hadoop-job (настройка партиционирования, сложные ключи, uber jobs);
    • задачи с несколькими входами. Joins в Hadoop.
    • архитектура Hive, виды таблиц, форматы хранения данных;
    • трансляция Hive-запросов в MapReduce-задачи;
    • сериализация и десериализация;
    • тюнинг Join'ов в Hive;
    • партиционирование, бакетирование, семплирование;
    • User defined functions, Hive Streaming.
    Продажник:

    Скачать:
     
    mnr85 нравится это.
Похожие темы
  1. Todos
    Ответов:
    0
    Просмотров:
    763
  2. Shark Mafia
    Ответов:
    0
    Просмотров:
    1.037
  3. Shark Mafia
    Ответов:
    4
    Просмотров:
    1.397
  4. Shark Mafia
    Ответов:
    8
    Просмотров:
    2.388
  5. Shark Mafia
    Ответов:
    0
    Просмотров:
    697
  6. Shark Mafia
    Ответов:
    0
    Просмотров:
    307
  7. Shark Mafia
    Ответов:
    0
    Просмотров:
    403
Загрузка...