1. Присоединяйся к лучшим! Пройди - РЕГИСТРАЦИЮ!

Скачать [Евгений Ермаков, Валерий Соколов] [Karpov.Courses] Инженер данных. Все части (2023)

Тема в разделе "Администрирование и программирование", создана пользователем Shark Mafia, 23 сен 2023.

  1. Shark Mafia

    By:Shark Mafia23 сен 2023
    Moderator
    Команда форума Модератор

    Регистрация:
    18 май 2021
    Сообщения:
    16.017
    Симпатии:
    38.215
    [Евгений Ермаков, Валерий Соколов] [Karpov.Courses] Инженер данных. Все части (2023)
    2023-09-22_23-10-18
    НАУЧИТЕСЬ ПРАВИЛЬНО ГОТОВИТЬ ДАННЫЕ ЛЮБЫХ РАЗМЕРОВ И СЛОЖНОСТИ

    Обучающие выборки для машинного обучения и красивые графики для отчётов не появляются сами собой: данные нужно собирать, хранить, валидировать и комбинировать между собой, быстро реагируя на изменения в их структуре.

    ДЛЯ КОГО ЭТОТ КУРС:

    ИНЖЕНЕР ДАННЫХ
    Уже работаете с хранилищами данных, но хотите систематизировать знания и глубже погрузиться в актуальные технологии.

    АНАЛИТИК ДАННЫХ
    Постоянно взаимодействуете с базами данных, но хотите лучше разобраться в ETL-процессах и выйти на качественно новый уровень в аналитике.

    BI-РАЗРАБОТЧИК
    Занимаетесь развитием систем бизнес-аналитики, хотите освоить архитектуру современных хранилищ данных и научиться их проектировать.

    BACKEND-РАЗРАБОТЧИК
    Имеете опыт бэкенд-разработки и хотите применить его для решения задач, связанных с хранением и обработкой больших данных.

    РАБОТАЙТЕ С ДАННЫМИ В ЛЮБЫХ СИСТЕМАХ
    — Изучайте архитектуру хранилищ данных и подходы к их проектированию
    — Сравнивайте на практике Big Data решения на базе Hadoop и реляционные MPP СУБД
    — Учитесь работать с облаками и автоматизировать ETL-процессы с помощью Airflow

    ПРОГРАММА КУРСА:
    1. РЕЛЯЦИОННЫЕ И MPP СУБД
    Начнём погружение в инженерию данных со знакомства с реляционными и MPP базами данных. Рассмотрим их архитектуру, обсудим популярные решения и узнаем, в каких случаях MPP СУБД оказываются лучше традиционных. Научимся готовить PostgreSQL и MPP базы данных на примере Greenplum.

    2. АВТОМАТИЗАЦИЯ ETL-ПРОЦЕССОВ
    ETL — ключевой процесс в управлении хранилищами данных. Рассмотрим принципы и основные этапы его построения. Познакомимся с популярным инструментом Airflow, подробно разберём его основные компоненты и научимся с его помощью автоматизировать ETL-пайплайны.

    3. BIG DATA

    Познакомимся с механизмами распределённого хранения больших данных на базе Hadoop, разберём основные паттерны реализации их распределённой обработки. Рассмотрим вопросы отказоустойчивости и восстановления после сбоев. Поговорим о потоковой обработке данных, методах и средствах мониторинга и профилирования заданий Spark.

    4. ПРОЕКТИРОВАНИЕ DWH
    Data Warehouse — централизованное хранилище данных из разных источников. Познакомимся с его верхнеуровневой логической архитектурой, рассмотрим её основные компоненты и разберём на практике разные подходы к проектированию детального слоя DWH.

    5. ОБЛАЧНОЕ ХРАНИЛИЩЕ
    Рассмотрим облачные решения и инструменты для построения DWH и Data Lake. Познакомимся с Kubernetes и научимся применять его для работы с данными. Поработаем с облаком на практике, рассмотрим процесс установки и настройки JupyterHub и Spark в Kubernetes.

    6. ВИЗУАЛИЗАЦИЯ ДАННЫХ
    Рассмотрим основные принципы работы с данными с точки зрения их визуализации и научимся смотреть на данные глазами их потребителя. Познакомимся с Tableau — гибким и мощным BI-инструментом. Узнаем, как он взаимодействует с базами данных, и построим с его помощью интерактивный дашборд для мониторинга DWH платформы.

    7. BIG ML
    Познакомимся с теорией распределённого машинного обучения. Научимся работать с популярным модулем Spark ML и рассмотрим подходы к обучению и применению моделей на больших данных.

    8. УПРАВЛЕНИЕ МОДЕЛЯМИ
    В работе инженеры часто сталкиваются с подготовкой данных для обучения ML-моделей. Рассмотрим инструменты для построения ML-пайплайнов, версионирования датасетов, организации учёта и трекинга моделей.

    9. УПРАВЛЕНИЕ ДАННЫМИ
    На практике часто приходится иметь дело с разными данными и огромным числом интеграций и процессов, выполняющих над ними те или иные преобразования. Познакомимся с популярными подходами к управлению данными, обсудим инструменты для контроля качества данных и отслеживания их происхождения.

    Продажник:

    Скачать:
     
    WillAge и makopr нравится это.
  2. LUCY_M

    By:LUCY_M14 сен 2024
    Новичок
    Новенький

    Регистрация:
    7 дек 2023
    Сообщения:
    1
    Симпатии:
    0
    Курс 23 года?
     
  3. Администратор

    By:Администратор14 сен 2024
    Администратор
    Команда форума Администратор

    Регистрация:
    17 ноя 2018
    Сообщения:
    26.880
    Симпатии:
    9.281
    Да, в заголовке указано.
     
  4. Okiok

    By:Okiok18 ноя 2024
    VIP
    VIP Новенький

    Регистрация:
    8 ноя 2019
    Сообщения:
    5
    Симпатии:
    1
    здравствуйте! будут ли части с 6 по 9?
     
  5. Super Hilda

    By:Super Hilda18 ноя 2024
    Moderator
    Команда форума Модератор

    Регистрация:
    3 фев 2021
    Сообщения:
    27.607
    Симпатии:
    6.896
    Добрый день)
    В заголовке написано ВСЕ ЧАСТИ!
    В облаке выданы 5 частей из 5!
    Курс опубликован в том объёме и комплектации, в котором был приобретён на доноре)
    Других материалов нет и мы от Вас ничего не утаиваем)
    Приятного изучения и хорошего настроения!)):)
     
Похожие темы
  1. bobozaka

    Стол заказов FRONTEND karpov.courses

    Ответов:
    3
    Просмотров:
    46
  2. Shark Mafia
    Ответов:
    4
    Просмотров:
    1.677
  3. Shark Mafia
    Ответов:
    2
    Просмотров:
    2.382
  4. Shark Mafia
    Ответов:
    0
    Просмотров:
    1.438
  5. Shark Mafia
    Ответов:
    0
    Просмотров:
    868
  6. Shark Mafia
    Ответов:
    2
    Просмотров:
    1.097
  7. rabotasever
    Ответов:
    6
    Просмотров:
    140
Загрузка...