[Simulative] Симулятор Инженер данных. Тариф Базовый (Андрон Алексанян, Елизавета Бережная)

69 

Описание

Курс в архиве - 23.4 ГБ (нужно будет скачать на пк)

Что такое курс-симулятор:

  • Обучение на бизнес-кейсах
    Не обучаем на «апельсинах» — после курса-симулятора вы на 100% сразу же готовы решать рабочие задачи или внедрять знания на текущем месте работы
  • Полная подготовка к собеседованиям
    Будете решать тестовые задания от реальных компаний и проходить тестовые собеседования еще в процессе обучения
  • Уникальное портфолио
    Такого портфолио не будет ни у кого больше. Вы соберёте его из реальных задач из разных сфер бизнеса

Чем занимается инженер данных
Представьте, что у вас есть большая коробка с LEGO, из которой нужно выбрать детали для постройки замка или космического корабля.
Дата-инженеры обеспечивают доступность и качество данных, что особенно важно для принятия решений в бизнесе.
Вам нужно сначала выбрать нужные детали, затем правильно их соединить и в конце собрать всё вместе.
Этим и занимается инженер данных.

Кому подойдёт курс-симулятор:

  • Новичкам в профессии
    Освоите основы инженерии данных для уверенного старта карьеры
  • Начинающим инженерам данных
    Структурируйте свои знания, освоите весь необходимый стек на практике и уверенно войдите в профессию уже на 5 месяце обучения
  • Аналитикам данных
    Изучите методы обработки и трансформации данных, что поможет лучше понимать архитектуру данных и улучшить качество аналитических отчетов
  • Разработчикам
    Сможете освоить специфические задачи инженера данных, такие как работа с ETL-процессами и реализовать проекты в этой области

Какие задачи сможете решать после обучения:

  • Создавать и работать с хранилищами данных
  • Разрабатывать автоматизированные ETL-пайплайны
  • Оптимизировать сложные SQL-запросы
  • Работать с большими данными и озерами данных (data lake)
  • Пользоваться и управлять DE-инфраструктурой: Linux, Docker, DWH и др.

Какие инструменты освоите:

  • Базы данных
    PostgreSQL, DBeaver, Clickhouse
  • Программирование
    Python, Pandas, Numpy, Matplotlib, Seaborn, Plotly, gspread, VS Code, Google Colab, Jupyter Notebook
  • Визуализация данных
    Metabase
  • Автоматизация и деплой
    Linux, Docker, bash, Airflow

Программа

  1. Введение в профессию
  2. SQL и базы данных
  3. Визуализация в Metabase
  4. Git/GitHub
  5. Python
  6. Объектно-ориентированное программирование в Python (ООП в Python)
  7. Python для анализа данных
  8. Linux
  9. Docker
  10. Airflow
  11. Продвинутый SQL для работы с большими данными
  12. Хранилища данных (DWH) - Clickhouse
  13. Hadoop и озера данных (Data lake)
  14. Spark / pySpark