Описание
Курс в архиве - 23.4 ГБ (нужно будет скачать на пк)
Что такое курс-симулятор:
- Обучение на бизнес-кейсах
Не обучаем на «апельсинах» — после курса-симулятора вы на 100% сразу же готовы решать рабочие задачи или внедрять знания на текущем месте работы - Полная подготовка к собеседованиям
Будете решать тестовые задания от реальных компаний и проходить тестовые собеседования еще в процессе обучения - Уникальное портфолио
Такого портфолио не будет ни у кого больше. Вы соберёте его из реальных задач из разных сфер бизнеса
Чем занимается инженер данных
Представьте, что у вас есть большая коробка с LEGO, из которой нужно выбрать детали для постройки замка или космического корабля.
Дата-инженеры обеспечивают доступность и качество данных, что особенно важно для принятия решений в бизнесе.
Вам нужно сначала выбрать нужные детали, затем правильно их соединить и в конце собрать всё вместе.
Этим и занимается инженер данных.
Кому подойдёт курс-симулятор:
- Новичкам в профессии
Освоите основы инженерии данных для уверенного старта карьеры - Начинающим инженерам данных
Структурируйте свои знания, освоите весь необходимый стек на практике и уверенно войдите в профессию уже на 5 месяце обучения - Аналитикам данных
Изучите методы обработки и трансформации данных, что поможет лучше понимать архитектуру данных и улучшить качество аналитических отчетов - Разработчикам
Сможете освоить специфические задачи инженера данных, такие как работа с ETL-процессами и реализовать проекты в этой области
Какие задачи сможете решать после обучения:
- Создавать и работать с хранилищами данных
- Разрабатывать автоматизированные ETL-пайплайны
- Оптимизировать сложные SQL-запросы
- Работать с большими данными и озерами данных (data lake)
- Пользоваться и управлять DE-инфраструктурой: Linux, Docker, DWH и др.
Какие инструменты освоите:
- Базы данных
PostgreSQL, DBeaver, Clickhouse - Программирование
Python, Pandas, Numpy, Matplotlib, Seaborn, Plotly, gspread, VS Code, Google Colab, Jupyter Notebook - Визуализация данных
Metabase - Автоматизация и деплой
Linux, Docker, bash, Airflow
Программа
- Введение в профессию
- SQL и базы данных
- Визуализация в Metabase
- Git/GitHub
- Python
- Объектно-ориентированное программирование в Python (ООП в Python)
- Python для анализа данных
- Linux
- Docker
- Airflow
- Продвинутый SQL для работы с большими данными
- Хранилища данных (DWH) - Clickhouse
- Hadoop и озера данных (Data lake)
- Spark / pySpark



