О чём курс
Научитесь создавать интерактивные дашборды, подключать источники данных и визуализировать сложные наборы данных.
На курсе вы познакомитесь с архитектурой Superset, подключением и очисткой данных, созданием дашбордов и интеграцией с другими инструментами. У
никальные кейсы иБазовые знания SQL, понимание основ анализа данных. Опыт работы с BI-инструментами приветствуется, но не обязателен.з практики помогут применить полученные знания прямо сейчас.
Предварительная подготовка
Базовые знания SQL, понимание основ анализа данных. Опыт работы с BI-инструментами приветствуется, но не обязателен.
Для кого
BI-специалист
Дата-аналитик
Бизнес-аналитик
Улучшаемые навыки
BI-аналитика
Визуализация данных
Дашборды
SQL-запросы
ETL
Фильтрация данных
Совместная работа
Каталогизация контента.
Программа курса
01
Введение в Apache Superset и BI-аналитику
Что такое BI, роль Apache Superset в экосистеме (сравнение с Power BI, Tableau, Grafana).
Архитектура Superset (метаданные, кеширование, движки запросов).
Когда Superset не подходит (границы применимости).
Кейсы из практики: Как компании уже используют Superset .
Практика:
Установка Superset (локально + Docker).
Первый взгляд на интерфейс: навигация, роли, каталог дашбордов.
Разбор демо-дашборда (что внутри: слои, фильтры, связи).
02
Подключение и подготовка данных
Источники данных: базы SQL (PostgreSQL, MySQL), CSV, Google Sheets, API.
ETL vs ELT: как Superset работает с данными.
Практики оптимизации запросов (SQL-запросы, индексы, семплирование).
Практика:
Подключаем 3 разных источника: БД (например, PostgreSQL), CSV, API (например, тестовый JSON).
Объединение данных (JOIN в Superset).
Настройка расписания обновлений (инкрементальная загрузка).
Очистка данных средствами Superset (регулярные выражения, замена NULL).
03
Визуальное исследование и создание метрик
Лучшие практики визуализации.
Виды графиков в Superset и их применимость (bar, line, heatmap, treemap и др.).
Вычисления на лету: метрики, KPI, агрегаты (SUM, AVG, Percentile).
Практика:
Построение разных графиков на тестовом датасете.
Добавление вычисляемых полей.
Фильтры: базовая настройка (по дате, категории, тексту).
04
Сборка дашбордов и командная работа
UX/UI для дашбордов (расположение виджетов, единый стиль).
Публикация, шаринг, контроль версий дашбордов.
Роли в Superset (Admin, Analyst, Viewer): как разграничить доступ.
Практика:
Собираем готовый дашборд из ранее созданных графиков.
Drill-down (детализация:).
Групповая работа: 2–3 человека создают общий дашборд удалённо.
05
Интеграция и оптимизация Superset
Как связать с Airflow (автоматизация ETL).
Как гонять данные из Superset в Excel/Power BI (экспорт API).
Краткий обзор связки с Apache NiFi / Kafka (стриминг данных).
Учимся смотреть SQL-запросы, которые генерит Superset.
Как ускорить рендеринг (кеширование, материальные представления).
06
Реальный проект и зачёт
Это не просто практика, а СИМУЛЯЦИЯ РЕАЛЬНОГО ПРОЕКТА:
Выдаём кейс: "Анализ эффективности розничной сети" (готовый датасет).
Задача студентов: за 4 часа сделать:
Подключить 2–3 источника.
Построить 4–5 разных визуализаций.
Собрать интерактивный дашборд.
Настроить фильтры и экспорт.
Защита проектов (5 минут каждый студент объясняет логику).
07
Итого на курс 25 часа: теория – 7 ч (28%), практика – 18 ч (72%)
Чему вы научитесь
01
Устанавливать и настраивать Apache Superset
02
Подключать и очищать данные из различных источников
03
Создавать и оптимизировать визуализации и метрики
04
Настраивать визуализации и фильтры для анализа данных.
05
Разрабатывать и публиковать дашборды
06
Интегрировать Superset с другими инструментами