Курс повышения квалификации
Основы управления данными
32 часа

Менеджеры и руководители проектов: Лица, ответственные за принятие решений в области управления данными, которые хотят получить общее представление о стратегиях и технологиях, используемых для управления данными в организации.

Предварительные требования:

Базовые знания в области информационных технологий

Понимание основ работы организации

Цели курса:

1. Сформировать картину и понимание принципов хранения данных

2. Изучить современные технологии и подходы к управлению данными

Ключевые темы:

Введение в хранение данных

Архитектура систем хранения данных

Моделирование данных

Системы управления базами данных

ETL-процессы

Облачные решения для хранения данных

Масштабирование и оптимизация

Управление жизненным циклом данных

Методы обучения:

Лекции

Практические задания

Разбор кейсов

Групповые дискуссии

Результаты обучения:

Понимание ключевых концепций хранения данных

Умение выбирать оптимальные решения для хранения данных

Навыки проектирования систем хранения данных

Знание лучших практик управления данными

Содержание курса

“Основы управления данными”

1. Введение в хранение данных (1 часа)

Понятия: информация, метаинформация, данные

Роль данных в современном мире

Основные понятия и терминология

2. Управление данными предприятия (1 часа)

Стратегии управления данными

Политики и процедуры работы с данными

Роли и ответственности в управлении данными

3. Архитектура систем хранения данных (СХД) (4 часа)

Компоненты СХД

Диски, Шины, Файловые системы

Типы современных СХД

Локальные и глобальные сети

Датацентры

Принципы выбора, цена владения

4. Классификация данных (1 часа)

Холодные, горячие и лава данные

Структурированные и неструктурированные данные

Критичность и чувствительность данных

5. Современные концепции хранения и обработки данных (1 час)

Data Lake и Data Warehouse

Business Intelligence (BI) и Dashboards

6. Моделирование данных (2 часа)

ER-диаграммы (сущность-связь)

Нормализация данных

Денормализация и оптимизация

7. ETL-процессы (1 час)

Извлечение, преобразование и загрузка данных

Инструменты и библиотеки ETL

8. Теоретические основы баз данных (1 час)

CAP-теорема

ACID-свойства

9. Системы управления базами данных (СУБД) (2 часа)

Виды СУБД

Реляционные и нереляционные (NoSQL) СУБД

10. Специализированные типы баз данных (1 час)

Колоночные БД

Key-Value хранилища

Системы очередей сообщений

11. Масштабирование баз данных (1 час)

Кластеризация СУБД

Репликация и шардинг

12. Облачные базы данных (1 час)

Преимущества и недостатки

Основные провайдеры и их решения

Миграция в облако

13. Потребители данных (1 час)

Типы пользователей данных

Права доступа и безопасность

Аналитика и отчетность

14. Визуализация данных (1 час)

Принципы эффективной визуализации

Инструменты для создания дашбордов

Интерактивные отчеты

15. Жизненный цикл данных в организации (4 часа)

15.1 Сбор и ввод данных (1 час)

15.2 Источники данных:

Внутренние и внешние источники

Структурированные и неструктурированные данные

15.3 Методы сбора данных:

Автоматизированные и ручные методы

Использование API и веб-скрейпинг

15.4 Инструменты для ввода данных:

Формы ввода данных

Системы управления запросами

Генерация псевдо данных

15.5 Обработка и хранение (1 час)

Процессы обработки данных:

Очистка и валидация данных

Трансформация и агрегация

15.6 Технологии хранения данных:

Реляционные и нереляционные базы данных

Облачные хранилища и локальные серверы

Оптимизация хранения:

Индексация и компрессия данных

Управление доступом и безопасностью

15.7 Архивирование и удаление (0.5 часа)

Стратегии архивирования:

Долгосрочное и краткосрочное хранение

Использование облачных решений для архивирования

Политики удаления данных:

Правила и процедуры удаления

Соответствие нормативным требованиям (РФ, GDPR, HIPAA)

15.8 Управление качеством данных (0.5 часа)

Метрики качества данных:

Полнота, точность, актуальность

Последовательность и уникальность

Инструменты и методы улучшения качества:

Профилирование данных

Использование мастер-данных (MDM)

15.9 Управление критическими ситуациями (1 час)

Планирование и предотвращение:

Разработка планов на случай аварий

Резервное копирование и восстановление данных

Реагирование на инциденты:

Процедуры реагирования на утечки данных

Управление рисками и минимизация ущерба

Обучение и подготовка персонала:

Тренировки и симуляции

Создание культуры безопасности данных

16. Новые вызовы в хранении данных (1 час)

Big Data и IoT

Машинное обучение и AI

Блокчейн и распределенные реестры