Разработка ПО / DevOps / внутренние платформы · 2026

Persistent storage для Kubernetes-платформы разработки

Отказоустойчивые Persistent Volumes для Kubernetes, где требовались CSI, снапшоты, контроль latency и понятная модель восстановления.

Кейс опубликован в обезличенном формате: отрасль, архитектура, метрики и этапы проекта сохранены без раскрытия конфиденциальных данных заказчика.

Ключевые показатели проекта

PV
пилот до 250 PV, плановый рост до 1 500 PV
Профиль
малые БД, брокеры сообщений, CI-cache, shared test datasets
Latency target
контроль p95/p99 на уровне storage class, а не только средних значений
Операции
регламент расширения pools и обновления operator/SDS

Задача и ограничения

Команды разработки использовали локальные PV и ручные переносы данных между worker-узлами. Это мешало обновлениям кластера и увеличивало время восстановления stateful-сервисов.

Требования

до 1 500 PV на горизонте годадинамическое выделение томов через CSIснапшоты для тестовых окруженийразделение классов хранения по latency/стоимостидокументированный recovery для stateful workloads

Архитектура решения

6× STOR-2U-24SSD для performance tier

Горячий SSD-слой выделяется под latency-sensitive данные: VM-диски, metadata DB, vector indexes, cache и сервисы retrieval.

Rook/Ceph или альтернативный Kubernetes storage stack по проекту

Ceph-слой рассчитывается по failure domain, схеме replica/EC, сети репликации, размеру pools и поведению в деградированном режиме.

storage classes: fast-rbd, shared-fs, backup-object

Object-слой проектируется с bucket layout, retention, lifecycle-политиками, правами доступа и отдельной проверкой restore, чтобы хранение не превращалось в непрозрачный файловый архив.

выделенная сеть storage backend

Сетевая часть разделяет frontend, backend/replication и management-трафик, чтобы тесты производительности не конфликтовали с recovery и мониторингом.

Velero/backup-интеграция и тест restore

Компонент архитектуры закрепляется в спецификации вместе с зоной ответственности, критериями приёмки и проверками на стенде.

Результаты в эксплуатации

PVпилот до 250 PV, плановый рост до 1 500 PV
Профильмалые БД, брокеры сообщений, CI-cache, shared test datasets
Latency targetконтроль p95/p99 на уровне storage class, а не только средних значений
Операциирегламент расширения pools и обновления operator/SDS

Стек и этапы проекта

ПО и интеграции

Rook/CephKubernetes CSIVelero по проектуPrometheus/Grafana

Сроки

  • 1 неделя - аудит Kubernetes storage classes и workloads
  • 1 неделя - проектирование CSI/storage classes
  • 2 недели - стенд, fio/vdbench и отказоустойчивость
  • 1–2 недели - пилот на тестовых namespace

Связанные страницы

/storage-kubernetes.php /storage-ceph.php /platform-2u-24ssd.php /benchmarks.php

Оставить инженерную заявку

Ответьте на несколько вопросов — инженер подготовит проектную конфигурацию, список уточнений или коммерческое предложение.

Аудит / миграция / модернизация
Инженерный подбор СХД

Нужно быстро понять конфигурацию, стоимость и риски?

Опишите задачу — подготовим проектную архитектуру, список уточнений, варианты по бюджету и уровню отказоустойчивости.