Частное облако / корпоративная виртуализация · 2026

All-flash Ceph RBD для кластера виртуализации

Выделенный SSD-кластер для VM-дисков, где требовались предсказуемые задержки, быстрые снапшоты и масштабирование без vendor lock-in.

Кейс опубликован в обезличенном формате: отрасль, архитектура, метрики и этапы проекта сохранены без раскрытия конфиденциальных данных заказчика.

Ключевые показатели проекта

Стартовая конфигурация
72 SSD в трёх узлах, отдельные сети frontend/backend
Рабочий профиль
4K random, 70/30 read/write, несколько клиентов fio/vdbench
Ориентир теста
120k+ mixed IOPS при контролируемом p99 latency в пилотном профиле
Эксплуатация
ежемесячная проверка заполнения, scrub/recovery и версий Ceph

Задача и ограничения

Старая гибридная СХД стала ограничивать запуск новых виртуальных машин: p99 latency росла во время пиков, а расширение брендового массива было экономически невыгодно.

Требования

250–300 виртуальных машин на первом этапе4K random mixed 70/30 без резких провалов latencyотказ одного узла без остановки VMинтеграция с гипервизором через блочные томаотдельный план обновлений Ceph

Архитектура решения

3× STOR-2U-24SSD как стартовый all-flash кластер

Горячий SSD-слой выделяется под latency-sensitive данные: VM-диски, metadata DB, vector indexes, cache и сервисы retrieval.

Ceph RBD, replica=3 для критичных пулов

Ceph-слой рассчитывается по failure domain, схеме replica/EC, сети репликации, размеру pools и поведению в деградированном режиме.

25/100GbE по проекту: frontend, backend, management

Сетевая часть разделяет frontend, backend/replication и management-трафик, чтобы тесты производительности не конфликтовали с recovery и мониторингом.

MON/MGR на отказоустойчивых ролях, отдельный мониторинг OSD и client latency

Компонент архитектуры закрепляется в спецификации вместе с зоной ответственности, критериями приёмки и проверками на стенде.

регламент теста отказа OSD/узла перед передачей в эксплуатацию

Компонент архитектуры закрепляется в спецификации вместе с зоной ответственности, критериями приёмки и проверками на стенде.

Результаты в эксплуатации

Стартовая конфигурация72 SSD в трёх узлах, отдельные сети frontend/backend
Рабочий профиль4K random, 70/30 read/write, несколько клиентов fio/vdbench
Ориентир теста120k+ mixed IOPS при контролируемом p99 latency в пилотном профиле
Эксплуатацияежемесячная проверка заполнения, scrub/recovery и версий Ceph

Стек и этапы проекта

ПО и интеграции

Ceph RBDfio/vdbench profilesmultipath/iSCSI или RBD по проектуPrometheus/Grafana

Сроки

  • 3 дня - сбор профиля VM и текущих latency
  • 1 неделя - проектирование Ceph pools и сетей
  • 2 недели - сборка и стендовые тесты
  • 1 неделя - пилот на группе VM и план миграции

Связанные страницы

/storage-vm.php /storage-ceph.php /platform-2u-24ssd.php /benchmarks.php

Оставить инженерную заявку

Ответьте на несколько вопросов — инженер подготовит проектную конфигурацию, список уточнений или коммерческое предложение.

Аудит / миграция / модернизация
Инженерный подбор СХД

Нужно быстро понять конфигурацию, стоимость и риски?

Опишите задачу — подготовим проектную архитектуру, список уточнений, варианты по бюджету и уровню отказоустойчивости.