AI lab / GPU storage

СХД для AI/ML-лабораторий и GPU-кластеров

Storage-архитектура для датасетов, checkpoints, feature store, model registry, inference artifacts и загрузки данных в GPU/worker nodes.

Типовые боли и риски

GPU простаивает из-за медленного storage

На этапе presale фиксируем этот риск в архитектуре, тестовом профиле и критериях приёмки.

датасеты размножаются без версионирования

На этапе presale фиксируем этот риск в архитектуре, тестовом профиле и критериях приёмки.

checkpoints занимают быстрый слой

На этапе presale фиксируем этот риск в архитектуре, тестовом профиле и критериях приёмки.

нет прозрачного lifecycle для artifacts

На этапе presale фиксируем этот риск в архитектуре, тестовом профиле и критериях приёмки.

Референсная схема

Референсная схема СХД для отраслевого сценария

Архитектурный контур

S3/NAS data lake для датасетов и artifacts

Компонент включается в проектную спецификацию с назначением, SLA-границами, мониторингом и recovery-процедурой.

SSD staging tier для активных экспериментов

Компонент включается в проектную спецификацию с назначением, SLA-границами, мониторингом и recovery-процедурой.

CSI/NFS/S3 доступ для worker nodes

Компонент включается в проектную спецификацию с назначением, SLA-границами, мониторингом и recovery-процедурой.

раздельный путь для чтения batch и записи checkpoints

Компонент включается в проектную спецификацию с назначением, SLA-границами, мониторингом и recovery-процедурой.

Ориентиры для расчёта

Профиль: sequential scan + random metadata
Горячий слой: SSD/All-Flash
Холодный слой: HDD/S3
Контроль: throughput к GPU и p95/p99

Подходящие платформы

STOR-2U-24SSD · 2U · 24 SSD · 96 ТБ raw
STOR-2U-24SSD · 2U · 24 SSD · 96 ТБ raw
SSD-платформа 2U

STOR-2U-24SSD

Высокие IOPS и низкие задержки для виртуализации, баз данных и горячих данных.

Диски
24 SSD
Raw
до 96 ТБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
25/40/100GbE по проекту
Лучше всего для:
  • Виртуализация
  • Базы данных
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

STOR-4U-48SSD · 4U · 48 SSD · 192 ТБ raw
STOR-4U-48SSD · 4U · 48 SSD · 192 ТБ raw
SSD-платформа 4U

STOR-4U-48SSD

Высокопроизводительное all-flash хранилище для интенсивных нагрузок.

Диски
48 SSD
Raw
до 192 ТБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
25/40/100GbE по проекту
Лучше всего для:
  • Виртуализация
  • БД
  • Kubernetes
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

STOR-4U-60HDD · 4U · 60 HDD · до 1,2 ПБ raw при HDD 20 ТБ raw
STOR-4U-60HDD · 4U · 60 HDD · до 1,2 ПБ raw при HDD 20 ТБ raw
HDD-платформа 4U высокой плотности

STOR-4U-60HDD

Максимальная плотность HDD для архивов, геоданных, S3 и больших backup repository.

Диски
60 HDD
Raw
до 1,2 ПБ raw при HDD 20 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
10/25/40/100GbE по проекту
Лучше всего для:
  • Архивы
  • Геоданные
  • S3 object storage
AI data lakeS3 corpusBackup repositoryCold/warm tier

Открыть страницу Даташит

CLUSTOR-44U-384SSD · 44U · 384 SSD · до 1,536 ПБ raw при SSD 4 ТБ raw
CLUSTOR-44U-384SSD · 44U · 384 SSD · до 1,536 ПБ raw при SSD 4 ТБ raw
Rack-кластер SSD

CLUSTOR-44U-384SSD

SSD-кластер для high-performance scale-out задач, виртуализации, Kubernetes и горячих данных.

Диски
384 SSD
Raw
до 1,536 ПБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
40/100GbE spine/leaf по проекту
Лучше всего для:
  • Виртуализация
  • Kubernetes
  • Ceph RBD/CephFS
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

Частые вопросы

Нужен ли all-flash для всех ML-данных?

Обычно нет. Практичнее отделить быстрый staging/cache tier от долгого S3/NAS-хранения датасетов и artifacts.

Как считать ёмкость для checkpoints?

Учитываем число моделей, частоту сохранения, retention, размер checkpoint и срок хранения воспроизводимых экспериментов.

Получить предварительный подбор

Достаточно компании, email, типа задачи и примерного объёма. Детали уточнит инженер.

Добавить детали
Инженерный подбор СХД

Нужно быстро понять конфигурацию, стоимость и риски?

Опишите задачу — подготовим проектную архитектуру, список уточнений, варианты по бюджету и уровню отказоустойчивости.