ML / ИИ storage

СХД для ML / ИИ задач

Хранилище для подготовки датасетов, обучения, inference, feature store, model registry, checkpoints и артефактов ML-пайплайнов.

Что закрывает решение

dataset staging

Датасеты разделяются на активный staging tier и долгосрочный S3/NAS-контур. Это ускоряет обучение и сохраняет воспроизводимость версий данных.

checkpoint/artifact storage

Checkpoints, model artifacts и результаты экспериментов хранятся с retention-политиками, чтобы можно было восстановить обучение, сравнить версии и не потерять дорогие GPU-итерации.

feature store

Feature store требует предсказуемой latency, контроля версий признаков и backup metadata, поэтому быстрый слой отделяется от архива сырых данных.

GPU pipeline feed

Для GPU/worker nodes рассчитываем параллельное чтение, размер файлов, prefetch/cache-слой и отдельный путь для записи checkpoints без просадки обучения.

экспериментальная воспроизводимость

Параметр влияет на выбор дисков, сети, схемы защиты данных, мониторинга и SLA. На пресейле проверяем его через профиль нагрузки, рост данных и требования к восстановлению.

Архитектурные варианты

СлойВариантыКомментарий
ПротоколыS3, NFS, CSI, RBD/iSCSI по проектуФинальный набор зависит от клиента, нагрузки и требований к отказоустойчивости.
SDS / ПОCeph RGW/RBD/CephFS, OpenZFS, JuiceFS поверх object storage, Lustre по HPC-проектамСтек выбирается с учётом компетенций эксплуатации, SLA и стоимости владения.
Защита данныхreplica, mirror, EC, RAIDZ или hybrid tieringРассчитываем полезную ёмкость, rebuild/recovery и поведение в деградированном режиме.

Подходящие платформы

STOR-2U-24SSD · 2U · 24 SSD · 96 ТБ raw
STOR-2U-24SSD · 2U · 24 SSD · 96 ТБ raw
SSD-платформа 2U

STOR-2U-24SSD

Высокие IOPS и низкие задержки для виртуализации, баз данных и горячих данных.

Диски
24 SSD
Raw
до 96 ТБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
25/40/100GbE по проекту
Лучше всего для:
  • Виртуализация
  • Базы данных
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

STOR-4U-48SSD · 4U · 48 SSD · 192 ТБ raw
STOR-4U-48SSD · 4U · 48 SSD · 192 ТБ raw
SSD-платформа 4U

STOR-4U-48SSD

Высокопроизводительное all-flash хранилище для интенсивных нагрузок.

Диски
48 SSD
Raw
до 192 ТБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
25/40/100GbE по проекту
Лучше всего для:
  • Виртуализация
  • БД
  • Kubernetes
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

STOR-4U-60HDD · 4U · 60 HDD · до 1,2 ПБ raw при HDD 20 ТБ raw
STOR-4U-60HDD · 4U · 60 HDD · до 1,2 ПБ raw при HDD 20 ТБ raw
HDD-платформа 4U высокой плотности

STOR-4U-60HDD

Максимальная плотность HDD для архивов, геоданных, S3 и больших backup repository.

Диски
60 HDD
Raw
до 1,2 ПБ raw при HDD 20 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
10/25/40/100GbE по проекту
Лучше всего для:
  • Архивы
  • Геоданные
  • S3 object storage
AI data lakeS3 corpusBackup repositoryCold/warm tier

Открыть страницу Даташит

CLUSTOR-44U-384SSD · 44U · 384 SSD · до 1,536 ПБ raw при SSD 4 ТБ raw
CLUSTOR-44U-384SSD · 44U · 384 SSD · до 1,536 ПБ raw при SSD 4 ТБ raw
Rack-кластер SSD

CLUSTOR-44U-384SSD

SSD-кластер для high-performance scale-out задач, виртуализации, Kubernetes и горячих данных.

Диски
384 SSD
Raw
до 1,536 ПБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
40/100GbE spine/leaf по проекту
Лучше всего для:
  • Виртуализация
  • Kubernetes
  • Ceph RBD/CephFS
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

Что нужно для точного расчёта

тип ML pipeline

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

размер датасетов

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

число GPU/worker nodes

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

формат данных

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

checkpoint retention

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

целевой throughput на обучение

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

Оставить инженерную заявку

Ответьте на несколько вопросов — инженер подготовит проектную конфигурацию, список уточнений или коммерческое предложение.

Параметры задачи
Протоколы / интеграции
Инженерный подбор СХД

Нужно быстро понять конфигурацию, стоимость и риски?

Опишите задачу — подготовим проектную архитектуру, список уточнений, варианты по бюджету и уровню отказоустойчивости.