RAG / LLM retrieval

СХД для RAG и корпоративных LLM-систем

Storage-архитектура для RAG: corpus S3/NAS, пайплайн индексации, горячий слой векторных индексов, снапшоты и восстановление знаний.

Что закрывает решение

корпоративный corpus

Корпус хранится в S3/NAS-слое с версионированием, lifecycle-политиками и отдельным backup-контуром. При расчёте учитываем объём исходных документов, количество чанков и частоту переиндексации.

embedding pipeline

Embedding pipeline получает отдельные зоны для исходных файлов, промежуточных чанков и готовых векторов, чтобы re-indexing не ломал рабочий retrieval-контур.

vector index snapshots

Для векторного слоя проектируем hot tier под read-heavy random I/O, снапшоты индексов перед переиндексацией и быстрый rollback при ошибке embedding-модели.

S3 для документов и артефактов

Корпус хранится в S3/NAS-слое с версионированием, lifecycle-политиками и отдельным backup-контуром. При расчёте учитываем объём исходных документов, количество чанков и частоту переиндексации.

low-latency retrieval tier

Для latency-sensitive нагрузки смотрим p95/p99, а не только средние значения: размер блока, queue depth, read/write mix и поведение при деградации.

Архитектурные варианты

СлойВариантыКомментарий
ПротоколыS3, NFS/SMB, CSI, RBD/iSCSI для горячего слояФинальный набор зависит от клиента, нагрузки и требований к отказоустойчивости.
SDS / ПОCeph RGW + RBD, OpenZFS, JuiceFS, Kubernetes CSI storageСтек выбирается с учётом компетенций эксплуатации, SLA и стоимости владения.
Защита данныхreplica, mirror, EC, RAIDZ или hybrid tieringРассчитываем полезную ёмкость, rebuild/recovery и поведение в деградированном режиме.

Подходящие платформы

STOR-2U-24SSD · 2U · 24 SSD · 96 ТБ raw
STOR-2U-24SSD · 2U · 24 SSD · 96 ТБ raw
SSD-платформа 2U

STOR-2U-24SSD

Высокие IOPS и низкие задержки для виртуализации, баз данных и горячих данных.

Диски
24 SSD
Raw
до 96 ТБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
25/40/100GbE по проекту
Лучше всего для:
  • Виртуализация
  • Базы данных
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

STOR-4U-48SSD · 4U · 48 SSD · 192 ТБ raw
STOR-4U-48SSD · 4U · 48 SSD · 192 ТБ raw
SSD-платформа 4U

STOR-4U-48SSD

Высокопроизводительное all-flash хранилище для интенсивных нагрузок.

Диски
48 SSD
Raw
до 192 ТБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
25/40/100GbE по проекту
Лучше всего для:
  • Виртуализация
  • БД
  • Kubernetes
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

STOR-4U-60HDD · 4U · 60 HDD · до 1,2 ПБ raw при HDD 20 ТБ raw
STOR-4U-60HDD · 4U · 60 HDD · до 1,2 ПБ raw при HDD 20 ТБ raw
HDD-платформа 4U высокой плотности

STOR-4U-60HDD

Максимальная плотность HDD для архивов, геоданных, S3 и больших backup repository.

Диски
60 HDD
Raw
до 1,2 ПБ raw при HDD 20 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
10/25/40/100GbE по проекту
Лучше всего для:
  • Архивы
  • Геоданные
  • S3 object storage
AI data lakeS3 corpusBackup repositoryCold/warm tier

Открыть страницу Даташит

CLUSTOR-44U-384SSD · 44U · 384 SSD · до 1,536 ПБ raw при SSD 4 ТБ raw
CLUSTOR-44U-384SSD · 44U · 384 SSD · до 1,536 ПБ raw при SSD 4 ТБ raw
Rack-кластер SSD

CLUSTOR-44U-384SSD

SSD-кластер для high-performance scale-out задач, виртуализации, Kubernetes и горячих данных.

Диски
384 SSD
Raw
до 1,536 ПБ raw при SSD 4 ТБ
Useful
по replica/EC/RAIDZ и резерву заполнения
Сеть
40/100GbE spine/leaf по проекту
Лучше всего для:
  • Виртуализация
  • Kubernetes
  • Ceph RBD/CephFS
RAG hot tierVector DBLow latencyKubernetes PV

Открыть страницу Даташит

Что нужно для точного расчёта

размер корпуса документов

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

частота re-indexing

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

vector DB

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

требования к latency retrieval

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

retention версий индекса

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

интеграция с Kubernetes

Эти данные помогают выбрать диски, сеть, схему защиты и уровень поддержки без завышения бюджета.

Оставить инженерную заявку

Ответьте на несколько вопросов — инженер подготовит проектную конфигурацию, список уточнений или коммерческое предложение.

Параметры задачи
Протоколы / интеграции
Инженерный подбор СХД

Нужно быстро понять конфигурацию, стоимость и риски?

Опишите задачу — подготовим проектную архитектуру, список уточнений, варианты по бюджету и уровню отказоустойчивости.