Principais conclusões
- Flash-first NVMe RAID:O PERC13 H975i se move completamente do SAS/SATA, construído sobre o Broadcom SAS51xx para uma arquitetura nativa NVMe e pronta para IA.
- Um grande salto geracional:PCIe Gen5 x16 com até 16 unidades NVMe por controlador (32 com duas) entregou 52,5 GB/s e 12,5M IOPS por controlador em testes, com ganhos em relação ao PERC12, incluindo +88% de largura de banda de leitura,+318% largura de banda de gravação, +31% 4K ler IOPS, e +466% 4K escrever IOPS.
- - Servidor de inteligência artificial:O projeto integrado frontal libera slots PCIe traseiros para GPUs, encurta as corridas MCIO e permite um tubo de armazenamento dedicado por acelerador para uma taxa de transferência mais estável e determinista sem sobrecarga da CPU.
- Resiliência sob estresse:O cache protegido por supercapacitor e as reconstruções mais rápidas reduzem o tempo até 10 min/TiB, mantendo um alto desempenho durante as reconstruções (até 53,7 GB/s de leitura, 68 GB/s de gravação, 17,3M/5,33M 4K IOPS).
- Segurança de ponta a ponta:Hardware Root of Trust, identidade do dispositivo SPDM e criptografia de espectro completo que cobre unidades, dados de voo e cache do controlador.
Dell PERC12 H965i e PERC13 H975i Especificações
| Características | PERC12 H965i Frente | PERC13 H975i Frente |
|---|---|---|
| Níveis de RAID | 0, 1, 5, 6, 10, 50, 60 | 0, 1, 5, 6, 10, 50, 60 |
| Não-RAID (JBOD) | - Sim, sim. | - Sim, sim. |
| Tipo de autocarro | PCIe Gen4 x16 | PCIe Gen5 x16 |
| Gerenciamento da banda lateral | I2C, PCIe VDM | I2C, PCIe VDM |
| Recinto por porto | Não aplicável | Não aplicável |
| Processador / chipset | Broadcom RAID-on-Chip, SAS4116W | Broadcom RAID-on-Chip, SAS5132W |
| Pacote de energia / reserva de energia | Bateria | Supercapacitor |
| Segurança da Gestão Local de Chaves | - Sim, sim. | - Sim, sim. |
| Gerenciador de Chave de Empresa Seguro | - Sim, sim. | - Sim, sim. |
| Profundidade da fila do controlador | 8,192 | 8,192 |
| Cache não volátil | - Sim, sim. | - Sim, sim. |
| Memória de cache | 8 GB DDR4 3200 MT/s | Cache RAID integrado |
| Funções de cache | Escrever de volta, ler de frente, escrever de volta, sempre escrever de volta, não ler de frente | Escrever para trás, escrever para frente, sempre escrever para trás, sem leitura antecipada |
| Discos Virtuais Max Complexo | 64 | 16 |
| Discos Virtuais Simples | 240 | 64 |
| Grupos de disco máximo | 64 | 32 |
| VDs máximas por grupo de disco | 16 | 8 |
| Dispositivos de substituição a quente | 64 | 8 |
| Dispositivos de troca a quente suportados | - Sim, sim. | - Sim, sim. |
| Configuração automática (primária e executada uma vez) | - Sim, sim. | - Sim, sim. |
| Motor XOR de hardware | - Sim, sim. | - Sim, sim. |
| Expansão da capacidade em linha | - Sim, sim. | - Sim, sim. |
| Dedicado & Global Hot Spare | - Sim, sim. | - Sim, sim. |
| Tipos de unidade suportados | NVMe Gen3 e Gen4 | NVMe Gen3, Gen4 e Gen5 |
| Tamanho do elemento da faixa VD | 64KB | 64KB |
| Suporte NVMe PCIe | Gen4 | Gen5 |
| Configuração Max NVMe Drives | 8 unidades por controlador | 16 unidades por controlador |
| Tamanhos dos setores apoiados | 512B, 512e, 4Kn | 512B, 512e, 4Kn |
| Suporte de arranque de armazenamento | Apenas UEFI | Apenas UEFI |
O controlador frontal PERC13 H975i nos servidores Dell PowerEdge é projetado para integração perfeita na arquitetura do sistema.o H975i se conecta diretamente ao backplane da unidade frontal e interage com os conectores MCIO frontais na placa-mãe através de PCIe 5 dedicadoEsta concepção integrada preserva slots PCIe traseiros para GPUs de alto desempenho e expansão PCIe adicional, reduzindo significativamente o comprimento dos cabos.Isto ajuda a manter a integridade do sinalO resultado é um layout interno mais limpo e um fluxo de ar melhorado para implantações densas e com computação intensiva.
O H975i implementa uma arquitetura de segurança abrangente que se estende desde a certificação de hardware de nível de silício até a criptografia de dados de espectro completo de dados no local com drives SED.,Hardware Root of Trust estabelece uma cadeia imutável de verificação criptográfica a partir da ROM de arranque interna através de cada componente de firmware,garantir que apenas o firmware certificado Dell autenticado possa ser executado no controladorEsta segurança baseada em hardware estende-se através da implementação do Protocolo de Segurança e Modelo de Dados (SPDM),Quando cada controlador contém um certificado de identificação de dispositivo único que permite ao iDRAC realizar a verificação de autenticação em tempo realO controlador estende a proteção criptográfica para além dos cenários tradicionais de dados em repouso para incluir memória cache.Ele mantém chaves de criptografia em regiões de memória seguras que são inacessíveis a firmware não autorizadoComo resultado, os dados confidenciais permanecem protegidos, quer se encontrem em unidades de disco ou sejam activamente processados em cache.
A proteção de potência no H975i é outra evolução significativa dos sistemas tradicionais com bateria através da integração de um supercondensador.O supercondensador fornece energia instantânea durante eventos inesperados de perda de energiaAlém disso, ao contrário dos sistemas baseados em bateria que exigem 4-8 horas para os ciclos de aprendizagem, o sistema de armazenamento de dados é um sistema de armazenamento de dados que permite que os dados sejam protegidos indefinidamente, garantindo uma limpeza de cache criptografada e completa para o armazenamento não volátil.O supercondensador H975i ̇s completa o seu ciclo de aprendizagem transparente em 5-10 minutos sem qualquer deterioração do desempenho durante a calibração.Esta concepção elimina as despesas de manutenção e as preocupações inerentes à degradação das soluções de baterias, proporcionando ao mesmo tempo uma fiabilidade superior para a proteção de dados de missão crítica.
Monitorização e gestão integradas
O controlador PERC13 RAID da Dell, como muitas das soluções RAID da Dell, pode ser gerenciado e monitorado de muitas maneiras, incluindo durante a inicialização da plataforma através da configuração do sistema no BIOS, através da interface gráfica web iDRAC,a utilidade PERC12, e até mesmo Dell OpenManage UI e CLI.
Gestão do controlador iDRAC
Ao visualizar a interface de gestão iDRAC, a guia controladores oferece uma visão geral do hardware de armazenamento do servidor.com informações sobre versões de firmwareEste resumo permite que você verifique rapidamente a prontidão e configuração dos controladores sem precisar acessar o BIOS ou usar ferramentas CLI.
A aba Discos Virtuais no iDRAC mostra as matrizes de armazenamento que foram criadas, incluindo seu nível RAID, tamanho e política de cache.Do ponto de vista, os administradores podem confirmar que os volumes estão online, criar novos discos virtuais ou usar o menu Ações para ajustar ou excluir configurações existentes.
Utilidade de configuração do controlador RAID
A imagem acima mostra um exemplo de como inserir a configuração frontal do PERC H975i Utility System Setup na plataforma PowerEdge R7715.Você pode gerenciar todas as configurações do controlador RAID chave, incluindo Gestão de Configuração, Gestão de Controladores, Gestão de Dispositivos e muito mais.Este utilitário fornece uma maneira simplificada de configurar discos virtuais e monitorar componentes de hardware diretamente durante o processo de inicialização da plataforma.
Depois de selecionar o nível RAID, passamos a escolher discos físicos para a matriz. Neste exemplo, todos os SSDs NVMe disponíveis estão listados e marcados como compatíveis com RAID. Selecionamos múltiplos 3.2 TiB Dell DC NVMe drives do pool de capacidade não configurado. Filtros como tipo de mídia, interface e tamanho do setor lógico ajudam a restringir a seleção.Podemos continuar clicando em OK para finalizar a seleção do disco e continuar a criar o disco virtual.
Antes de finalizar a criação do disco virtual, o sistema exibe um aviso que confirma que todos os dados nos discos físicos selecionados serão excluídos permanentemente.Marcamos a caixa de confirmação e selecionamos Sim para autorizar a operaçãoEsta salvaguarda ajuda a evitar a perda acidental de dados durante o processo de criação do RAID.
Uma vez que o disco virtual é criado, ele aparece no menu "Virtual Disk Management". Neste exemplo, nosso novo disco virtual RAID 5 é listado com uma capacidade de 43.656 TiB e um status de "Ready".Com apenas alguns passos simples, o armazenamento está configurado e pronto para utilização.
Enquanto o PERC BIOS Configuration Utility e a interface iDRAC oferecem opções intuitivas para gerenciamento local e remoto, a Dell também fornece uma poderosa ferramenta de linha de comando chamada PERC CLI (perccli2).Este utilitário suporta o Windows, Linux e VMware, tornando-o ideal para scripting, automação ou gerenciamento de controladores PERC em ambientes sem cabeça.A Dell também fornece documentação detalhada sobre instalação e uso de comandos para o PERC CLI em seu site de suporte.
Dell PERC13 Teste de desempenho
Antes de mergulhar nos testes de desempenho, preparamos nosso ambiente usando a plataforma Dell PowerEdge R7715 configurada com dois controladores frontais PERC H975i.Dispositivos Dell NVMe de 2 TB, cada um classificado para leituras sequenciais de até 12.000 MB/s e 5.500 MB/s de gravações sequenciais usando tamanhos de blocos de 128 KiB.Esta base de alto desempenho permite-nos empurrar os limites do controle PERC13's throughput e avaliar o comportamento RAID em escala.
- Plataforma:Dell PowerEdge R7715
- CPU:Processador AMD EPYC 9655P de 96 núcleos
- Ram:768 GB (12 x 64 GB) DDR5-5200 ECC
- Controlador de ataque:2 x PERC13 H975i
- Armazenamento:32 x 3,2 TB Dell CD8P NVMe Drives
- Aceleradores PCIe:2 x GPU NVIDIA H100
NVIDIA Magnum IO GPU Direct Storage: AI Meets Storage
Os pipelines modernos de IA são geralmente I/O-bound, não computation-bound. Batches de dados, embutidos e pontos de verificação devem ser transferidos do armazenamento para a memória da GPU rapidamente o suficiente para manter os aceleradores ocupados.O Magnum IO GDS da NVIDIA (através do cuFile) corta o caminho tradicional de ¢SSD → CPU DRAM → GPU ¢ e permite que os dados DMA sejam enviados diretamente da memória NVMe para a memória GPUIsso elimina a sobrecarga do CPU, reduz a latência e torna o rendimento mais previsível sob carga, o que se traduz em maior utilização da GPU, tempos de época mais curtos,e ciclos mais rápidos de salvamento/carga dos pontos de controlo.
Nosso teste GDSIO é voltado para medir o próprio caminho de dados de armazenamento para GPU, varrendo tamanhos de blocos e contagens de threads para mostrar a rapidez com que o conjunto NVMe com suporte PERC13 pode fluir para a memória H100.Com cada H975i num PCIe 5.0 x16 ligação (teórica ~ 64 GB/s por controlador, unidirecional), dois controladores definem um teto agregado perto de ~ 112 GB/s; onde o nosso planalto de curvas diz-lhe se você está ligado ou limitado por mídia.Para profissionais, ler os gráficos como proxies para cargas de trabalho reais: grandes leituras sequenciais mapa para o conjunto de dados streaming e pontos de verificação restaura; grandes sequenciais escreve mapa para pontos de verificação salva;transferências menores com simultaneidade refletem as mudanças do carregador de dados e prefetchEm resumo, uma forte escalabilidade do GDSIO significa menos barracas de GPU e um desempenho mais consistente durante o treinamento e a inferência de alto rendimento.
GDSIO Leitura de transferência sequencial
Começando com leitura sequencial, a taxa de transferência começou modestamente em tamanhos de blocos mais baixos e contagens de threads, começando em torno de 0,3 GiB / s em blocos de 8K com um único thread.O desempenho aumentou drasticamente entre os blocos de 16K e 512KOs ganhos mais substanciais ocorreram nos tamanhos de blocos de 1M, 5M e 10M, onde o throughput saltou drasticamente,com um pico de 103 GiB/s a 10M de tamanho de bloco com 256 fiosEsta progressão mostra que a matriz PERC13 beneficia de tamanhos de blocos maiores e paralelismo multithreaded, com saturação ideal em torno de 64-128 threads, além do qual ganha planalto.
GDSIO Leia Diferencial de Transmissão Sequencial
Em testes de leitura sequenciais em blocos de tamanhos de 8K a 10M, o PERC13 (H975i) superou consistentemente o PERC12 (H965i),com ganhos percentuais que aumentam drasticamente em blocos de tamanho maior e contagens de fios mais elevadas.
Em tamanhos de blocos menores (8K-16K), as melhorias foram modestas (normalmente entre 0-20%), e em alguns casos isolados, o H975i ficou ligeiramente atrás devido à variabilidade do teste em baixas profundidades de fila.Por tamanhos de blocos 32K-64K, a vantagem tornou-se mais consistente, com o H975i oferecendo uma taxa de transferência 30-50% maior na maioria das contagens de fios.
As diferenças mais significativas foram observadas em blocos maiores (128K a 10M), onde o controlador PERC13 liberou todo o potencial de leitura sequencial do sistema.O H975i demonstrou ganhos de 50-120% em comparação com o H965i.Por exemplo, no tamanho de bloco de 1M com 8-16 fios, a taxa de transferência foi superior a 55 GiB/s, o que equivale a aproximadamente 90% de aumento.com algumas configurações mostrando quase o dobro do desempenho em comparação com a geração anterior.
No geral, o PERC13 (H975i) estabeleceu uma liderança dominante nas cargas de trabalho de leitura sequencial, especialmente quando o tamanho do bloco e a contagem de threads foram dimensionados.a 256 K e acima, o controlador mais novo ofereceu consistentemente um desempenho 50-100% + superior, destacando claramente os avanços arquitetônicos na mais recente plataforma RAID da Dell.
GDSIO Leia Latência Sequencial
À medida que o rendimento de leitura sequencial aumentou, a latência permaneceu gerenciável em blocos de tamanhos menores e contagens de threads mais baixas.demonstrando um manuseio eficiente das leituras nesse intervaloUma vez que os tamanhos de blocos e a contagem de threads aumentaram, especialmente em 5M e 10M com 64 ou mais threads, a latência aumentou rapidamente, atingindo um pico de 211,8 ms em um tamanho de bloco de 10M com 256 threads.Isto destaca como os gargalos do controlador ou da fila surgem sob cargas de trabalho extremas, apesar de a capacidade de produção continuar elevada.
O melhor equilíbrio de desempenho e eficiência foi observado no tamanho do bloco de 1M com 8-16 threads, onde a matriz manteve uma taxa de transferência de 87,5-93,7 GiB/s, mantendo a latência entre 179-334 μs.Esta zona representa o ponto ideal para maximizar a largura de banda mantendo os atrasos bem abaixo de um milissegundo.
GDSIO Escrever Transmissão Sequencial
O desempenho de gravação mostrou uma forte escalagem inicial à medida que os tamanhos dos blocos aumentaram, com a taxa de transferência subindo de 1,2 GiB / s em 8K e 1 thread para 13,9 GiB / s em 256K.O crescimento mais substancial apareceu entre os tamanhos de blocos 128K e 1MO desempenho pico veio nos tamanhos de blocos de 5M e 10M, sustentando 100 a 101 GiB/s a partir de 8 threads.
O desempenho foi achatado entre 8 e 64 fios para esses blocos maiores, indicando que os controladores atingiram a saturação no início da curva de dimensionamento.,A estabilidade de transferência variou, mantendo-se estável em blocos grandes de 5M e 10M a 101 GiB/s, mas diminuindo para tamanhos de blocos de faixa média, como 256K, caindo de 61,2 GiB/s em 32 threads para 45.3 GiB/s a 256 fios.
GDSIO Escrever Sequencial de transferência diferencial
Em testes de gravação sequencial, o PERC13 (H975i) produziu ganhos substanciais em relação ao PERC12 (H965i), particularmente como tamanhos de blocos e contagens de fios escalados.As melhorias foram modestas., geralmente entre 0 e 10%, com ruído de ensaio ocasionalmente apresentando diferenças insignificantes.
A partir de 64K, a vantagem do H975i tornou-se mais pronunciada. No tamanho do bloco de 64K, as melhorias atingiram 40-70%, com uma taxa de transferência aumentando em mais de 12-17 GiB/s em comparação com o H965i. Em 128K-256K,A elevação se tornou mais forte, onde o H975i consistentemente entregou uma taxa de transferência 50-70% maior em contagens de fios moderadas a altas.
A diferença de desempenho mais dramática apareceu em blocos maiores (512K a 10M). Em 512K, o H975i alcançou ganhos de +31 a +56 GiB/s, o que equivale a uma melhoria de 60-80% em relação ao H965i.No tamanho de bloco 1MPor último, nos blocos de 5M e 10M, o PERC 13 quase duplicou o rendimento em comparação com o PERC 12,com delta de +75 a +79 GiB/s, traduzindo-se numa melhoria de 100% em alguns cenários ricos em fios.
No geral, o controlador PERC 13 mostrou um claro salto geracional no desempenho de gravação sequencial.O H975i proporciona consistentemente um rendimento 50% a 100% superior, estabelecendo firmemente a sua superioridade sobre o H965i em cargas de trabalho sequenciais de gravação intensiva.
GDSIO escrever latência sequencial
A latência durante as gravações sequenciais permaneceu impressionantemente baixa em tamanhos de blocos menores e contagens de threads mais baixas, geralmente permanecendo abaixo de 50 μs através de blocos de 128K com até 8 threads.À medida que o número de fios aumentavaPor exemplo, a latência atingiu 392 μs a 512K com 32 threads e excedeu 1 ms a 1M de tamanho de bloco com 64 threads.
Os efeitos de saturação tornaram-se mais evidentes nos maiores tamanhos de blocos e nos níveis de concurrença mais altos.
O ponto de operação mais eficiente para cargas de trabalho de gravação sequencial ocorreu nos tamanhos de blocos 1M ou 5M com 8 a 16 tópicos, onde a taxa de transferência atingiu 87,9 a 101.2 GiB/s enquanto a latência permaneceu dentro de 178 μs 10,7 ms, proporcionando um desempenho forte e sustentado sem provocar atrasos excessivos na fila de gravação.
MLPerf Storage 2.0 Desempenho
Para avaliar o desempenho do mundo real em ambientes de treinamento de IA, utilizamos o conjunto de testes MLPerf Storage 2.0.cargas de trabalho de aprendizagem profunda simuladasO estudo fornece informações sobre como os sistemas de armazenamento lidam com desafios como o controlo de pontos e o treinamento de modelos.
Critério de referência de controlo
Quando os modelos de aprendizagem de máquina são treinados, os pontos de verificação são essenciais para salvar periodicamente o estado do modelo.Permite a interrupção precoce durante a formação, e permite que os pesquisadores se ramifiquem de vários pontos de controle para experimentos e ablações.
A comparação da duração de armazenamento do ponto de verificação revelou que o Dell PERC13 superou consistentemente o PERC12 em todas as configurações do modelo.enquanto o PERC12 exigia 10A diferença de desempenho foi mais pronunciada com o modelo de parâmetro 1T,onde o PERC13 completa salvas em pouco mais de 10 segundos em comparação com o PERC12 ′s 20+ segundosIsto representa uma redução de cerca de 50% no tempo de poupança para os modelos mais grandes.
Examinando os resultados do throughput Save, os dados mostram a utilização superior da largura de banda do PERC13, oferecendo consistentemente taxas de transferência de dados mais altas.81 GB/sEm contraste, o PERC12 atinge 9,49 GB/s e cai para 6,98 GB/s para a maior configuração.O controlador mais novo mantém um desempenho mais estável em diferentes tamanhos de modelos, sugerindo uma melhor otimização para o tratamento de grandes escritos sequenciais típicos de operações de ponto de controlo.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang, Diretora Global de Estratégia
WhatsApp / WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Site: www.qianxingdata.com/www.storagesserver.com
Foco em Negócios:
Distribuição de produtos TIC/Integração de sistemas e serviços/Soluções de infraestrutura
Com mais de 20 anos de experiência em distribuição de TI, fazemos parcerias com as principais marca
Pessoa de Contato: Ms. Sandy Yang
Telefone: 13426366826



