DapuStor J5060 Especificações
| Cloreto de sódio | |
|---|---|
| Capacidade (TB) | 61.44 |
| Fator de forma | U.2 15 mm |
| Interface | PCIe 4.0 x4, NVMe 1.4a, Dual-port suportado |
| Largura de banda de leitura/escrita (128K) MB/s | 7400 / 3000 |
| Leia/Escreva aleatória (4KB) K IOPS | 1500 / 30 (16KB) |
| 4K Random Latency (Typ.) R/W μs | 105 (4KB) / 33 (16KB) |
| Latência sequencial 4K (tipo) R/W μs | 7 (4KB) / 12 (16KB) |
| Potência típica (W) | 23 |
| Potência em marcha lenta (W) | 5 |
| Tipo de flash | 3D Enterprise QLC NAND Flash |
| Perseverança | 0.5 DWPD |
| MTBF | 2 milhões de horas |
| UBER | 1 setor por 10^17 bits lidos |
| Garantia | 5 anos |
DapuStor J5060 Desempenho
Controlo de pontos
Para avaliar o desempenho do mundo real dos SSDs Dapustor J5060 em ambientes de treinamento de IA, utilizamos a ferramenta de referência Data and Learning Input/Output (DLIO).,O DLIO foi projetado especificamente para testar padrões de E/S em cargas de trabalho de aprendizado profundo.e formação de modelosO gráfico abaixo ilustra como ambas as unidades lidam com o processo em 99 pontos de verificação.Prevenção da perda de progresso durante interrupções ou quedas de energiaEsta procura de armazenamento exige um desempenho robusto, especialmente sob cargas de trabalho prolongadas ou intensivas.
A plataforma escolhida para este trabalho foi o nosso Dell PowerEdge R760 rodando Ubuntu 22.04.02 LTS. Usamos a versão 2.0 do benchmark DLIO da versão de 13 de agosto de 2024.
- 2 x Intel Xeon Gold 6430 (32-Core, 2.1GHz)
- 16 x 64 GB DDR5-4400
- SSD Dell BOSS de 480 GB
- Cabos de série Gen5 JBOF
- 61.44TB Dapustor J5060
- 61.44TB Solidigm D5-P5336
Para garantir que nosso benchmarking reflete cenários do mundo real, baseamos nossos testes na arquitetura do modelo LLAMA 3.1 405B. Implementamos checkpointing usando torch.save() para capturar parâmetros do modelo,estados do optimizadorA nossa configuração simulou um sistema de 8 GPUs, implementando uma estratégia de paralelismo híbrido com tensor paralelo de 4 vias e processamento paralelo de pipeline de 2 vias distribuídos por 8 GPUs..Esta configuração resultou em tamanhos de pontos de verificação de 1.636 GB, representativos dos requisitos modernos de treinamento de grandes modelos de linguagem.
No geral, o Dapustor J5060 demonstrou consistência sólida durante a fase inicial de teste, com tempos em torno de 575,66 segundos para os primeiros 33 pontos de verificação.O 5060J foi capaz de manter um desempenho superior antes da unidade foi preenchido pela primeira vezPor outro lado, o Solidigm P5336, embora inicialmente mais lento que o J5060, demonstrou um desempenho consistente à medida que os testes continuaram.
Quando?Considerando as médias globais, o Dapustor J5060 registrou um tempo de769.44 segundos, enquanto o Solidigm P5336 terminou em 640.17 segundosIsto coloca o Solidigm P5336 à frente em termos de poupança de pontos de controlo mais rapidamente.
No geral, o Dapustor J5060 lida bem com operações mais curtas, mas tem dificuldades com gravações sustentadas além de 30 minutos.O Solidigm P5336 é a melhor unidade para um desempenho consistente durante tarefas prolongadasEste desempenho de gravação mais fraco do Dapustor J5060 é evidente quando a sua velocidade de checkpointing se deteriora à medida que o teste continua.
Armazenamento direto da GPU
GPU Direct Storage é uma tecnologia que permite a transferência direta de dados entre dispositivos de armazenamento e GPUs, ignorando a CPU e a memória do sistema.Os dados são lidos do armazenamento para a memória da CPU e depois copiados para a memória da GPUEste processo envolve múltiplas cópias de dados, levando ao aumento da latência e redução do desempenho.O GDS elimina esse gargalo permitindo diretamente que os dispositivos de armazenamento transfiram dados para e da memória da GPU.
Testamos sistematicamente todas as combinações dos seguintes parâmetros em cargas de trabalho de leitura e gravação:
- Tamanhos de blocos: 1M, 128K, 16K
- Profundidade: 128, 64, 32, 16, 8, 4, 1
Enquanto revisamos os resultados do GDSIO, examinamos o desempenho de leitura e gravação do Dapustor J5060 e Solidigm P5336 de 61.44TB.
Desempenho de leitura sequencial do GDSIO
O Dapustor J5060 atinge um pico de leitura de 4,2 GiB/s em um tamanho de bloco de 1M com profundidades de IO de 64 e 128.8 GiB/s à medida que aumenta a profundidade do IOIsto mostra uma clara preferência por blocos de tamanho maior com altas profundidades de IO para um rendimento ótimo.Indicando a eficiência da unidade no tratamento de transferências de dados em massa.
Em comparação, o Solidigm P5336 alcançou uma capacidade máxima semelhante de 4.3 GiB/s no mesmo tamanho de bloco (1M), mas alcançou esse desempenho anteriormente a uma profundidade de IO de 32 e manteve-o consistentemente em profundidades de IO mais altasIsto sugere uma eficiência ligeiramente melhor no manuseamento de grandes blocos num intervalo mais amplo de profundidades de IO para o Solidigm P5336.
Para dar uma melhor visão comparativa, temos um gráfico diferencial comparando ambas as unidades.enquanto um bloco que se move para o lado vermelho do espectro mostra uma fraquezaAqui, o J5060 supera o P5336 no tamanho de bloco de 128K, exceto para as profundidades de 4 a 8 IO. No entanto, quedas de capacidade são observadas em profundidades de IO mais altas com tamanhos de bloco de 16K e 1M,Indicando menos eficiência nesses cenários.
Na comparação de latência de leitura sequencial, o Solidigm P5336 mantém consistentemente uma latência menor do que o Dapustor J5060 em quase todos os tamanhos de blocos e profundidades de IO.a lacuna torna-se mais pronunciada à medida que a profundidade da fila aumentaNo entanto, a concentração de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos de sólidos.080 μs no J5060 versus 5539 μs no P5336) em profundidade 128No tamanho do bloco de 1M, ambas as unidades experimentam aumentos de latência como esperado, mas o P5336 permanece ligeiramente melhor controlado, com 29.138 μs versus 29.512 μs na maior profundidade de fila.
Desempenho de gravação sequencial do GDSIO
O Dapustor J5060 mostra um desempenho de gravação consistente de 2,7 a 2,8 GiB/s para tamanhos de blocos de 128K e 1M em todas as profundidades de IO (exceto 128K, tamanho de profundidade de 1 IO, que registrou 2,2GiB/s. Para tamanhos de blocos de 16K,Intervalos de desempenho de 0.5 GiB/s a 1,4 GiB/s, dependendo da profundidade de IO, atingindo um pico de 1,4 GiB/s em profundidades de IO mais elevadas.
Em comparação, o Solidigm P5336 apresenta melhor desempenho durante os tamanhos de blocos de 128K e 1M, atingindo um pico de 3,2GiB/s. Para tamanhos de blocos menores (16K), o Solidigm P5336 também mostra maior desempenho,atingindo um pico de 1.4 GiB/s a profundidades de IO de 16 a 64. Isto indica que o Solidigm P5336 é ligeiramente mais eficiente com blocos menores durante as operações de gravação.
Passando para uma visão diferencial, vemos uma abertura maior entre o Dapustor J5060 e o desempenho de gravação do Solidigm P5336.Nossa comparação de rendimento mostra que o J5060 fica atrás do P5336 na maioria das áreasA capacidade de transferência de dados é muito menor em todos os blocos, especialmente com grandes tamanhos de blocos (1M) em todas as profundidades de IO.não são suficientemente significativas para compensar o baixo desempenho mais amplo.
Ao comparar a latência de gravação sequencial entre o Dapustor J5060 e o Solidigm P5336, ambas as unidades exibem comportamento semelhante em blocos menores como 16K,com Solidigm mantendo uma ligeira borda em profundidades inferiores de IO, enquanto o Dapustor fecha a lacuna em profundidades mais altas (64 e 128).Mas o Dapustor oferece consistentemente uma latência mais baixa à medida que a profundidade do IO aumenta.No entanto, com tamanhos de blocos de 1M, o Solidigm mantém uma clara vantagem de latência em todas as profundidades de IO,mostrando tempos de resposta significativamente mais rápidos sob pesadas cargas de trabalho de gravação sequencialNo geral, o Solidigm tem um desempenho mais consistente, enquanto a força do Dapustor é mais visível em blocos de tamanho médio e filas mais profundas.
Resumo da carga de trabalho do FIO
O Tester Flexível de E/S (FIO) é uma ferramenta de benchmarking padrão do setor utilizada para medir o desempenho dos dispositivos de armazenamento em uma ampla variedade de cenários de carga de trabalho.Confiado pela sua versatilidade e fiabilidade, FIO simula condições do mundo real, fornecendo insights sobre as capacidades e limites de desempenho de um SSD.,e IOPS através de padrões de carga de trabalho, tamanhos de blocos e profundidades de fila.
Cargas de trabalho aplicadas
- 128K Sequencial de Leitura e Escrita
- 64K leitura e escrita aleatórias
- 16K Random Leia e Escreve
- Leia e escreva 4K aleatoriamente
Essas cargas de trabalho representam um amplo espectro de casos de uso empresarial, incluindo grandes transferências sequenciais, I/O aleatórias intensivas típicas de bancos de dados,e acessos aleatórios de pequenos blocos comumente vistos em ambientes virtualizados.
Esta seção de desempenho resume o desempenho do Dapustor J5060 em principais cargas de trabalho sintéticas, incluindo operações de leitura / gravação sequenciais e aleatórias em diferentes tamanhos de blocos e profundidades de fila.As métricas são extraídas diretamente da saída de fio analisada e incluem largura de banda (MB/s), IOPS e percentiles de latência de até 99,9999%, oferecendo informações sobre o desempenho e o comportamento da cauda sob carga.
Desempenho de leitura e gravação sequencial de 128K
| Acionamento | Profundidade do fio/IO | BW (MB/s) | OPS | 990,0% | 990,9% | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Leitura | 1T/64Q | 7,482 | 57,081 | 10,66 ms | 20,02 ms | 20,83 ms |
| Solidigm P5336 Leitura | 1T/64Q | 7,479 | 57,057 | 1.51 ms | 10,66 ms | 1.81 ms |
| Dapustor J5060 Escrever | 1T/16Q | 3,023 | 23,063 | 00,69 ms | 00,69 ms | 0.70 ms |
| Solidigm P5336 Escrever | 1T/16Q | 3,364 | 25,669 | 2.67 ms | 3.48 ms | 4.42 ms |
O Dapustor J5060 oferece um desempenho impressionante de leitura sequencial em 128K, atingindo 7,48GB/s com controle de latência apertado, mesmo em percentiles mais altos.O desempenho do J5060 ′ é essencialmente o mesmo (7No entanto, o Solidigm mantém uma ligeira vantagem na consistência de latência, apresentando uma latência de cauda ligeiramente menor.
A 128K sequencial escreve (QD16), o J5060 alcança um desempenho sólido de 3,023MB/s com latência muito baixa.Apesar de uma latência notavelmente mais elevada, especialmente no percentil de 99,99% (4,42ms versus 0,70ms notavelmente baixos de Dapustor). Isso indica que o J5060 é um candidato mais forte para cenários de gravação sequencial sensíveis à latência.
Performance de leitura e escrita aleatória de 64K
| Acionamento | Profundidade | BW (MB/s) | OPS | 990,0% | 990,9% | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Leitura | 8T/32Q | 7,475 | 114,058 | 200,05 ms | 21.89 ms | 250,82 ms |
| Solidigm P5336 Leitura | 8T/32Q | 7,472 | 114,014 | 21.36 ms | 21.89 ms | 22.68 ms |
| Dapustor J5060 Escrever | 8T/32Q | 534 | 8,151 | 5740,6 ms | 7080,8 ms | 742.39 ms |
| Solidigm P5336 Escrever | 8T/32Q | 857 | 13,070 | 196.1 ms | 2080,6 ms | 221.24 ms |
Em leituras aleatórias de 64K (QD256), o Dapustor J5060 se destaca com capacidade de produção próxima de 7,4 GB/s e latência bem controlada.com uma latência máxima de percentil ligeiramente melhorAmbos os motores funcionam excepcionalmente aqui, com diferenças práticas mínimas.
O desempenho de gravação em 64K aleatório é onde o J5060 luta visivelmente, com a taxa de transferência caindo acentuadamente para 534MB/s e a latência aumentando significativamente (742.39ms a 99,99%).O Solidigm P5336 supera significativamente o J5060, fornecendo 857MB/s e latência drasticamente menor (221,24ms no mesmo percentil), tornando-o muito mais adequado para aplicações sensíveis à latência e à taxa de transferência de gravação sustentada.
Performance de leitura e escrita aleatória de 16K
| Acionamento | Profundidade | BW (MB/s) | OPS | 990,0% | 990,9% | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 Leitura | 8T/32Q | 7,430 | 453,461 | 5.28 ms | 6.39 ms | 8.16 ms |
| Solidigm P5336 Leitura | 8T/32Q | 7,431 | 453,527 | 50,01 ms | 5.21 ms | 5.47 ms |
| Dapustor J5060 Escrever | 8T/32Q | 531 | 32,404 | 143.65 ms | 1490,94 ms | 181.40 ms |
| Solidigm P5336 Escrever | 8T/32Q | 847 | 51,724 | 57.9 ms | 650,8 ms | 710,8 ms |
Na carga de trabalho de leitura aleatória de 16K (QD256), o Dapustor alcança excelentes resultados com 453K IOPS e latência controlada.O Dapustor é levemente superior na latência (50,47ms versus 8,16ms a 99,99%), sugerindo uma consistência de latência ligeiramente melhor para o Solidigm em cenários de leitura aleatória pesados.
O desempenho de gravação aleatória do Dapustor SSD 16K cai significativamente para 32K IOPS, e a latência aumenta para 181,4ms (99,99%).entregando 51.7K IOPS e um perfil de latência dramaticamente melhorado (71,8ms a 99,99%), destacando a vantagem do Solidigm para cargas de trabalho de gravação aleatória sensíveis à latência.
Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang, Diretora Global de Estratégia
WhatsApp / WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Site: www.qianxingdata.com/www.storagesserver.com
Foco em Negócios:
Distribuição de produtos TIC/Integração de sistemas e serviços/Soluções de infraestrutura
Com mais de 20 anos de experiência em distribuição de TI, fazemos parcerias com as principais marcas globais para fornecer produtos confiáveis e serviços profissionais.
¢Utilizando a tecnologia para construir um mundo inteligente ¢O seu prestador de serviços de produtos TIC de confiança!



