logo
Casa Notícias

notícias da empresa sobre A Nvidia se orgulha de 7 chips em produção para a plataforma Vera Rubin, incluindo a Groq 3 LPU

Certificado
China Beijing Qianxing Jietong Technology Co., Ltd. Certificações
China Beijing Qianxing Jietong Technology Co., Ltd. Certificações
Revisões do cliente
A equipe de vendas da tecnologia Co. de Qianxing Jietong do Pequim, Ltd é muito profissional e paciente. Podem fornecer cotações rapidamente. A qualidade e o empacotamento dos produtos são igualmente muito bons. Nossa cooperação é muito lisa.

—— LLC do》 de Festfing DV do 《

Quando eu procurava o processador central de intel e o SSD de Toshiba urgentemente, Sandy da tecnologia Co. de Qianxing Jietong do Pequim, Ltd deu-me muita ajuda e obteve-me os produtos que eu precisei rapidamente. Eu aprecio-a realmente.

—— Kitty Yen

Sandy da tecnologia Co. de Qianxing Jietong do Pequim, Ltd é um vendedor muito cuidadoso, que possa me lembrar de erros da configuração a tempo quando eu compro um servidor. Os coordenadores são igualmente muito profissionais e podem rapidamente terminar o processo de teste.

—— Strelkin Mikhail Vladimirovich

Estamos muito satisfeitos com a nossa experiência de trabalho com a Beijing Qianxing Jietong. A qualidade do produto é excelente e a entrega é sempre pontual. A equipe de vendas é profissional, paciente e muito prestativa com todas as nossas perguntas. Agradecemos muito o seu apoio e esperamos uma parceria de longo prazo. Altamente recomendado!

—— Ahmad Navid

Qualidade: Ótima experiência com o meu fornecedor. O MikroTik RB3011 já estava usado, mas estava em muito bom estado e tudo funcionava perfeitamente.E todas as minhas preocupações foram resolvidas rapidamente.Fornecedor muito fiável, altamente recomendado.

—— Geran Colesio

Estou Chat Online Agora
empresa Notícias
A Nvidia se orgulha de 7 chips em produção para a plataforma Vera Rubin, incluindo a Groq 3 LPU
A Nvidia anunciou uma atualização de hardware importante em sua Conferência de Tecnologia de GPU (GTC) em San Jose hoje, pouco mais de dois meses após adquirir a startup de chips Groq e toda a sua propriedade intelectual por US$ 20 bilhões. Mesmo com o acordo recém-finalizado, a Unidade de Processamento de Linguagem (LPU) da Groq já está em produção em massa e está sendo integrada à pilha completa de chips Vera Rubin da Nvidia — que agora inclui um total de sete novos chips que entraram em produção.

A Groq foi fundada em 2016 por ex-engenheiros do Google que faziam parte da equipe original da Unidade de Processamento Tensorial (TPU). A empresa projeta chips ASIC personalizados construídos especificamente para processamento de inferência de IA rápido e de baixa latência. Ian Buck, vice-presidente e gerente geral de computação acelerada da Nvidia, afirmou que a combinação dos "flops extremos" das GPUs Rubin com a forte largura de banda das LPUs Groq criará uma solução unicamente poderosa para cargas de trabalho de IA.

últimas notícias da empresa sobre A Nvidia se orgulha de 7 chips em produção para a plataforma Vera Rubin, incluindo a Groq 3 LPU  0

"As GPUs têm grande memória e forte desempenho de ponto flutuante, oferecendo alta taxa de transferência e taxas de token rápidas para o mercado principal, e elas se destacam em tarefas gerais de IA", disse Buck em um briefing de imprensa no dia anterior. "Mas a LPU é otimizada exclusivamente para geração de token de latência extremamente baixa, capaz de processar milhares de tokens por segundo."

"A contrapartida é que são necessários vários chips para atingir esse nível de desempenho", acrescentou. Cada LPU Groq 3 tem apenas 500 MB de SRAM, apenas 1/500 da capacidade de memória das GPUs Rubin, de acordo com Buck. "Mas a largura de banda é excepcional — as GPUs Rubin oferecem até 22 TBps, enquanto as LPUs Groq atingem 150 TB por segundo."

A Nvidia está trabalhando para combinar os dois processadores, confirmou Buck, para unificar as operações de decodificação da GPU com o trabalho de baixa latência da LPU, permitindo que os dois funcionem como um sistema unificado em vez de componentes separados.

O rack Groq 3 LPX que a Nvidia apresentou na GTC será implantado ao lado dos racks NVL72, fornecendo capacidade dedicada para inferência de IA e cargas de trabalho de IA agentic. De acordo com a apresentação da Nvidia, o rack Groq 3 LPX pode conter até 256 aceleradores LPU, equipados com 128 GB de SRAM e uma impressionante largura de banda de memória SRAM de 40 petabytes por segundo. O rack oferece até 640 TB por segundo de largura de banda de escalonamento no total, e a Nvidia observa que ele pode eventualmente escalar para abrigar mais de 1.000 LPUs.

Emparelhar um rack Groq 3 LPX com um sistema Rubin NVL72 permite que os clientes gerem um milhão de tokens por apenas US$ 45 em um modelo GPT de 1 trilhão de parâmetros com uma janela de contexto de 400 mil tokens, de acordo com a Nvidia. Esse número representa 35 vezes mais tokens do que o sistema Rubin NVL72 pode gerar por si só.

últimas notícias da empresa sobre A Nvidia se orgulha de 7 chips em produção para a plataforma Vera Rubin, incluindo a Groq 3 LPU  1

As LPUs Groq 3 não são os únicos novos chips que a Nvidia está aproveitando para aumentar a capacidade de inferência de IA. A empresa também anunciou um rack dedicado para suas CPUs Vera — os processadores baseados em ARM emparelhados com duas GPUs Rubin para construir os superchips no núcleo dos sistemas NVL72 e NVL8 da Nvidia.

Como as CPUs emergiram como um gargalo chave para inferência de IA e cargas de trabalho de IA agentic, as empresas estão cada vez mais exigindo mais recursos de CPU. Em resposta, a Nvidia lançou um rack autônomo apenas de CPU, chamado Vera CPU Rack, que apresenta 256 CPUs Vera conectadas a 400 TB de memória LPDDR5x operando a 300 TBps.

O Vera CPU Rack também vem equipado com um spine Ethernet Spectrum-X e 64 unidades de processamento de dados (DPUs) BlueField-4. Essas DPUs coordenam com GPUs em sistemas NVL72 via interconexão NVLink-C2C da Nvidia, entregando 1,8 TBps de largura de banda coerente — sete vezes a largura de banda do PCIe Gen 6, de acordo com a empresa.

A Nvidia afirma que o rack Vera pode suportar 22.500 ambientes de CPU concorrentes, atendendo à demanda massiva de CPU necessária para executar inferência de IA e cargas de trabalho agentic de forma suave. O rack usa resfriamento líquido e é construído na arquitetura de referência MGX da Nvidia, que a empresa destaca ser apoiada por 80 parceiros do ecossistema, e será distribuído através da rede global de parceiros da Nvidia.

A Nvidia também anunciou um novo rack repleto de DPUs BlueField-4, um dos sete novos chips que a Nvidia destacou como componentes do novo supercomputador de IA. O BlueField-4 STX é a primeira implementação em escala de rack da nova plataforma CMX (context memory storage) da Nvidia, que expande a memória da GPU de HBM para armazenamento NVMe primário. Ela revelou o CMX em janeiro, e os parceiros de armazenamento da Nvidia, como a VAST Data, que apresentou sua oferta de armazenamento CMX em sua conferência há algumas semanas, estão começando a adotá-lo através da arquitetura de referência Nvidia STX.


"O STX é uma camada compartilhada de alta largura de banda otimizada para armazenar e recuperar os enormes dados de cache chave-valor gerados por fluxos de trabalho agentic", disse Buck. "Esta é uma arquitetura de referência. Embora a Nvidia não vá fornecê-la diretamente, estamos fornecendo [a arquitetura de referência] a todos os nossos parceiros de armazenamento e a todo o ecossistema de armazenamento para que eles possam construir a próxima geração de armazenamento para fábricas de IA que tenha 4x o desempenho por watt, o dobro de páginas por segundo para dados corporativos e entregando 5x os tokens por segundo de memória de contexto necessária para fábricas de IA executando fluxos de trabalho agentic."


Cloudian, DDN, Dell Technologies, Everpure (anteriormente Pure Storage), Hitachi Vantara, HPE, IBM, MinIO, NetApp, Nutanix e WEKA estão construindo novo armazenamento na arquitetura de referência BlueField-4 STX, disse a Nvidia, enquanto empresas como CoreWeave, Crusoe, IREN, Lambda, Mistral AI, Nebius, Oracle Cloud Infrastructure (OCI) e Vultr a estão adotando.


Ao todo, a Nvidia está apresentando sete novos chips na GTC que cada um tem um papel no fornecimento de energia para IA na plataforma Vera Rubin. Isso inclui Vera CPU, Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU, Groq 3 LPU e SpectrumX CPO, o novo switch Ethernet de óptica co-embalada que oferece conectividade de 200 Gbps sobre fotônica de silício. A Nvidia anunciou o chip SpectrumX na GTC 2025, e ele já está em produção, disse o CEO Jensen Huang em sua palestra.


Beijing Qianxing Jietong Technology Co., Ltd.
Sandy Yang/Diretor de Estratégia Global
WhatsApp / WeChat: +86 13426366826
E-mail: yangyd@qianxingdata.com
Website: www.qianxingdata.com/www.storagesserver.com


Foco de Negócios:
Distribuição de Produtos de TIC/Integração de Sistemas e Serviços/Soluções de Infraestrutura
Com mais de 20 anos de experiência em distribuição de TI, fazemos parceria com as principais marcas globais para fornecer produtos confiáveis e serviços profissionais.
"Usando a Tecnologia para Construir um Mundo Inteligente"Seu Provedor Confiável de Serviços de Produtos de TIC!


Tempo do bar : 2026-03-18 14:05:18 >> lista da notícia
Contacto
Beijing Qianxing Jietong Technology Co., Ltd.

Pessoa de Contato: Ms. Sandy Yang

Telefone: 13426366826

Envie sua pergunta diretamente para nós (0 / 3000)