NVIDIA Mellanox MCX653105A-HDAT Server Adaptador em Ação: RDMA/RoCE Low-Latency Transport e Server

June 15, 2026

últimas notícias da empresa sobre NVIDIA Mellanox MCX653105A-HDAT Server Adaptador em Ação: RDMA/RoCE Low-Latency Transport e Server

Nos centros de dados modernos, o armazenamento distribuído, a computação de alto desempenho (HPC) e os aglomerados de treinamento de IA enfrentam um gargalo comum: a rede.As pilhas TCP/IP tradicionais introduzem latência significativa e sobrecarga da CPUEste estudo de caso examina como um fornecedor de nuvem de tamanho médio abordou estes desafios exatos, implantando oNVIDIA Mellanox MCX653105A-HDATAdaptador de servidor para permitir o transporte de baixa latência baseado em RDMA/RoCE e aumentar drasticamente o rendimento do servidor.

Antecedentes e desafios: Quando cada microssegundo conta

A infraestrutura 25GbE existente do provedor, executando o TCP/IP padrão, estava lutando para suportar seu novo backend de armazenamento NVMe-over-Fabrics.A utilização da CPU nos nós de armazenamento regularmente excedeu 70% apenas do processamento de rede, e a latência inter-nodo pairava em torno de 50μs, inaceitável para suas cargas de trabalho de banco de dados sensíveis à latência.Congestionamento da rede causou picos de latência de cauda que afetaram os SLAs de aplicativosEles precisavam de uma solução que pudesse descarregar a sobrecarga de rede, fornecer latência de sub-microssegundos e manter um desempenho consistente sob carga.

Solução e implantação: Introdução da placa de rede PCIe MCX653105A-HDAT ConnectX Adaptador

Após avaliar várias opções, a equipa selecionou oCartão de adaptador MCX653105A-HDAT EthernetO sistema de transmissão de dados é um dos sistemas de transmissão de dados mais utilizados na Europa, devido à sua capacidade de dupla porta 100GbE e suporte nativo para RoCE (RDMA over Converged Ethernet).NVIDIA Mellanox MCX653105A-HDATfoi implantado em 120 nós de armazenamento e computação, com a seguinte configuração:

  • RoCE habilitadocom ECN (Explicit Congestion Notification) e DCQCN para controlo de congestionamento
  • NVMe-oF descarga de alvopara hardware, ignorando a CPU host para armazenamento I/O
  • Partiçãoem fluxos prioritários sem perdas para o tráfego de armazenamento
  • Monitorização da telemetriautilizando os contadores de desempenho incorporados no adaptador

De acordo com oFicha de dados MCX653105A-HDATNo entanto, a placa suporta protocolos InfiniBand e Ethernet, mas a equipe escolheu o RoCEv2 para se integrar perfeitamente com seus switches Ethernet existentes.Todos os principais modelos de servidores foramCompatibilidade MCX653105A-HDATA implantação foi concluída em dois fins de semana com zero tempo de inatividade, usando as funcionalidades de migração ao vivo do adaptador.

Resultados e benefícios: ganhos de desempenho mensuráveis

O impacto foi imediato e substancial. O quadro seguinte resume as principais métricas antes e após a implantação doSolução de cartão de adaptador MCX653105A-HDAT Ethernet:

Métrica Antes (TCP/IP) Após (RoCE + MCX653105A-HDAT) Melhoria
Latência média (nodo-a-nodo) 52 μs 10,8 μs 96Redução de 0,5%
Utilização da CPU (nodo de armazenamento, pilha de rede) 72% 8% Redução de 89%
Produto efetivo por nó (NVMe-oF) 18 Gbps 96 Gbps 5.3x aumento
Latência da cauda (99,9o percentil) 380 μs 12 μs 96Redução de 0,8%

Além destes números, a equipa observou benefícios operacionais adicionais.Especificações MCX653105A-HDATA utilização de sistemas de gestão de tráfego, como o ASAP2 e o ASAP2, permitiram reduzir o jitter do tráfego leste-oeste e possibilitaram uma escalagem mais suave.Preço MCX653105A-HDATO adaptador foi justificado em seis meses pela redução dos custos de licenciamento do núcleo da CPU e maior densidade de armazenamento por nó.MCX653105A-HDAT para vendaA Comissão propõe que a Comissão apresente uma proposta de decisão sobre a aplicação do n.° 1 do artigo 107.° do Tratado CE.

Resumo e perspectivas: Uma fundação para a infraestrutura de próxima geração

Este caso demonstra que oCartão de rede PCIe MCX653105A-HDAT ConnectX adaptadorO NIC não é meramente um NIC mais rápido, é uma plataforma para uma computação verdadeira centrada em dados.NVIDIA Mellanox MCX653105A-HDATTransforma a forma como os servidores se comunicam, eliminando os custos de protocolo legado e liberando todo o potencial do armazenamento NVMe e dos tecidos de memória distribuídos.

Olhando para o futuro, o fornecedor planeja estender sua implantação para incluir o GPUDirect RDMA para cargas de trabalho de treinamento de IA,bem como explorar as características de programação do adaptador para processamento de pacotes personalizadosPara os arquitetos de TI e engenheiros de rede que enfrentam desafios de escalação semelhantes, oCartão de adaptador MCX653105A-HDAT Ethernetoferece um caminho comprovado e pronto para o futuro para uma rede de centros de dados de baixa latência e alto rendimento.