Adaptador de Servidor NVIDIA Mellanox MCX653106A-HDAT em Ação: Transporte e Servidor de Baixa Latência RDMA/RoCE

April 30, 2026

últimas notícias da empresa sobre Adaptador de Servidor NVIDIA Mellanox MCX653106A-HDAT em Ação: Transporte e Servidor de Baixa Latência RDMA/RoCE

Nos ambientes modernos dos centros de dados, que vão desde o armazenamento distribuído e o comércio de alta frequência até os clusters de formação em IA em larga escala, as pilhas tradicionais de protocolo TCP/IP tornaram-se um grande gargalo.A sobrecarga da rede do kernel, cópia de dados e comutação de contexto consome recursos significativos da CPU, ao mesmo tempo em que introduz latência imprevisível.Este estudo de caso examina como um dos principais fornecedores de infra-estruturas de nuvem superou estes desafiosNVIDIA Mellanox MCX653106A-HDATNIC do servidor, alcançando melhorias dramáticas tanto na latência como no débito.

Antecedentes e desafios: O gargalo do TCP/IP

A infraestrutura 25GbE existente do provedor, executando o TCP padrão, estava lutando para acompanhar o tráfego de armazenamento NVMe-oF e as cargas de trabalho de análise em tempo real.A utilização da CPU nos nós de armazenamento frequentemente ultrapassava 70% apenas para processamento de redeA latência de ponta a ponta entre os nós de computação e de armazenamento flutuava entre 50-150 microssegundos.causando picos de latência de cauda que afetaram os acordos de nível de serviçoA equipa de engenheiros reconheceu que era necessária uma mudança fundamental na arquitetura de rede, uma que contornasse o kernel e permitisse o acesso direto à memória entre os terminais.

Solução: Implementação do MCX653106A-HDAT com RoCE

Após avaliar múltiplas opções, a equipa selecionou oCartão de adaptador MCX653106A-HDAT EthernetConstruído sobre a arquitetura ConnectX-6, esteMCX653106A-HDAT Adaptador ConnectX cartão de rede PCIefornece conectividade dual-port 100GbE com suporte de hardware nativo para RoCE (RDMA over Converged Ethernet).

  • Fase 1:Substitua os NICs legados em nós de armazenamento (10 nós executando o Ceph) pelo novo adaptador.
  • Fase 2:Configurar a Ethernet sem perdas utilizando o DCB (Priority Flow Control e ETS) tanto nos NICs como nos switches top-of-rack.
  • Fase 3:Migrar tráfego de aplicativos de soquetes TCP para verbos baseados em RDMA e NVMe-oF através do RoCE.
  • Fase 4:Expandir a implantação para nós de computação que lidam com análises em tempo real.

Engenheiros consultoresFicha de dados MCX653106A-HDATeEspecificações MCX653106A-HDATA versão mais recente da versão de Ubuntu foi a versão de Ubuntu 10.04, que confirmou a plena compatibilidade com o tecido de comutação Mellanox existente e a distribuição Linux implantada (Ubuntu 22.04 com drivers MLNX_OFED).Compatibilidade MCX653106A-HDATO ecossistema provou ser abrangente, não exigindo alterações de hardware além da substituição do próprio NIC.

Resultados e benefícios: transformação mensurável

Os testes pós-implementação revelaram melhorias substanciais em todas as métricas-chave.

Métrica Antes (25GbE TCP) Após (MCX653106A-HDAT RoCE) Melhoria
Latência média (P99) 120 μs 8 μs Redução de 93%
Nodo de armazenamento CPU (caminho de rede) ~ 65% ~ 12% 5.4x redução
NVMe-oF Reading Throughput (por nó) 18 Gb/s 96 Gb/s 5.3x aumento
Taxa de mensagens (64B pacotes) 15 Mpps 215 Mpps 14.3x aumento

Além destes ganhos quantitativos, a equipa observou vários benefícios qualitativos.Solução de cartão de adaptador MCX653106A-HDAT Ethernetpermitiu um verdadeiro movimento de dados de cópia zero entre a memória do aplicativo e o armazenamento remoto, eliminando problemas de esgotamento do buffer que anteriormente causavam falhas intermitentes durante explosões de tráfego.Para a carga de trabalho de análise, a migração para o RDMA reduziu os tempos de conclusão de trabalhos em 62%, melhorando directamente os resultados empresariais.Preço MCX653106A-HDATEm relação ao custo total de propriedade, a redução de 30% no número de nós de armazenamento (devido a uma maior eficiência por nó) rendeu-se em nove meses.MCX653106A-HDAT para vendaA NVIDIA também incluiu o acesso ao framework DOCA, desbloqueando a programação futura para funções de rede personalizadas.

Conclusão e perspetivas: uma base para a infra-estrutura de próxima geração

A implantação deNVIDIA Mellanox MCX653106A-HDATA combinação de RoCE descarregado de hardware e RoCE de alta performance e de baixa latência,A interface PCIe 4.0 e o ecossistema de software abrangente abordam as três demandas críticas dos data centers de hoje: redução da latência, aumento da taxa de transferência e melhoria da eficiência da CPU.

Para os arquitetos que avaliam melhorias semelhantes, a jornada começa com a verificação de que osCompatibilidade MCX653106A-HDATOs componentes, incluindo interruptores, cabos e sistemas operativos.Ficha de dados MCX653106A-HDATA partir daí, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de informação e de comunicação, a tecnologia de comunicação e a tecnologia de comunicação, a tecnologia de comunicação e a tecnologia de comunicação.Cartão de adaptador MCX653106A-HDAT Ethernetestá pronto como uma solução comprovada e resistente à produção. O fornecedor está agora a expandir a implantação para incluir GPU RDMA direto para cargas de trabalho de inferência de IA,Validação adicional deste adaptador como uma pedra angular da arquitetura moderna do data center.