Red Hat e NVIDIA lideram benchmarks do MLPerf Inference v6.0

A Red Hat e a NVIDIA alcançaram resultados líderes do setor nos mais recentes benchmarks MLPerf Inference v6.0 para modelos de visão, fala e raciocínio. As empresas otimizaram camadas desde o kernel do RHEL até o motor vLLM. Este trabalho visa ajudar as empresas a reduzir os custos por token em GPUs H200 e B200.

A Red Hat anunciou em 2 de abril que colaborou com a NVIDIA para oferecer desempenho superior nos benchmarks MLPerf Inference v6.0. Os resultados abrangem modelos de visão, fala e raciocínio, posicionando-as como líderes do setor nessas categorias. A Red Hat afirmou que as otimizações abrangeram todas as camadas, desde o kernel do RHEL até o motor vLLM. Essas melhorias visam reduzir o custo por token para empresas que utilizam as GPUs H200 e B200 da NVIDIA. A Red Hat convidou os interessados a revisar os dados dos benchmarks para obter mais detalhes.

Artigos relacionados

NVIDIA has introduced official support for distributions compatible with Red Hat Enterprise Linux, such as AlmaLinux, in its latest CUDA release. This update, version 13.2, expands accessibility for users of these Linux variants. The announcement comes from Phoronix, a site focused on Linux hardware and benchmarks.

Reportado por IA

Red Hat is highlighting its collaboration with IBM on Sovereign Core, a solution aimed at providing provable digital sovereignty for organizations. The offering includes automated compliance validation and 24/7 in-region EU support. Separately, the Open Mainframe Project has opened applications for its Summer 2026 Mentorship Program.

terça-feira, 24 de março de 2026, 00:17h

SUSE unveils major updates for NVIDIA technologies at GTC

quinta-feira, 19 de março de 2026, 19:36h

Red Hat promotes Enterprise Linux performance tuning course

quinta-feira, 12 de março de 2026, 19:10h

CIQ announces general availability of Rocky Linux Pro AI

segunda-feira, 09 de março de 2026, 08:57h

NVIDIA 595.45.04 Linux driver shows gains in early RTX 5090 benchmarks

sábado, 21 de fevereiro de 2026, 20:11h

SoftBank boosts network efficiency with AI-RAN and Red Hat OpenShift

Este site usa cookies

Usamos cookies para análise para melhorar nosso site. Leia nossa política de privacidade para mais informações.
Recusar