Red Hat et NVIDIA en tête des benchmarks MLPerf Inference v6.0

2 avril 2026

Rapporté par l'IA

Red Hat et NVIDIA ont obtenu des résultats de premier plan dans les derniers benchmarks MLPerf Inference v6.0 pour les modèles de vision, de parole et de raisonnement. Les entreprises ont optimisé les couches allant du noyau RHEL au moteur vLLM. Ces travaux visent à aider les entreprises à réduire le coût par jeton sur les GPU H200 et B200.

Red Hat a annoncé le 2 avril sa collaboration avec NVIDIA pour offrir des performances de haut niveau dans les benchmarks MLPerf Inference v6.0. Les résultats couvrent les modèles de vision, de parole et de raisonnement, les positionnant comme des leaders du secteur dans ces catégories. Red Hat a déclaré que les optimisations ont porté sur chaque couche, du noyau RHEL jusqu'au moteur vLLM. Ces améliorations visent à réduire le coût par jeton pour les entreprises utilisant les GPU H200 et B200 de NVIDIA. Red Hat a invité les personnes intéressées à consulter les données des benchmarks pour plus de détails.

Red Hat et NVIDIA en tête des benchmarks MLPerf Inference v6.0

Articles connexes

NVIDIA adds official support for RHEL-compatible distributions in CUDA 13.2

Red Hat promotes IBM Sovereign Core for digital sovereignty

Red Hat releases OpenShift AI 3.3 for AI scaling

Linux kernel 7.0 released with major hardware and storage upgrades

Fedora council backs ai developer desktop initiative

SUSE unveils major updates for NVIDIA technologies at GTC

Red Hat promotes Enterprise Linux performance tuning course

CIQ announces general availability of Rocky Linux Pro AI

NVIDIA 595.45.04 Linux driver shows gains in early RTX 5090 benchmarks

SoftBank boosts network efficiency with AI-RAN and Red Hat OpenShift

Ce site utilise des cookies