Red Hat et NVIDIA en tête des benchmarks MLPerf Inference v6.0

Red Hat et NVIDIA ont obtenu des résultats de premier plan dans les derniers benchmarks MLPerf Inference v6.0 pour les modèles de vision, de parole et de raisonnement. Les entreprises ont optimisé les couches allant du noyau RHEL au moteur vLLM. Ces travaux visent à aider les entreprises à réduire le coût par jeton sur les GPU H200 et B200.

Red Hat a annoncé le 2 avril sa collaboration avec NVIDIA pour offrir des performances de haut niveau dans les benchmarks MLPerf Inference v6.0. Les résultats couvrent les modèles de vision, de parole et de raisonnement, les positionnant comme des leaders du secteur dans ces catégories. Red Hat a déclaré que les optimisations ont porté sur chaque couche, du noyau RHEL jusqu'au moteur vLLM. Ces améliorations visent à réduire le coût par jeton pour les entreprises utilisant les GPU H200 et B200 de NVIDIA. Red Hat a invité les personnes intéressées à consulter les données des benchmarks pour plus de détails.

Articles connexes

NVIDIA has introduced official support for distributions compatible with Red Hat Enterprise Linux, such as AlmaLinux, in its latest CUDA release. This update, version 13.2, expands accessibility for users of these Linux variants. The announcement comes from Phoronix, a site focused on Linux hardware and benchmarks.

Rapporté par l'IA

Red Hat is highlighting its collaboration with IBM on Sovereign Core, a solution aimed at providing provable digital sovereignty for organizations. The offering includes automated compliance validation and 24/7 in-region EU support. Separately, the Open Mainframe Project has opened applications for its Summer 2026 Mentorship Program.

Ce site utilise des cookies

Nous utilisons des cookies pour l'analyse afin d'améliorer notre site. Lisez notre politique de confidentialité pour plus d'informations.
Refuser