MLPerf
Red Hat et NVIDIA ont obtenu des résultats de premier plan dans les derniers benchmarks MLPerf Inference v6.0 pour les modèles de vision, de parole et de raisonnement. Les entreprises ont optimisé les couches allant du noyau RHEL au moteur vLLM. Ces travaux visent à aider les entreprises à réduire le coût par jeton sur les GPU H200 et B200.