Red Hat och NVIDIA leder MLPerf Inference v6.0-tester

Red Hat och NVIDIA har uppnått branschledande resultat i de senaste MLPerf Inference v6.0-testerna för modeller inom bild, tal och resonemang. Företagen optimerade lager från RHEL-kärnan till vLLM-motorn. Arbetet syftar till att hjälpa företag att sänka kostnaden per token på H200- och B200-GPU:er.

Red Hat meddelade den 2 april att de har samarbetat med NVIDIA för att leverera toppresultat i MLPerf Inference v6.0-testerna. Resultaten omfattar modeller för bild, tal och resonemang, vilket placerar dem som branschledare inom dessa kategorier. Red Hat uppgav att optimeringarna sträckte sig över varje lager, från RHEL-kärnan hela vägen upp till vLLM-motorn. Dessa förbättringar syftar till en lägre kostnad per token för företag som använder H200- och B200-GPU:er från NVIDIA. Red Hat uppmanade intressenter att granska testdatan för ytterligare detaljer.

Relaterade artiklar

NVIDIA has introduced official support for distributions compatible with Red Hat Enterprise Linux, such as AlmaLinux, in its latest CUDA release. This update, version 13.2, expands accessibility for users of these Linux variants. The announcement comes from Phoronix, a site focused on Linux hardware and benchmarks.

Rapporterad av AI

Red Hat is highlighting its collaboration with IBM on Sovereign Core, a solution aimed at providing provable digital sovereignty for organizations. The offering includes automated compliance validation and 24/7 in-region EU support. Separately, the Open Mainframe Project has opened applications for its Summer 2026 Mentorship Program.

Denna webbplats använder cookies

Vi använder cookies för analys för att förbättra vår webbplats. Läs vår integritetspolicy för mer information.
Avböj