Red Hat och NVIDIA leder MLPerf Inference v6.0-tester

2 april 2026

Rapporterad av AI

Red Hat och NVIDIA har uppnått branschledande resultat i de senaste MLPerf Inference v6.0-testerna för modeller inom bild, tal och resonemang. Företagen optimerade lager från RHEL-kärnan till vLLM-motorn. Arbetet syftar till att hjälpa företag att sänka kostnaden per token på H200- och B200-GPU:er.

Red Hat meddelade den 2 april att de har samarbetat med NVIDIA för att leverera toppresultat i MLPerf Inference v6.0-testerna. Resultaten omfattar modeller för bild, tal och resonemang, vilket placerar dem som branschledare inom dessa kategorier. Red Hat uppgav att optimeringarna sträckte sig över varje lager, från RHEL-kärnan hela vägen upp till vLLM-motorn. Dessa förbättringar syftar till en lägre kostnad per token för företag som använder H200- och B200-GPU:er från NVIDIA. Red Hat uppmanade intressenter att granska testdatan för ytterligare detaljer.

Red Hat och NVIDIA leder MLPerf Inference v6.0-tester

Relaterade artiklar

NVIDIA adds official support for RHEL-compatible distributions in CUDA 13.2

Red Hat promotes IBM Sovereign Core for digital sovereignty

Red Hat releases OpenShift AI 3.3 for AI scaling

Linux kernel 7.0 released with major hardware and storage upgrades

Fedora council backs ai developer desktop initiative

SUSE unveils major updates for NVIDIA technologies at GTC

Red Hat promotes Enterprise Linux performance tuning course

CIQ announces general availability of Rocky Linux Pro AI

NVIDIA 595.45.04 Linux driver shows gains in early RTX 5090 benchmarks

SoftBank boosts network efficiency with AI-RAN and Red Hat OpenShift

Denna webbplats använder cookies