AI-benchmarks
Red Hat och NVIDIA har uppnått branschledande resultat i de senaste MLPerf Inference v6.0-testerna för modeller inom bild, tal och resonemang. Företagen optimerade lager från RHEL-kärnan till vLLM-motorn. Arbetet syftar till att hjälpa företag att sänka kostnaden per token på H200- och B200-GPU:er.