Benchmarks de IA
Red Hat y NVIDIA han obtenido resultados líderes en la industria en los últimos puntos de referencia MLPerf Inference v6.0 para modelos de visión, voz y razonamiento. Las compañías optimizaron las capas desde el kernel de RHEL hasta el motor vLLM. Este trabajo tiene como objetivo ayudar a las empresas a reducir los costos por token en las GPU H200 y B200.