La programación consciente de caché de Linux muestra potencial en AMD EPYC Turin

23 de octubre de 2025

Reportado por IA

Pruebas recientes de los parches propuestos para la programación consciente de caché de Linux demuestran mejoras significativas en el rendimiento en los procesadores AMD EPYC Turin. Los parches, desarrollados por ingenieros de Intel, buscan optimizar la colocación de tareas para una mejor localidad de caché en CPUs con múltiples cachés. Las pruebas en una configuración dual EPYC 9965 revelaron resultados prometedores para cargas de trabajo de servidores heterogéneos.

En los últimos meses, los ingenieros del kernel de Linux de Intel han estado desarrollando programación consciente de caché para mejorar el rendimiento en CPUs modernas con múltiples niveles de caché. Este enfoque agrupa tareas que probablemente compartan recursos en el mismo dominio de caché, mejorando la localidad y eficiencia del caché.

Los parches, que han superado la etapa de solicitudes de comentarios, se actualizaron a principios de octubre. Informes iniciales destacaron una reducción del 44% en el tiempo en un benchmark, junto con mejoras en plataformas como Intel Xeon Sapphire Rapids, AMD EPYC Milan y AMD EPYC Genoa.

Para esta evaluación, se realizaron pruebas en el kernel de Linux 6.17 utilizando la serie insignia EPYC 9005 "Turin" de AMD, específicamente los procesadores EPYC 9965 de 192 núcleos. La configuración contaba con un servidor AMD Volcano de doble socket con 192 núcleos y 384 hilos por socket, equipado con 384 MB de caché L3.

Se realizaron comparaciones entre un kernel de Linux 6.17 estándar y el mismo kernel modificado con los parches de programación consciente de caché del 11 de octubre habilitados. Los parámetros ajustables para la programación consciente de caché, accesibles a través de sysfs, se dejaron en sus configuraciones predeterminadas durante las pruebas.

Aunque la programación consciente de caché ofrece beneficios para muchas cargas de trabajo, no es universalmente ventajosa. Un parche específico la deshabilita para procesos con conteos de hilos que excedan los núcleos físicos en la caché de último nivel (LLC) para prevenir contención de caché. La función muestra un potencial particular para entornos de servidores Linux heterogéneos típicos que no saturan completamente la CPU.

Este sitio web utiliza cookies