El desarrollador chino de GPU Moore Threads ha introducido su arquitectura Huagang, que promete avances significativos en rendimiento para juegos e IA. Programada para un lanzamiento en 2026, el diseño busca la autosuficiencia en semiconductores ante restricciones globales a las exportaciones. Aunque los detalles son escasos, la compañía destacó benchmarks ambiciosos para productos futuros.
En la reciente Conferencia de Desarrolladores MUSA, Moore Threads presentó su arquitectura de próxima generación Huagang, apodada «Flowerpot» en algunas traducciones. Esta plataforma busca potenciar tanto aplicaciones de juegos como de inteligencia artificial, con un lanzamiento completo previsto para 2026. El anuncio se centró en proyecciones de rendimiento en lugar de análisis técnicos detallados, subrayando los esfuerzos de China por desarrollar capacidades nacionales de GPU frente a restricciones internacionales.
El núcleo de la presentación es la GPU de juegos Lushan, que reemplazará a los modelos MTT S80 y S90 existentes. Moore Threads afirma que Lushan ofrecerá un aumento de 15 veces en la velocidad de renderizado de juegos AAA y una mejora de 50 veces en capacidades de ray tracing. Incorpora un motor de ray tracing por hardware de segunda generación y compatibilidad completa con DirectX 12 Ultimate para una mejor integración de software. Se espera que la capacidad de memoria alcance los 64 GB, cuadruplicando los 16 GB GDDR6 de los modelos anteriores. Otras mejoras destacadas incluyen cálculos de IA 64 veces más rápidos, procesamiento geométrico 16 veces mejor, tasas de relleno de texturas cuatro veces superiores y operaciones de memoria atómica ocho veces más rápidas. La arquitectura introduce UniTE, un sistema de renderizado unificado con una unidad de procesamiento de IA integrada.
Complementándola, la GPU de IA Huashan cuenta con una configuración de doble chiplet equipada con nueve módulos HBM. La empresa afirma que su rendimiento rivaliza con las series Hopper y Blackwell de Nvidia, con un ancho de banda de memoria superior al del Nvidia B200. Huashan soporta formatos de precisión desde FP4 hasta FP64, incluidos los propietarios MTFP4, MTFP6 y MTFP8. La escalabilidad llega a clústeres de más de 100.000 unidades mediante MTLink 4.0, con una velocidad de interconexión de 1.314 GB/s. En comparación con las ofertas actuales, promete un 50 % más de densidad de cómputo y mejoras de eficiencia de diez veces.
Aunque no se mostraron demostraciones de juegos, un benchmark de la próxima GPU MTT S5000 —no relacionada con Huashan— ejecutó el modelo DeepSeek V3 a 1.000 tokens por segundo en decodificación y 4.000 en prellenado, superando ligeramente el rendimiento del Hopper de Nvidia. Estos avances reflejan el impulso de Pekín hacia la independencia tecnológica, aunque las afirmaciones pendientes de validación a medida que los productos se acerquen al mercado.