Le développeur chinois de GPU Moore Threads a introduit son architecture Huagang, promettant des avancées significatives en performances pour les jeux et l'IA. Prévue pour un lancement en 2026, cette conception vise l'autosuffisance en semi-conducteurs face aux restrictions mondiales sur les exportations. Bien que les détails soient limités, l'entreprise a mis en avant des benchmarks ambitieux pour ses futurs produits.
Lors de la récente Conférence des développeurs MUSA, Moore Threads a présenté son architecture de prochaine génération Huagang, surnommée « Flowerpot » dans certaines traductions. Cette plateforme vise à alimenter à la fois les applications de jeux et d'intelligence artificielle, avec un déploiement complet prévu pour 2026. L'annonce s'est concentrée sur des projections de performances plutôt que sur des analyses techniques détaillées, soulignant les efforts de la Chine pour développer des capacités nationales en GPU face aux restrictions internationales.
Au cœur de la révélation se trouve la GPU de jeux Lushan, qui remplacera les modèles existants MTT S80 et S90. Moore Threads affirme que Lushan offrira une augmentation de 15 fois de la vitesse de rendu des jeux AAA et une amélioration de 50 fois des capacités de ray tracing. Elle intègre un moteur de ray tracing matériel de deuxième génération et une compatibilité complète avec DirectX 12 Ultimate pour une meilleure intégration logicielle. La capacité mémoire devrait atteindre 64 Go, quadruplant les 16 Go GDDR6 des modèles précédents. D'autres gains vantés incluent des calculs IA 64 fois plus rapides, un traitement géométrique 16 fois meilleur, des taux de remplissage de textures quatre fois supérieurs et des opérations mémoire atomique huit fois plus rapides. L'architecture introduit UniTE, un système de rendu unifié avec une unité de traitement IA intégrée.
La complétant, la GPU IA Huashan adopte une configuration à double chiplet équipée de neuf modules HBM. L'entreprise prétend que ses performances rivalisent avec les séries Hopper et Blackwell de Nvidia, avec une bande passante mémoire supérieure à celle du Nvidia B200. Huashan prend en charge une gamme de formats de précision de FP4 à FP64, y compris les options propriétaires MTFP4, MTFP6 et MTFP8. L'évolutivité s'étend à des clusters dépassant 100 000 unités via MTLink 4.0, offrant une vitesse d'interconnexion de 1 314 Go/s. Par rapport aux offres actuelles, elle promet une densité de calcul en hausse de 50 % et des améliorations d'efficacité décuplées.
Bien qu'aucune démonstration de jeux n'ait été présentée, un benchmark sur la future GPU MTT S5000 —non liée à Huashan— a exécuté le modèle DeepSeek V3 à 1 000 tokens par seconde en décodage et 4 000 en préremplissage, surpassant légèrement les performances du Hopper de Nvidia. Ces développements reflètent la poussée de Pékin vers l'indépendance technologique, bien que les affirmations attendent une validation à l'approche du marché.