Den kinesiska GPU-utvecklaren Moore Threads har introducerat sin Huagang-arkitektur, som lovar betydande framsteg inom spel- och AI-prestanda. Arkitekturen är planerad för lansering 2026 och siktar på självständighet inom halvledare mitt i globala exportrestriktioner. Detaljerna är sparsamma, men bolaget framhävde ambitiösa benchmarks för kommande produkter.
På den senaste MUSA Developer Conference presenterade Moore Threads sin nästa generations Huagang-arkitektur, kallad "Flowerpot" i vissa översättningar. Denna plattform är avsedd att driva både spel- och artificiell intelligens-applikationer, med full utrullning planerad för 2026. Tillkännagivandet fokuserade på prestandaprognoser snarare än djupgående tekniska nedbrytningar, och understryker Kinas ansträngningar att bygga inhemska GPU-kapaciteter inför internationella restriktioner.
Kärnan i presentationen är Lushan-spel-GPU:n, som ersätter de befintliga MTT S80- och S90-modellerna. Moore Threads hävdar att Lushan ger 15 gånger snabbare renderingshastighet för AAA-spel och 50 gånger bättre ray tracing-kapacitet. Den inkluderar en andra generations hårdvaru-ray tracing-motor och full DirectX 12 Ultimate-kompatibilitet för förbättrad mjukvaruintegration. Minneskapaciteten förväntas nå 64 GB, en fyrdubbling från de nuvarande 16 GB GDDR6 i tidigare modeller. Ytterligare framhävda förbättringar inkluderar 64 gånger snabbare AI-beräkningar, 16 gånger bättre geometrihantering, fyra gånger högre texturifyllningshastigheter och åtta gånger snabbare atomära minnesoperationer. Arkitekturen introducerar UniTE, ett enhetligt renderingsystem med integrerad AI-processorenhet.
Som komplement har Huashan AI-GPU en dubbel-chiplet-konfiguration utrustad med nio HBM-moduler. Företaget påstår att prestandan rivaliserar Nvidias Hopper- och Blackwell-serier, med minnesbandbredd som överträffar Nvidia B200. Huashan stöder precisioner från FP4 till FP64, inklusive proprietära MTFP4, MTFP6 och MTFP8-alternativ. Skalbarheten sträcker sig till kluster över 100 000 enheter via MTLink 4.0, med 1 314 GB/s anslutningshastighet. Jämfört med nuvarande produkter lovar den 50 procents ökning i beräkningsdensitet och tiofaldig effektivitetshöjning.
Inga speldemonstrationer visades, men ett benchmark på den kommande MTT S5000-GPU – orelaterad till Huashan – körde DeepSeek V3-modellen med 1 000 tokens per sekund i dekodning och 4 000 i prefill-faser, vilket marginellt överträffar Nvidias Hopper. Dessa utvecklingar speglar Pekings strävan efter teknologisk oberoende, även om påståendena väntar på validering när produkterna närmar sig marknaden.