Ett stort avbrott hos Cloudflare den 18 november 2025 störde många webbplatser och tjänster, initialt misstaget för en massiv DDoS-attack. Problemet uppstod på grund av en intern databassändring som dubblade storleken på en kritisk funktionsfil som används i företagets botthanteringssystem. Cloudflare löste problemet genom att återgå till en tidigare filversion, även om full återhämtning tog extra tid på grund av ökande trafik.
Cloudflares avbrott började när en ändring av databastillträden i dess ClickHouse-kluster fick en fråga att producera flera poster i en 'funktionsfil' som är essentiell för botthanteringssystemet. Denna fil, som beskriver egenskaper som används av en maskininlärningsmodell för att poängsätta bots och avgöra åtkomst till kundsajter, fördubblade oväntat sin storlek. Mjukvaran som dirigerar trafik över Cloudflares nätverk hade en storleksgräns på 200 funktioner, och den uppblåsta filen överskred detta, vilket ledde till fel i kärn-CDN, säkerhetstjänster och andra komponenter.
VD Matthew Prince misstänkte initialt en hyper-skala DDoS-attack från Aisuru-botnätverket och skrev i en intern chatt: “Jag oroar mig för att detta är det stora botnätverket som visar muskler.” Undersökningen avslöjade dock det självförvållade problemet. Filen genereras var femte minut och sprids nätverksövergripande för att motverka utvecklande bot-hot. På grund av gradvisa uppdateringar i databasklustret genererades dåliga filer intermittenta, vilket orsakade fluktuerande 5xx-fel som efterliknade ett attackmönster.
Cloudflare stoppade spridningen av den felaktiga filen, ersatte den med en tidigare bra version och startade om sin kärnproxy. Detta återställde det mesta av trafiken, men det tog ytterligare två och en halv timme att hantera inflödet när tjänsterna kom tillbaka online. Prince beskrev det som det värsta avbrottet sedan 2019 och bad om ursäkt: “På uppdrag av hela Cloudflare-teamet vill jag be om ursäkt för smärtan vi orsakat Internet idag.”
Företaget bekräftade att ingen hackning var inblandad och skyllde det enbart på systemfelet. För att förhindra upprepningar planerar Cloudflare att förstärka konfigurationsingest, lägga till globala avstängningsbrytare, eliminera resurskrävande felrapporter och granska felmodi över proxy-moduler. Prince noterade att tidigare avbrott har drivit förbättringar i motståndskraft, även om han inte kan garantera mot framtida av samma skala.