„Unsere Seite ist down, aber der Server läuft einwandfrei“ – dieser Satz dürfte am 18. November 2025 in vielen Developer-Chats und Slack-Channels gefallen sein. Während ChatGPT, X, PayPal und hunderte weitere Dienste weltweit unerreichbar waren, saßen Admins ratlos vor ihren Monitoren. Der Schuldige? Ausgerechnet Cloudflare, das CDN, das eigentlich für maximale Verfügbarkeit sorgen soll. Mit über 15 Jahren Erfahrung in Softwarequalität, Open Source und Remote Consulting zeigen wir euch heute, was wirklich passiert ist und welche Konsequenzen dieser Ausfall für eure Infrastruktur-Entscheidungen haben sollte.
Der massive Cloudflare-Ausfall: Ein Überblick
Am 18. November 2025 gegen 12:48 Uhr MEZ meldete Cloudflare offiziell „interne Service-Degradation“. Was harmlos klingt, bedeutete faktisch: Ein erheblicher Teil des Internets war für über drei Stunden nicht oder nur eingeschränkt erreichbar. Die Auswirkungen waren dramatisch – von Social Media über KI-Dienste bis hin zu E-Commerce-Plattformen.
1. Was ist Cloudflare überhaupt und warum ist der Dienst so kritisch?
Cloudflare ist weit mehr als nur ein CDN (Content Delivery Network). Der 2009 gegründete Service positioniert sich als Schutzschild des Internets und sitzt zwischen Nutzern und Webservern. Konkret bedeutet das:
DDoS-Schutz: Cloudflare filtert bösartige Anfragen, bevor sie euren Server erreichen – täglich werden Millionen von Angriffen abgewehrt.
Performance-Boost: Statische Inhalte werden auf über 300 Cloudflare-Servern weltweit gecacht, was Ladezeiten drastisch reduziert.
DNS-Services: Über 6 Millionen Websites nutzen Cloudflares DNS-Infrastruktur für zuverlässige Namensauflösung.
Die kritische Frage dabei: Wenn ein einziger Anbieter vor so vielen Websites geschaltet ist, wird er zum Single Point of Failure für Millionen Nutzer. Genau das haben wir am 18. November erlebt. Nach über 15 Jahren Consulting-Erfahrung können wir sagen: Diese Zentralisierung ist das größte Infrastruktur-Risiko, über das viele Entscheider nicht ausreichend nachdenken.
2. Welche bekannten Domains waren vom Cloudflare-Ausfall betroffen?
Die Liste der betroffenen Services liest sich wie das Who’s Who des modernen Internets:
Social Media & Kommunikation:
- X (Twitter) – komplett unerreichbar über mehrere Stunden
- Discord – Gaming-Communities weltweit offline
- Truth Social – auch alternative Plattformen betroffen
KI & Produktivität:
- ChatGPT (OpenAI) – millionenfacher Nutzungsausfall
- Claude (Anthropic) – ebenfalls zeitweise offline
E-Commerce & Finanzen:
- PayPal – Transaktionen nicht möglich
- Uber – Fahrten konnten nicht gebucht werden
- Ikea – Online-Shopping down
- Bauhaus – deutsche Baumarktkette offline
Gaming:
- League of Legends – Matches unterbrochen
- Diverse Online-Gaming-Plattformen
Behörden & Medien:
- UK Financial Conduct Authority (FCA)
- UK Office for National Statistics
- Österreichischer Kurier
- Diverse deutsche Blogs und Foren (pcgameshardware.de, mygully.com, serienfans.org)
Was nicht betroffen war: Interessanterweise blieben große deutsche Medien wie ARD, ZDF, Bild, Welt und Focus online. Auch Amazon, Reddit und Bluesky funktionierten weiter – sie setzen auf eigene oder alternative CDN-Infrastrukturen.
Developer-Insight: In unseren Projekten haben wir immer wieder gesehen, dass Enterprise-Kunden von Cloudflare deutlich weniger betroffen waren. Das wirft die Frage auf: Gibt es unterschiedliche Infrastruktur-Tiers bei Cloudflare, die unterschiedlich resilient sind?
3. Wie lange dauerte der Ausfall und wann war er behoben?
Der Timeline des Ausfalls ist entscheidend für eure Incident-Response-Planung:
12:48 Uhr MEZ: Cloudflare meldet offiziell „internal service degradation“
13:21 Uhr: Erste Anzeichen von Erholung werden beobachtet
14:09 Uhr: Cloudflare identifiziert die Ursache
14:34 Uhr: Dashboard-Services wiederhergestellt
14:42 Uhr: Fix implementiert, Monitoring läuft
15:42 Uhr: Offizielle Entwarnung – „Incident resolved“
Gesamtdauer: Knapp 3 Stunden mit unterschiedlichen Schweregraden
Praxis-Tipp: Diese 3 Stunden bedeuten für viele E-Commerce-Seiten direkten Umsatzausfall. Berechnet mal den potenziellen Schaden: 3 Stunden Ausfall × durchschnittlicher Stundenumsatz × betroffene Nutzer. Bei größeren Shops geht das schnell in fünf- bis sechsstellige Bereiche. Genau deshalb empfehlen wir in unseren Consulting-Projekten immer Multi-CDN-Strategien.
4. Wie erkenne ich, ob meine Website von einem Cloudflare-Ausfall betroffen ist?
Diese Frage erreicht uns regelmäßig in Consulting-Calls. Hier die praxisbewährten Methoden:
Browser-Fehlermeldungen identifizieren:
- „Lassen Sie challenges.cloudflare.com zu, um fortzufahren“
- HTTP 500 Internal Server Error (wenn Cloudflare als Ursache angezeigt wird)
- „Unsichere Verbindung“ mit Cloudflare-Branding
Curl-Diagnose (Developer-Methode):
curl -svo /dev/null https://eure-domain.de
Achtet auf CF-RAY Header in der Response – wenn dieser fehlt oder Error 500/503 kommt, liegt’s an Cloudflare.
Status-Checks nutzen:
- cloudflarestatus.com – offizielle Statusseite
- StatusGator.com/cloudflare – unabhängiges Monitoring
- Downdetector – User-Reports in Echtzeit
Eigene Monitoring-Lösung:
# Prüft Cloudflare-Header
curl -I https://eure-domain.de | grep -i "cf-"
Developer-Workflow: Integriert Cloudflare-Status-Checks in eure Monitoring-Pipelines. Wir nutzen in Projekten StatusGator mit Webhook-Integration zu Slack – so sehen wir Cloudflare-Probleme, bevor Kunden uns kontaktieren.
5. Was war die Ursache des Ausfalls am 18. November?
Cloudflare selbst bleibt in der offiziellen Kommunikation vage: „Internal service degradation affecting multiple services“. Aus technischer Sicht können wir aber folgende Erkenntnisse zusammentragen:
Beobachtete Symptome:
- Weitverbreitete HTTP 500 Errors
- Dashboard und API gleichzeitig betroffen
- Geografisch verteilte Standorte (Frankfurt, Berlin, Amsterdam, Warschau) zeigten identische Probleme
Mögliche Root Causes (basierend auf ähnlichen Incidents):
- DNS-Probleme: Unwahrscheinlich, da der Ausfall zu weitreichend war
- BGP-Routing-Issue: Kann ganze Netzwerk-Segmente offline nehmen
- Software-Deployment Gone Wrong: Ähnlich wie beim Facebook-Ausfall 2021
- Database-Backend-Failure: Erklärt warum Dashboard und API gleichzeitig betroffen waren
Wichtige Beobachtung: WARP-Zugang in London wurde manuell deaktiviert, um die Störung einzugrenzen – das deutet auf Netzwerk-Routing-Probleme hin.
Aus unserer Consulting-Erfahrung: Solche „Service Degradations“ sind oft Resultat von automatisierten Deployments ohne ausreichende Canary-Testing-Phase. Ein Grund mehr, warum wir in kritischen Projekten auf Blue-Green-Deployments mit ausgiebiger Smoke-Test-Phase setzen.
6. Wie kann ich meine Website vor CDN-Ausfällen schützen?
Die brutale Wahrheit: 100%ige Sicherheit gibt es nicht. Aber ihr könnt die Auswirkungen drastisch minimieren:
Multi-CDN-Strategie (Der Königsweg):
# Nginx Config mit CDN-Failover
upstream cdn_primary {
server cdn1.cloudflare.com;
}
upstream cdn_fallback {
server cdn2.bunny.net backup;
}
DNS-Level Failover:
- Nutzt DNS-Provider mit Health-Check-Integration (z.B. AWS Route 53, Cloudflare Load Balancing)
- Konfiguriert automatische Failover-Regeln bei CDN-Ausfall
- TTL bewusst niedrig setzen (300-600 Sekunden) für schnelle Umschaltung
Origin-Protection beibehalten:
# Whitelist nur CDN-IPs am Origin-Server
iptables -A INPUT -s cloudflare-ip-range -j ACCEPT
iptables -A INPUT -s bunny-ip-range -j ACCEPT
iptables -A INPUT -j DROP
Monitoring & Alerting:
- Synthetic Monitoring von verschiedenen Standorten
- Alert bei CDN-Fehlern innerhalb von 60 Sekunden
- Runbook für CDN-Ausfall-Szenarien im Team dokumentieren
Unsere Consulting-Empfehlung: Die Kosten für Multi-CDN-Setup liegen bei etwa 20-40% höher als Single-CDN, aber das ist Peanuts verglichen mit dem potenziellen Umsatzausfall bei 3 Stunden Downtime. Wir implementieren das standardmäßig für kritische E-Commerce-Kunden.
7. Welche Alternativen gibt es zu Cloudflare?
Nach diesem Ausfall fragen sich viele: Gibt’s bessere Optionen? Hier die ehrliche Bewertung aus 15+ Jahren Projekt-Erfahrung:
Enterprise-Grade Alternativen:
Akamai:
- Pro: Älteste und größte CDN-Infrastruktur (300.000+ Server)
- Pro: Extrem robuste DDoS-Protection
- Con: Deutlich teurer als Cloudflare
- Con: Komplexere Konfiguration
- Fazit: Für Fortune-500-Unternehmen, die sich maximale Verfügbarkeit leisten können
Fastly:
- Pro: Developer-friendly API und Konfiguration
- Pro: Real-time Purging ohne Delay
- Pro: Ausgezeichnete Performance in Europa
- Con: Höherer Preis als Cloudflare Free/Pro
- Fazit: Ideal für Tech-Startups mit hohen Performance-Anforderungen
Bunny.net (Geheimtipp):
- Pro: Unschlagbares Preis-Leistungs-Verhältnis ($0.01/GB)
- Pro: 119 PoPs weltweit
- Pro: Einfache Integration
- Con: Weniger umfangreiche Security-Features
- Fazit: Perfekt für Blogs, kleinere SaaS und WordPress-Seiten
AWS CloudFront:
- Pro: Nahtlose AWS-Integration
- Pro: Pay-as-you-go ohne Mindestabnahme
- Con: Komplexe Preisstruktur
- Con: Steilere Lernkurve
- Fazit: Optimal wenn ihr bereits im AWS-Ökosystem seid
Azure CDN:
- Pro: Multi-Provider-Ansatz (wählt zwischen Microsoft, Akamai, Verizon)
- Pro: Gute EMEA-Performance
- Con: Microsoft-Lock-in
- Fazit: Für Microsoft-Shops die logische Wahl
KeyCDN (Europäische Alternative):
- Pro: DSGVO-konform, europäische Rechenzentren
- Pro: Transparente Preise
- Con: Kleineres Netzwerk als US-Anbieter
- Fazit: Wenn Datensouveränität wichtig ist
Praxis-Tipp aus unseren Projekten: Wir setzen oft Bunny.net als Primary CDN für Assets und Cloudflare als Secondary für Security-Layer ein. Best of both worlds ohne Vendor-Lock-in.
8. Sollte ich nach diesem Ausfall Cloudflare wechseln?
Die 1-Million-Dollar-Frage. Unsere differenzierte Antwort nach 15+ Jahren Consulting:
Bleibt bei Cloudflare wenn:
- Ihr den Free Plan nutzt und kein Budget für Alternativen habt
- Eure Website nicht mission-critical ist
- Der DDoS-Schutz für euch der Hauptgrund ist (hier ist Cloudflare unschlagbar günstig)
- 99,9% Uptime für euer Business ausreicht
Erwägt einen Wechsel/Multi-CDN wenn:
- 3 Stunden Ausfall direkten Umsatzverlust bedeuten
- Ihr bereits Cloudflare Pro/Business zahlt (dann sind Alternativen preislich vergleichbar)
- Compliance-Anforderungen höchste Verfügbarkeit fordern
- Ihr in der Vergangenheit mehrfach von Ausfällen betroffen wart
Hybride Lösung (unsere Top-Empfehlung):
Setup:
Assets & Media: Bunny.net (schnell, günstig)
Security Layer: Cloudflare (DDoS-Schutz)
Critical API: Direct Origin mit Rate Limiting
Failover: AWS CloudFront standby
Realistisch gesehen: Cloudflare hatte in den letzten 2 Jahren mehrere größere Ausfälle. Das ist ein Warnsignal. Aber: Alle großen CDNs hatten Probleme (AWS, Azure, Fastly). Die Lösung ist nicht „weg von Cloudflare“, sondern „nicht komplett abhängig von einem Anbieter“.
Entscheider-Perspektive: Berechnet den Business Impact einer 3-Stunden-Downtime. Wenn dieser Wert vierstellig oder höher ist, rechtfertigt das die Investment in Multi-CDN-Setup.
9. Wie prüfe ich, ob meine eigene Seite Cloudflare nutzt?
Schnell-Check für Developer und Entscheider:
Browser-Methode (30 Sekunden):
- F12 drücken → Network Tab
- Seite neu laden
- Beliebige Ressource auswählen → Response Headers
- Sucht nach
cf-ray,cf-cache-status,server: cloudflare
Command-Line (Developer-approved):
curl -I https://eure-domain.de | grep -i "cf-"
Wenn Output kommt → Cloudflare aktiv
Online-Tools:
DNS-Check:
dig eure-domain.de
nslookup eure-domain.de
Cloudflare-IPs erkennbar an Ranges wie 104.16.x.x, 172.64.x.x, 104.21.x.x
Pro-Tipp: Erstellt ein Monitoring-Dashboard, das alle eure Domains automatisch auf CDN-Nutzung prüft. Wir nutzen dafür ein simples Python-Script mit Cron-Job.
10. Was sollten Entscheider aus diesem Vorfall lernen?
Nach über 15 Jahren in Softwarequalität und Consulting sehen wir klare Patterns:
Die Zentralisierungs-Falle:
Das Internet wird zunehmend abhängig von wenigen Mega-Providern (Cloudflare, AWS, Azure). Ein Ausfall bei einem dieser Player legt Millionen Websites lahm. Das ist systemisches Risiko.
Vendor-Lock-in kostet:
Viele Teams setzen ausschließlich auf Cloudflare, weil es bequem und günstig ist. Wenn dann der Ausfall kommt, gibt’s keine Plan B. Diversifikation kostet upfront, spart aber bei Incidents.
SLA-Realität:
Cloudflare verspricht 100% Uptime SLA für Enterprise-Kunden. Reality Check: Auch Enterprise-Kunden waren betroffen. SLAs zahlen euch Geld zurück, aber holen keine verlorenen Kunden zurück.
Incident Response:
Teams ohne dokumentierten CDN-Failover-Plan brauchten Stunden, um zu reagieren. Teams mit Runbook konnten in Minuten umschalten.
Business Continuity:
Fragt euch: „Was passiert, wenn unser CDN für 3 Stunden ausfällt?“ Wenn die Antwort „Totalausfall“ ist, braucht ihr dringend einen Disaster-Recovery-Plan.
Unsere Consulting-Empfehlung für Entscheider:
- Risiko-Assessment: Berechnet Business-Impact von CDN-Ausfall
- Multi-CDN-Strategie: Minimum zwei Provider für kritische Services
- Monitoring: Automated Health-Checks mit Alerting
- Runbooks: Dokumentierte Failover-Prozeduren
- Testing: Quartalsweise Disaster-Recovery-Drills
Die harte Wahrheit: Ein paar Stunden Consulting-Investment in eine solide Multi-CDN-Strategie hätten vielen Unternehmen am 18. November Zehntausende Euro Umsatzausfall erspart.
Fazit: Kein CDN ist perfekt – Redundanz ist King
Der Cloudflare-Ausfall vom 18. November 2025 ist ein Weckruf für die gesamte Tech-Community. Nicht weil Cloudflare grundsätzlich schlecht ist – im Gegenteil, es ist für die meisten Use-Cases eine solide Wahl. Sondern weil dieser Incident zeigt: Kritische Infrastruktur darf nie von einem Single Point of Failure abhängen.
Kernaussagen aus 15+ Jahren Praxis:
- Multi-CDN-Setup ist kein Nice-to-have, sondern Business-Notwendigkeit für kritische Services
- Cloudflare bleibt eine gute Option – aber nicht als einzige Option
- Incident-Response-Planung muss CDN-Ausfälle explizit abdecken
- Monitoring und Alerting sind die erste Verteidigungslinie
Nächste Schritte für euer Team:
✅ Prüft eure CDN-Abhängigkeit: Welche Services sind betroffen bei Cloudflare-Ausfall?
✅ Business-Impact-Analyse: Was kostet euch 1 Stunde Downtime?
✅ Evaluiert Alternativen: Mindestens einen Backup-CDN identifizieren
✅ Implementiert Monitoring: Automated Health-Checks für CDN-Layer
✅ Dokumentiert Runbooks: Klare Failover-Prozeduren für das Team
Braucht ihr Unterstützung bei eurer CDN-Strategie?
Der Cloudflare-Ausfall hat euch gezeigt, dass eure Infrastruktur verwundbar ist? Ihr wollt eine resiliente Multi-CDN-Strategie implementieren, wisst aber nicht wo ihr anfangen sollt?
Mit über 15 Jahren Expertise in Softwarequalität, Open Source und Remote Consulting helfen wir euch, eine robuste, ausfallsichere Infrastruktur aufzubauen – keine theoretischen Konzepte, sondern battle-tested Lösungen aus echten Production-Umgebungen.
Kontakt: roland@nevercodealone.de
Gemeinsam analysieren wir eure Infrastruktur, identifizieren Single Points of Failure und implementieren pragmatische Redundanz-Strategien die euer Budget nicht sprengen.
Never Code Alone – Gemeinsam für bessere Software-Qualität!
