Компанія Cloudflare пояснила, що масштабний збій, який стався 18 листопада, був викликаний некоректним налаштуванням бази даних ClickHouse. Це спричинило появу великої кількості дублікатів даних, що перевищило ліміти пам’яті і призвело до виходу з ладу основної проксі-системи Cloudflare. Це призвело до блокування реального трафіку для деяких клієнтів. Щоб уникнути подібних проблем у майбутньому, компанія вжила кілька заходів, включаючи посилення обробки конфігураційних файлів, розширення кількості “kill switch”, що вимикають функції, та перегляд режимів відмови в ключових проксі-модулях. Cloudflare оцінює, що близько 20% інтернет-трафіку проходить через їхню мережу, тому будь-які проблеми можуть мати глобальний вплив.
Cloudflare пояснила причину масштабного збою
