«Всі кладуть всі яйця в один кошик, а потім дивуються, коли виникає проблема. Компанії повинні подбати про надмірність і відмовостійкість», — заявив Дауді.
Cloudflare забезпечує роботу значної частини інтернету — минулого року компанія заявила, що близько 20% вебсайтів працюють через її мережу. Вона також обслуговує 35% компаній зі списку Fortune 500, а також «мільйони» інших клієнтів, пише The Verge.
Швидка робота та високий рівень безпеки Cloudflare роблять її популярним вибором для вебсайтів по всьому світу, але збій 18 листопада привертає увагу до того, наскільки концентрованою стала індустрія вебінфраструктури.
Після того як нещодавній збій в AWS вивів з ладу безпечний месенджер Signal, президент сервісу Мередіт Віттакер заявила, що у компанії не було іншого вибору, окрім як використовувати великого постачальника хмарних послуг. «Практично весь стек належить 3-4 гравцям», — написала вона.
Але навіть якщо компанії покладаються лише на декількох постачальників рішень для вебінфраструктури, їм варто подбати про запасний план. «Відключення будуть траплятися, і вони будуть траплятися все частіше. Радіус ураження буде продовжувати зростати. Питання в тому, що ви з цим робите», — зазначив Дауді.
Хоча Microsoft і AWS пов’язали свої перебої в роботі з проблемами, пов’язаними з DNS — системою, яка перетворює доменні імена вебсайтів в IP-адреси — Cloudflare виявила, що причиною перебоїв в роботі був один файл.
«Основною причиною перебоїв в роботі був конфігураційний файл, який автоматично генерується для управління трафіком загроз. Файл перевищив очікуваний розмір записів і спричинив збій у програмній системі, яка обробляє трафік для низки послуг Cloudflare, — сказала речниця Cloudflare Джекі Даттон.
Виглядає дивовижним, що така проблема з файлом може вивести з ладу цілі сегменти Інтернету, але для таких великих компаній, як Cloudflare, це може статися.
Сергій Колесниченко, COO в українському хмарному провайдері Ucloud, відзначав, що потужну інфраструктуру Cloudflare «важко завалити атакою», але не виключав виникнення «людського фактора». Він розповів dev.ua, що якщо цей фактор вплине на 1–2% всієї інфраструктури, в масштабах компанії це буде небагато, але для користувачів буде здаватись, що вони є свідками катастрофи.
На думку Дауді, подібні помилки будуть повторюватися.
«Ви будете скаржитися на це щоразу, коли Cloudflare чхне? Або ви будете будувати навколо цього?», — поцікавився очільник Catchpoint.

Добавить комментарий