Jedna jediná aktualizace způsobila celosvětovou paniku a zmatek. Mnozí z expertů mluví o největším IT výpadku v historii. Kolaps postihl téměř devět milionů zařízení se systémem Windows a kromě běžných firemních uživatelů se dotknul také kritické infrastruktury.
„Ukázal nám, jak moc jsme na technologiích závislí a zranitelní,“ říká v rozhovoru pro Forbes Tomáš Budník, bývalý ředitel O2 a zakladatel investiční skupiny Thein.
Jak vnímáte páteční výpadek Microsoftu?
V první řadě je potřeba říct, že Microsoft není primárním viníkem zmiňovaného výpadku. Je sice fakt, že postiženy byly jen systémy s operačním systémem Microsoft Windows, ale příčinou byla aktualizace XDR platformy Falcon společnosti CrowdStrike, která kvůli shodě řady okolností způsobila pád zmíněného operačního systému.
Jaká rizika výpadek odhalil do budoucna?
Výpadek ukázal zásadní závislost na technologii, která je jednoduše zranitelná – konkrétně na operačním systému Windows, který je používán jak na pracovních stanicích a serverech, ale i v pokladních systémech, terminálech, nebo dnes již i v „chytrých“ spotřebičích.
Pokud by byl tento operační systém navržen jako odolnější, nepřipustil by, aby jej nástroj třetí strany dokázal ochromit způsobem, jakého jsme byli svědky. Na druhou stranu, mít bezpečnostní alternativu třetích stran nad operačním systémem Windows je výhoda, protože jen tak mají zákazníci možnosti volby najít řešení, které jim vyhovuje, a nemusejí se spoléhat jen na Microsoft.
Jak moc jsou firmy provázené a nakolik je to nebezpečné?
V posledních letech je možné zaznamenat trend, kdy se IT nástroje a systémy koncentrují do rukou malého počtu obřích technologických hráčů. Příkladem může být právě Microsoft nebo Google. Z principu to není špatné ani nebezpečné, ale klade to na dané firmy větší nároky na dodržování standardů, poskytování dostatečné kvality daných nástrojů a otevřenosti pro alternativní řešení třetích stran.
Které obory takovými výpadky utrpí nejvíc?
Záleží na tom, jak budeme definovat ztrátu. CrowdStrike zcela jasně utrpěl citelnou ztrátu roky budované reputace, která se ihned promítla do snížení tržní hodnoty na burze (první den minus dvanáct procent, pozn. redakce). Společnosti poskytující služby ztratily zisk za dobu, kdy nebyly jejich IT systémy dostupné. Lidé, kteří neodletěli na dovolenou, zase byli podrobeni značnému stresu.
Naštěstí vinou výpadku nedošlo k žádné tragické události. Nejvíce to firmy a lidé pocítili v oblasti služeb, kde byla potřeba okamžitá interakce – typicky letecký průmysl, finanční a zdravotnické služby.
A kde je riziko, že výpadek bude mít největší následky?
Nejvýznamnější jsou jednoznačně služby kritické infrastruktury – telekomunikace, energetika, zdravotnictví, jejichž funkce má dopad na fungování celé společnosti. Na druhou stranu takové organizace mají, nebo by měly mít, zpracované disaster recovery plány, které je možné aktivovat ve chvíli IT výpadků postihujících jejich fungování a zajišťování služeb.
Jaká je pravděpodobnost, že se něco takového bude v budoucnu opakovat?
Opakování podobné chyby kódu obecně vyloučit nejde, ale pokud si výrobci i uživatelé z této bezprecedentní události vezmou ponaučení, není výskyt v tak masivním rozsahu příliš pravděpodobný.
Jak výpadek ovlivní kredibilitu Microsoftu a vůbec celého oboru?
Jak jsem již zmiňoval, Microsoft je sice částečným viníkem z toho důvodu, že jejich operační systém je relativně málo odolný, ale nenese hlavní vinu na vzniklém incidentu. Vzhledem k tomu, že IT je nedílnou součástí našich životů, tak kredibilita oboru ovlivněna nebude. Jiná situace může nastat u společnosti CrowdStrike. Věřím, že si se situací poradí, ale nadcházející měsíce pro ni pravděpodobně budou velmi těžké.
Co teď podle vás bude následovat?
Předpokládám, že dojde ke dvěma zásadním událostem. První z nich budou žaloby postižených firem, které mohou mít zásadní vliv na další životaschopnost společnosti CrowdStrike. Druhá událost bude souviset se změnou chování zákazníků, kteří minimálně v nejbližší době budou opatrnější při kontrolách dodavatelského řetězce a při návrzích nových informačních systémů.
Existuje nějaký způsob, jak by se tomu dalo do budoucna předejít, snížit riziko nebo případné dopady takového výpadku?
Musí dojít k reakci na straně dodavatelů, respektive výrobců technologií, stejně jako na straně zákazníků. Podle dosavadních informací vedla k incidentu řada školáckých chyb, které by se stávat neměly.
O jaké školácké chyby šlo?
Abych to zjednodušil, představte si software od CrowdStrike jako antivirus. Každý antivirus se pravidelně aktualizuje a přibývá v něm další obsah – popisy virů, útoků, aby věděl, s čím se potýká a jak s tím pracovat do budoucna. A když CrowdStrike v pátek udělal aktualizaci takového obsahu, tak si dobře neotestoval, co všechno v něm spouští. Kdyby si to pořádně natestoval na různé varianty a scénáře, tak by přišel na to, že tam něco spouští špatně.
Zákazníci tomu nějak nemohli zabránit. Obvykle si firmy software testují, když ho zavádějí nově, nikoli však při každé aktualizaci. To by nikoho nenapadlo testovat. Aktualizace navíc často probíhá automaticky.
Co by se tedy mělo změnit do budoucna?
Výrobci by měli revidovat procesy a zajistit, aby k podobnému incidentu již dojít nemohlo. Zákazníci by naopak měli být opatrnější a při navrhování kritických systémů diverzifikovat technologie a mít připraveny disaster recovery a business continuity plány.