O svátcích sledovaly miliony lidí na kanálu Disney+ dokument Get Back a v v něm famózní znovuzrození kapely Beatles v pestré škále barev. Kolik z diváků si však při sledování uvědomilo, že tatáž technologie, která na obrazovce znovu vdechla život ikonické kapele, stejně dobře slouží i méně bohulibým záměrům?

Algoritmy použité k vytvoření takzvaných deepfakes, tedy umělou inteligencí sestavených imitací, které jsou k nerozpoznání od nahrávky skutečných lidí, mají totiž i odvrácenou stranu. A odborníci na kyberbezpečnost se ve velkém shodnou, že představují jednu z největších výzev, s níž se bude muset společnost v nadcházejících letech vypořádávat.

O deepfakes slýcháme už několik let, ale v poslední době jejich vývoj nabírá znepokojivě rychlé tempo. Ostatně už dnes existují stránky, které vám pomohou dokonale ponížit libovolného člověka tím, že jeho obličej z jinak nevinného videa napasují na pornografický materiál.

V politické sféře jsme už zase viděli a slyšeli pronášet Baracka Obamu cizí věty. A přestože dnes už starší video s Obamou vzniklo z osvětových důvodů nebo například až děsivě přesvědčivý tiktokový účet falešného Toma Cruise je hlavně vtípkem, potenciál ke zneužití deepfakes je obrovský.

Každý si asi dokáže představit situaci, ve které by ho deepfakes mohly osobně poškodit. Třeba kdyby jeho dvojník na uniklém videu pronášel nechutné rasistické výroky, nebo se sexisticky vyjadřoval o ženách.

Dnes z toho zřejmě nikdo z nás reálný strach nemá, ale je téměř jisté, že do několika let se to změní. Protože, když už byly jednou deepfakes vypuštěny do světa, jen těžko se to dá vrátit zpět, podobně jako tomu bylo v báji o Pandořině skříňce z řecké mytologie.

Zatímco specialisté a nadšenci zdokonalují své nástroje, část z nich se už pomalu dostává i k širšímu publiku. Na Githubu již existuje přes osmdesát open-source aplikací na tvorbu deepfake médií. A to jsou ještě ty méně pokročilé. Dokonce už mám s takovou technologií sám zkušenost – pomocí služby Overdub od Descriptu jsem byl schopen vložit slova do úst svému vlastnímu virtuálnímu avatarovi.

Nedávno jsem na toto téma diskutoval s Ericem Hallerem, který má na starosti ověřování identity ve společnosti Experian, a podle něj si lze tvorbu deepfakeů vyložit jako poslední stadium nikdy nekončící války mezi byznysem a paděláním.

„Jen si vzpomeňte na staré špionské filmy, kde agenti sledují nějaký videozáznam a snaží se rozklíčovat, zda je reálný, nebo je to podvrh. A to se děje i dnes – nic nového pod sluncem,“ vysvětloval.

Je však třeba si uvědomit, že i když v dokumentu o Beatles měla umělá inteligence za úkol zejména dolaďování a restaurování detailů, jako je v tomto případě barva, vyšetřovatelé se mohou setkat také s materiály, které jsou stoprocentním dílem počítače.

A tady je zatím první dobrá zpráva. Tato technologie ještě není v takovém stavu, aby dokázala vyrobit přesnou a dokonalou kopii. Není tak příliš pravděpodobné, že by v současné době byla schopna vytvořit deepfakes na takové úrovni, že by zmátly někoho, kdo zná subjekt samotný.

Můj avatar s hlasem propůjčeným umělou inteligencí je dostačující pro virtuální prezentaci nebo webináře. Kdo mě však zná, identifikuje drobné rozdíly v intonaci a dikci a pozná, že jde o počítačem generovaný obsah.

Haller podotýká, že i tvorba deepfakeových videí s Tomem Cruisem – ta jsou dost možná nejsdílenějším virálním příkladem tohoto fenoménu – vyžaduje práci zkušeného herce nebo imitátora, který je schopen věrně napodobit osobitý styl řeči Toma Cruise.

Umělá inteligence poté pomocí algoritmů známých jako generativní adversariální sítě (GAN) zvuková a obrazová data pouze „rozpije“, aby spojení s hollywoodskou hvězdou bylo ještě dokonalejší.

A výsledek toho všeho je podle mého názoru zatím málo dokonalý na to, aby většinu lidí zmátl. Řekl bych, že reakce většiny lidí, kteří zhlédnou video, bude něco v tom smyslu, že jde o „dost věrohodný fake“, spíš než: „To je Tom Cruise!“ Ostatně posuďte sami. Ale je až děsivé, jak málo k téhle hranici zdánlivě zbývá.

Nebezpečí totiž spočívá v tom, že zatím stále jen zakoušíme, čeho všeho je umělá inteligence vůbec schopna. Je dost dobře možné, že za pět či deset let, ale také třeba za rok budeme mít technologii, jejíž výtvory budou od skutečnosti už skutečně k nerozeznání.

Už jsou ostatně známy případy, kdy zločinec za pomoci umělého hlasu oklamal bankovní systém a dosáhl přesunu peněz na vlastní účet. V jednom takovém případě šlo dokonce o 35 milionů dolarů.

Pracovní náplní Hallera a dalších v jeho odvětví je mimo jiné právě snaha podobným útokům technologicky zabránit. „Může jít navíc o úplně neexistující osobu,“ vysvětluje. „A vytvořit někoho, kdo vůbec neexistuje, je pravděpodobně nižší meta než simulovat reálnou osobu a tu zapojit do interaktivního dialogu.“

Je tu ale děsivá hranice, ke které se tahle technologie blíží mílovými kroky. „Můj největší strach je, že by dokázala přesvědčit někoho, kdo zná toho, s kým si myslí, že komunikuje. K tomuhle je podle mě ale stále daleko. Vyžaduje to dokonalou souhru technologií, z nichž každá musí být dál, než je nyní. Ale ta nižší meta – ta už je opravdu dost věrohodná i dnes,“ říká Haller.

Navíc i rizika toho, že by vás mohla deepfakes poškodit, jsou stála zřetelnější, vezmeme-li v úvahu tempo, jakým své životy posouváme do onlinu. Dvojnásob, pokud je v dohledné budoucnosti těsněji svážeme s digitálním vesmírem, jak to slibuje třeba koncept metaverza.

„Někteří kolegové říkají, že kvůli pandemii se do předchozích osmnácti měsíců smrsklo možná deset let digitálního vývoje. A platí to i na straně uživatelů a jejich ochoty technologie využívat. Ostatně i můj pětadevadesátiletý tchán si dnes objednává potraviny přes internet. To by před rokem a půl skutečně nepřicházelo v úvahu,“ poznamenává Haller.

Navíc čím dál větší část naší komunikace probíhá přes Zoom a jemu podobné služby, ať už jde o pracovní schůzky, nebo konzultace s lékaři, a tak je zřejmé, že naše fyzické já bude nahrazováno tím digitálním čím dál častěji. Kvůli tomu bude práce expertů na rozpoznávání identity, jako je Haller, pro společnost stále důležitější.

Neměli bychom nicméně přehlížet ani to, že tyto technologie nám přinášejí i leccos dobrého. Nejenže dokážou naše oblíbené filmové hvězdy přivést ze záhrobí nebo je omladit, ale kreativní nebo generativní umělá inteligence by také mohla lidstvu z ramen sejmout velkou nálož nudné a repetitivní práce, kterou dnes musí dělat člověk.

Rovněž je velmi užitečná pro tvorbu syntetických dat, jejichž přirozený sběr by byl náročný či nebezpečný a která umožňují preciznější trénink umělé inteligence a robotů. Může se jednat třeba o algoritmy pro autonomní řízení bez rizika reálného provozu nebo zkušební lékařské zákroky, kterými neohrožujeme život a zdraví pacientů ani zvířat.

Umělá inteligence může mít na společnost skutečně transformativní vliv a její potenciál simulovat (nebo také falšovat) reálný svět je zkrátka jedním z hlavních důvodů, proč to je vůbec možné. Snažit se o to, aby rozvíjení jejího potenciálu bylo bezpečné a bez napáchaných škod, je proto důležitým úkolem pro ty, kdo technologie vyvíjejí a zavádějí.