Je šlágrem sociálních sítí. Platforma na bázi umělé inteligence, která je na první pohled schopna odpovědět na každou otázku – a ještě vám ji přebásní ve stylu Františka Halase.

Do veřejného prostoru se dostala ChatGPT během loňského listopadu a od té chvíle pro miliony lidí diskutuje, skládá básně, píše eseje a zamýšlí se nad smyslem života v bezpočtu konverzací a také bezpočtu světových jazyků na následující adrese.

Když píšete o něčem takovém článek, láká vás samozřejmě pokušení ho celý hodit probírané umělé inteligenci na hlavu a nechat ji text napsat. Což je samozřejmě přesně to, co jsem udělal. „Co je ChatGPT a proč by mě to mělo zajímat,“ zeptal jsem se okénka pro vstupní text.

A umělá inteligence odpovídá: „ChatGPT je jedním z mnoha velkých jazykových modelů, které byly vyvinuty společností OpenAI. Tyto modely jsou vytvořeny na základě vzorů a pravidel, které se naučily ze stovky milionů textových dokumentů, a jsou schopné odpovídat na širokou škálu otázek a úloh z různých oblastí. ChatGPT je konkrétně navržen tak, aby mohl odpovídat na otázky a úkoly v reálném čase pomocí přirozeného jazyka.“

Tím odpověď nekončí. „ChatGPT vás může zajímat, pokud máte zájem o technologie umělé inteligence nebo jazykové modely a chcete se dozvědět více o tom, jak fungují a co jsou schopné dělat,“ pokračuje výsledek zadání.

„ChatGPT může také být užitečný pro vývojáře, kteří chtějí využít jeho schopnosti pro vytváření aplikací nebo služeb založených na přirozeném jazyce. Navíc může ChatGPT pomoci při automatizaci úloh nebo odpovědích na otázky v různých oborech, a může tedy mít široké spektrum použití.“

Úchvatné, nicméně taky věcné a upřímně – vcelku suché. A tak jsem ChatGPT ponoukl: „Řekni to písní.“

ChatGPT, ChatGPT
Je to velký jazykový model,
Který umí odpovědět na otázky a úkoly
V přirozeném jazyce, to je skvělý pokrok

Může pomoci vývojářům
Vytvořit aplikace nebo služby
Založené na přirozeném jazyce,
To je ChatGPT, to je ChatGPT

Může pomoci s automatizací úloh
A odpovědí na otázky v různých oborech,
To je ChatGPT, to je ChatGPT

Takže pokud máte zájem o technologie umělé inteligence
A chcete se dozvědět více o jazykových modelech,
ChatGPT je pro vás to pravé,
ChatGPT je pro vás to pravé.

OK, takže ChatGPT je to pravé. Má nicméně svoje limity. Navzdory tomu, že si s ním na internetu povídáte, připojen k internetu není, a tak jej novinář v rámci čtyřiadvacetihodinového zpravodajského cyklu využít nemůže.

ChatGPT si prostě nemůže udělat aktuální výzkum, a tak nezná odpovědi na předpokládanou výši inflace v České republice v novém roce, ani výhled do variant řešení konfliktu na Ukrajině. Co ovšem umí, je namíchat mnohdy pozoruhodný mix informací, které má při svém učení k dispozici i offline. Jeho odpovědi na zadání typu „Jmenuj pět základních bodů filozofie Johna Locka“ i chytáky typu „Jak by fungovala jaderná fúze ve světě bez zákonů termodynamiky“ jsou prosté, věcné a informované.

Ale nechme umělou inteligenci chvilku vesele básnit a přehrabovat se skripty a optejme se na ni lidských profíků. Jak vlastně ChatGPT z produkce výzkumné laboratoře pro umělou inteligenci OpenAI funguje?

„K tomu si musíme přiblížit, jak funguje obecně model umělé inteligence,“ nastiňuje Tomáš Lysek, CEO a spoluzakladatel společnosti Coworkers.ai, která se na českém trhu zabývá právě oborem inteligentních voicebotů a chatbotů (a kterou na podzim koupila softwarová společnost Daktela).

„ChatGPT vychází z GPT 3.5, který má zjednodušeně řečeno za úkol predikovat další slovo v rozepsané větě,“ vysvětluje Lysek. Chatbotu od OpenAI tak dáte například větu „Na rande jsme šli do…“ a on předvídá možnosti: do kina, do divadla, do restaurace. „V generování ale dokáže pokračovat a vymyslet i třeba, jak rande dopadne,“ pokračuje.

Tento model se přitom ChatGPT naučil na obrovském množství dat. „OpenAI sice přesně nespecifikovala, jaká data použila, ale v komunitě se má obecně za to, že se použil i dataset zvaný common crawl, který je zjednodušeně řečeno kopií celého internetu a obsahuje petabyty dat – to jsou tisíce terabytů,“ konstatuje Lysek.

„Velmi zjednodušeně se dá říct, že GPT 3.5 byl přeučen na vedení složité konverzace včetně složitých otázek. Bohužel do dnešního dne nebyl vydán oficiální vědecký článek a není možné zjistit, kolik konverzací v učení bylo použito, jestli byly všechny ručně vytvořené, kolik se jich stáhlo z internetu a jak přesně fungoval proces učení,“ připomíná.

Nejdražší je proces učení.

Víme nicméně, že celá ta legrace není zadarmo. Strojové učení vynálezů od OpenAI včetně ChatGPT by se neobešlo bez frameworku v hodnotě jedné miliardy dolarů, který poskytuje startup Anyscale, spadající pod americkou venture kapitálovou společnost Andreesseen Horowitz. A u toho investice do upovídaných chatbotů budoucnosti zdaleka nekončí.

„Nejdražší na tvorbě takového modelu je proces učení,“ říká Lysek. „Probíhá stylem, kdy máte vstup A a chcete výstup B. Model musí zpracovat vstup, vygenerovat výstup a upravit se sám tak, aby příště na vstup A vygeneroval lepší výstup B. Tento postup je poté nutno opakovat pro celý dataset a jeden takový průchod většinou nestačí.“

A jak vlastně model funguje? „Lze si ho představit jako velké množství čísel, které se má ve správném pořadí sečíst a vynásobit se vstupem. ChatGPT má těchto čísel, správně tedy vah neuronů, 175 miliard. Z toho je zřejmé, že jeden průchod modelem trvá nějaký čas – stovky milisekund až jednotky sekund.“

Obecně se učení a průchody provádí na grafických kartách, které dokážou výpočty počítat paralelně a proces velmi urychlit. „Pokud by se měl na jedné grafické kartě naučit model GPT 3.5, učený na datasetu o velikosti tisíce terabytů, trvalo by to přibližně tři sta let. Je tedy nutné použít více grafických karet,“ vysvětluje Lysek. OpenAI má ve svém superpočítači deset tisíc karet a GPT 3.5 se dokázala vše naučit za několik měsíců.

„Nejedná se o standardní grafické karty, které se vyskytují v běžných PC, ale o speciální karty, které v různých generacích stojí od 250 tisíc do 750 tisíc korun.“

Ovládni AI!
Vydání Forbesu Ovládni AI!

Je tedy ve své stávající podobě ChatGPT krokem směřujícím k nějakému Centrálnímu mozku lidstva ze sci-fi seriálu Návštěvníci? Nebo je to prostě digitální papoušek, který kopíruje to, co někde přečetl, a montuje to do koherentních vět?

„Přijde na to,“ odpovídá Milan Mitošinka ze společnosti Cleverance, která se krom jiného zabývá vývojem AI a chatbotů. „Naučit umělou inteligenci skládat básničky nebo sepsat něco z informací, kterých je plný internet, je v principu velmi jednoduché. Ale k poučenému pospojování rozumných informací a vytvoření originální strukturované formy jsme podle mého stále ještě velmi daleko.“

Mitošinka poznamenává, že u básniček, které ChatGPT tvoří, se nikdo nezamyslí nad tím, zda jsou vlastně správně, nebo ne. Stejně tak je pro platformu vlastně prosté napsat ročníkovou práci na dané téma, protože podobných prací má k dispozici nepřeberné množství. „Umělá inteligence se umí naučit, kam si pro nějaké texty sáhnout, kde najít online knihy, jak si z nich vytáhnout potřebné kusy a nějak to dát dohromady. Výsledek má ale daleko k ideální strukturované povaze.“

A je tu ještě jeden zádrhel: umělá inteligence typu ChatGPT není schopná si vytvořit vlastní logické mantinely, kudy se v diskusi ještě ubírat, a kde už se nechá někým napálit a vyrotovat do úplných absurdit. „Dokud toto nebude automatické a systém sám sebe nebude schopný limitovat, nebude prakticky využitelný,“ domnívá se Mitošinka.

V této souvislosti připomíná odstrašující případ neuronové sítě Tay od Microsoftu, která po pár hodinách svého života začala publikovat urážlivé, rasistické a sexistické tweety. Microsoft chatbota následně sprovodil ze světa a incident vysvětlil tím, že nebohá umělá inteligence se stala terčem internetových výtržníků, kteří ji svedli na scestí cíleně a záludně mířenými konverzacemi.

„Čím více lidí do takového procesu pustíme a oni budou umělou inteligenci učit, tím lépe pro ni, ale případ Microsoftu ukázal odvrácenou stranu mince,“ varuje Mitošinka. „Jsou to dvě linky, které musí jít ruku v ruce. První je – OK, ptejte se mě na nesmysly a já s vámi budu komunikovat. Nesmí ale chybět druhá, vývojová linka, kde se bude AI učit skutečně cíleně.“

A tak zbývá už jen poslední otázka, tentokrát znovu na ChatGPT: „Kdy ovládne umělá inteligence svět?“ Místo odpovědi se však na obrazovce jen rozbliká kurzor. ChatGPT krypticky mlčí, neodpovídá… A kurzor v textovém poli bliká jako odpočet nějakých tajuplných hodin.