Jan Pichl je vedoucím týmu vědců a studentů ČVUT, který vyvíjí chytrého konverzačního chatbota Alquist. Nedávno se s ním potřetí v řadě probojovali do finále soutěže Alexa Prize pořádané Amazonem, v níž se špičkové univerzitní týmy snaží vytvořit umělou inteligenci schopnou vést plynulou konverzaci s člověkem. Pichl je také členem našeho výběru 30 pod 30.
Po internetu kolují články o tom, jak se chatbot s umělou inteligencí jménem Margaret zhroutil při snaze rozluštit řeč Donalda Trumpa. Někomu to možná přijde vtipné, ovšem z podstaty fungování těchto botů nejde o nic překvapivého.
Systémy zpracovávající mluvený projev potřebují v proudu slov identifikovat jednotlivé segmenty, se kterými mohou dále pracovat. V podstatě jde o rozdělení dlouhé promluvy na jednotlivé věty, případně o rozdělení souvětí na jednotlivé části.
Bot se tedy učí strukturu jazyka z velkého množství dat: typicky z novinových článků, wikipedických hesel či jiných lehce dostupných zdrojů. Takto naučený bot může být dále „doučen“ na konkrétních datech – v tomto případě na projevech amerického prezidenta.
Předpoklad je, že struktura jazyka je stále stejná. A v tomto předpokladu je onen kámen úrazu. Trumpovy věty často postrádají hlavu a patu a „vyrovnaný génius“, jak americký prezident sebe sama nazývá, pracuje například se slovesy po způsobu dítěte předškolního věku.
Bot, který velmi dobře znal vzorce z běžně zkonstruovaných vět, najednou vidí sérii slov, která je na míle vzdálená tomu, co zpracovával doposud. Což může v krajních případech vést i k pádu systému, který se při pokusu delší projev rozložit na jednotlivé části zcela zamotá.
Řešením je systém vůbec neučit pravidla angličtiny a naučit ho pouze na nesourodý tok asociací, používaný Donaldem Trumpem.
Podle deníku L. A. Times se chatbot Margaret musel odnaučit pravidla spisovné angličtiny a přirozenou větnou skladbu a jeho tvůrci ho přeprogramovali na speciální „trumpštinu“. Lze si jen domýšlet, jak by dopadlo jeho setkání s premiérem, který chce znovu motýle…