Každý, kdo si od loňského listopadu intenzivně hrál s ChatGPT, dříve nebo později narazil na stejnou překážku. Možnosti využití velkého jazykového modelu jsou ohromné, ale jeho „znalosti“ končí zářím 2021.

Obsah, který se na webu objevil později, se už do tréninkových dat nedostal. Nyní však dostal generátor textu k ruce prohlížeč Bing od Microsoftu a umí si aktuální informace sám dohledat.

Společnost OpenAI, tvůrce ChatGPT, oznámila start experimentů s přístupem na internet už koncem března. Ze začátku byl vylepšený nástroj k dispozici jen omezenému množství uživatelů z čekací listiny. V polovině května však získali k betaverzi přístup všichni předplatitelé prémiové verze ChatGPT, která momentálně vychází na zhruba 550 korun měsíčně.

Chatbot s přístupem na internet vznikl díky strategickému partnerství OpenAI s Microsoftem. Technologický gigant nalil do nadějného AI startupu miliardy dolarů, poskytl mu svá cloudová řešení a už dříve vybavil schopnostmi ChatGPT svůj vyhledávač Bing.

Teď to funguje i naopak, když si chatbot potřebuje dohledat aktuální informace, zadá do Bingu klíčová slova a postupně prochází stránku za stránkou.

Máte ChatGPT Plus? Takhle zprovozníte novinku s vyhledáváním na internetu:

1. Klikněte na nastavení účtu

2. V kolonce „Beta features“, zaškrtněte možnost „Browse with Bing“ 

3. Zahajte nový chat, zvolte model GPT-4 a v roletce pod ním možnost „Browse with Bing“  

4. Jestli ji nevidíte, přihlaste se do ChatGPT nanovo

„Náš plug-in pro prohlížení webu zobrazuje navštívené webové stránky a cituje jejich zdroje v odpovědích ChatGPT. Tato přidaná vrstva transparentnosti pomáhá uživatelům ověřit přesnost odpovědí modelu a také odkazuje na tvůrce obsahu,“ píše OpenAI na svých stránkách. A dodává, že chatbot svým sběrem informací servery jednotlivých stránek nezahlcuje a jejich majitelé mohou automatizovanému projíždění snadno zabránit. 

Má to ale i další stinné stránky. OpenAI totiž připouští, že ChatGPT vybavený internetovým vyhledávačem může provádět „všechny typy nežádoucího chování“, jako je například zasílání podvodných a spamových e-mailů či obcházení bezpečnostních omezení.

Vývojáři se proto neustále snaží novinku „zneužívat“ a na základě zjištění implementují nové bezpečnostní prvky. Společnost upozorňuje, že aktuálně dostupný chatbot je zatím experimentální funkcí, co se s dalším vývojem může změnit.

Dostat z velkého jazykového modelu s přístupem na internet nejen bezpečný, ale i spolehlivý výstup je značně obtížným úkolem. OpenAI se o tom přesvědčila už u svého experimentálního systému WebGPT z roku 2021. Ukázalo se, že sklouzává k citacím nespolehlivých zdrojů a informace účelově vytrhává z kontextu.

Přesto jsem neodolal a ChatGPT vyzbrojený Bingem vyzkoušel. Jako první problém se ukázala čeština, nástroj pracuje mnohem lépe s angličtinou, což se ukázalo u dotazu na nedávno představený konsolidační balíček české vlády.

Po pár minutách generování odpovědi provázeného chybovými hláškami z něj vypadla pouze omluva s odůvodněním, že zdroje nejsou v angličtině nebo nejsou snadno dostupné na globální úrovni. Pro kvalitní výstup v češtině bylo potřeba ubrat z požadavků a zeptat se na něco jednoduššího, například na počasí.

V průběhu vytváření odpovědi je vidět, jaká slova chatbot vyhledává a na jaké konkrétní weby „kliká“. U mého dotazu na klíčové problémy aktuálního vyjednávání o dluhovém stropu USA, napsaného pro jistotu v angličtině, poměrně chytře zvolil jako zdroj Wikipedii a agenturu Reuters. Výsledkem byl stručný popis současného stavu, který odpovídal realitě.

Protože píšu hlavně o byznysu, zajímalo mě, jak si chatbot poradí třeba s kvartálním reportem firmy.

U dotazu na výsledky Netflixu z prvního letošního čtvrtletí vedly jeho kroky nejdřív na firemní stránky pro investory, tak jak by to nejspíš udělal i lidský profesionál, pak však sestavil odpověď na základě článku o výsledcích na americkém byznysovém webu CNBC. Nutno říct, že i takto to odpovídalo realitě.

Čím komplexnější či otevřenější dotaz, tím déle chatbotu trvá vyhledávání a vytváření odpovědi. Více se zadrhává a někdy se i „zacyklí“ na jedné stránce, kterou projíždí pořád dokola, po pár minutách generování celý proces zastaví a musíte začít znovu.

V případě potřeby ale někdy dokáže své vyhledávání přizpůsobit a upravit klíčová slova, což mě zaujalo například u otázky, zda se momentálně na trzích vytváří kolem tématu umělé inteligence bublina. 

Zajímal mě i potenciál nového nástroje ve vyhledávání akademických textů, protože dosavadní verze ChatGPT si u generování citací odborných publikací byla mnohdy schopná svůj výstup zcela vyfabulovat.

Na žádost o doporučení vhodných zdrojů k tématu Napoleonovy blokády britských ostrovů reagoval chatbot s internetem dvěma skutečnými odbornými články. A také doporučil využít profesionální databáze, jako je JSTOR či SpringerLink. 

Možnosti využití ChatGPT s přístupem na internet se zdají být neomezené. Je však nutné mít na paměti, že pořád jde o experimentální technologii a přistupovat k ní s náležitou opatrností.

Odborníci na umělou inteligenci, se kterými jsem měl možnost téma velkých jazykových modelů konzultovat, upozorňují hlavně na to, aby do nich lidé nezadávali jakékoli osobní údaje a aby veškeré výstupy důsledně kontrolovali a ověřovali z nezávislých zdrojů.

Modely typu ChatGPT totiž ve skutečnosti nepřemýšlejí nad významem slov, ale generují je na základě matematické pravděpodobnosti. Z obřích datasetů plných textu z internetu jsou schopné určovat, jaké výrazy obvykle následují po určité sekvenci slov. 

Díky tomu dají během pár sekund dohromady smysluplný text na první pohled nerozeznatelný od lidského, ale do značné míry si u toho „vymýšlejí“. ChatGPT vybavený vyhledávačem Bing si vymýšlí méně, ale ani na jeho výstupy zatím nelze v žádném případě spoléhat.