Technologii umělé inteligence mnoho lidí využívá téměř každý den, aniž by o tom věděli. Označení patří programům, které používají například Google Maps nebo internetové překladače. Pozornost získaly v poslední době také jazykové modely jako chatbot ChatGPT. Umělá inteligence je strojové učení, název je spíše marketingovým tahem, řekl David Herel z Českého vysokého učení technického.
„Například překladače dříve fungovaly jinak než nyní. Teď fungují na principu neuronových sítí. Neumějí to vyhledávat nebo upravovat text, je to naučené pouze překládat,“ uvedl Herel. „Jazykový model funguje na principu takové černé skříňky, která se snaží uhádnout další slovo, což dělá z dat na internetu,“ dodal.
ChatGPT a jemu podobné mohou působit podle Herela na člověka jako myslící stroj, ale je to pouze program, který se snaží uhádnout každé nadcházející slovo. Proto v případě, když neví, co má následovat, tak si může vymýšlet. Záleží, co má jazykový model ve svých tréninkových datech. „Vývojáři si mohou hodně modifikovat ten model a hodně záleží, z jakých dat model vychází. Každý model se od sebe může z tohoto důvodu lišit,“ řekl.
Problematickým u jazykových modelů je podle Herela fakt, že jsou trénované se zpožděním. Cokoli co se stane později, než je v tréninkových datech, model neví a vymýšlí si. Většina společností, co vyvíjejí jazykové modely, to ale neuvádí, protože to vnímají jako obchodní tajemství. Čím jsou lepší data, tím i výsledný produkt a kvůli konkurenci takové informace nesdělují.
Zajímavé na jazykových modelech je, že velice dobře funguje takzvané hraní rolí. Například mu člověk zadá pokyn, aby napsal odpověď na otázku jako studentka střední školy nebo naopak akademik. Herel to vysvětluje tím, že model sbírá z dat i kontext.
„Když mu řeknete, ať napíše povídku, tak ji napíše jako průměrný člověk. Avšak když zadáte pokyn, aby to napsal jak osmileté dítě, tak vychází z dat a ví, jak píšou osmileté děti, a proto povídku vygeneruje s největší pravděpodobností jako osmileté dítě,“ uvedl Herel s tím, že to je chápaní kontextu, kouzlo jazykových modelů. „Proto je schopen rozlišovat mezi slovy jako koruna jako předmět a koruna jako měna,“ dodal.
„Většina vědců pracuje spíše na matematických modelech, neuronových sítích a technologiích, které máme dnes. Komunita lidí, která vyvíjí umělou inteligenci například s vědomím sebe sama, je velice malá. Zatím je ten postup neúspěšný a negeneruje to žádné zisky,“ přiblížil Herel, který v současné době pracuje na technologii, jejíž myšlenka je využít modely na principu umělé inteligence ke zjištění veřejného mínění z internetových dat.