Nejrychleji rostoucím segmentem nejen českého, ale i globálního knižního trhu jsou audioknihy. Jejich popularita však naráží na zásadní omezení: tradiční produkce je drahá a pomalá. Český startup Elredo Voice to chce změnit načítáním pomocí AI.
Na jeho řešení teď sází nakladatelství Albatros Media, které každoročně zásobuje český trh největším počtem knižních titulů.
„Udělat dnes audioknížku stojí zhruba 80 až 150 tisíc korun. Trvá to přibližně tři měsíce nebo i déle, a v celém procesu je zapojeno zhruba pět až deset lidí. My jsme schopni stáhnout náklady na nižší desítky procent původní ceny,“ tvrdí zakladatel Elredo Voice Matěj Schmalz.
Úspora pramení z automatizace celého produkčního řetězce – od generování hlasu přes práci s tempem a intonací až po finální mastering do distribuční kvality. První tituly z produkce Albatrosu načtené tímto řešením se mají na trhu objevit v dubnu. „Není to o nahrazování lidí. Díky nám vzniknou tituly, které by jinak nevyšly, jelikož by to ekonomicky nedávalo smysl,“ říká Schmalz.
Albatros totiž neplánuje svou dosavadní „tradiční“ výrobu audioknih rušit. „U klíčových titulů a bestsellerů chceme nadále investovat do špičkové studiové produkce s výraznými interprety. AI vedle toho otevře audio formát širšímu spektru autorů a nabídne posluchačům mnohem pestřejší výběr,“ uvádí Tereza Bohdalová z Albatros Media.
Nakladatelství dnes vydává zhruba tisícovku knih ročně, z nichž se audioverze dočká přibližně desetina. Albatros má ambici tento podíl znásobit. „Díky našemu škálovatelnému řešení se na tahle čísla mohou dostat,“ věří Schmalz.
Americký sen
Audioknihy jsou v rámci knižního trhu jediným segmentem, který roste napříč zeměmi i žánry. A prakticky všechny výzkumné a analytické platformy očekávají, že se tak bude dít i v příštích letech. Nejpesimističtější odhady mluví o tempu růstu globálního trhu s audioknihami lehce nad deseti procenty ročně, ty nejoptimističtější zmiňují i více než 35 procent za rok.
Stabilně roste i český trh, kterému v roce 2024 pomohlo zavedení nulové DPH na knihy, místo dřívějších deseti procent. Výrazně ho ale formuje nástup velkých hráčů – zejména streamingových platforem – a nově i AI při výrobě obsahu, což potvrzuje v poslední zprávě o českém knižním trhu Svaz českých knihkupců a nakladatelů.
Elredo Voice se však od konkurence liší tím, že v Česku uvádí na trh vůbec první audioknihy s čistě AI generovaným hlasem. Dříve se zde u „robotické“ produkce využívaly pouze klony hlasů skutečných osob. To je však podle Schmalze produkčně složitější cesta.
Záběr startupu není omezen na tuzemský trh, vedle českých Elredo vytváří i anglické audioknihy. V USA spolupracuje s tamním lídrem produkce audioknih Blackstone Publishing nebo s předním vydavatelem akademické literatury John Wiley & Sons, zkráceně „Wiley“, s historií dlouhou přes 200 let.
V USA rovněž uzrál Schmalzův nápad pustit se do AI produkce naplno. Elredo totiž původně stavělo aplikaci k poslechu audioknih obohacenou o různé gamifikační prvky, čtenářské výzvy či personalizovaný výběr knih podobný třeba nabídce seriálů na Netflixu.
Foto: Elredo
Zakladatel Elredo Matěj Schmalz
„Naše základní mise byla snaha pomoct lidem víc číst. Jenže od začátku za námi chodili uživatelé a sháněli audioverze konkrétních knih, které nebyly k dispozici. My jsme pak šli za vydavateli, ale většinou říkali, že nikdy, protože je to moc drahé,“ líčí Schmalz.
V Elredu proto začali zkoumat možnosti, jak by šlo knihy převádět na mluvené slovo levněji. A také vyrazili v rámci mise Czech Investu do New Yorku. Mimo jiné proto, že americká nakladatelství na maily z Prahy příliš nereagovala, takže se Schmalz s týmem rozhodli zabušit na několik dveří osobně.
„Byli jsme u vydavatelů napřímo a pochopili, jak fungují jejich IT týmy. Došlo nám, že AI načítání je pro ně aktuálně největším problémem, proto jsme se rozhodli postavit řešení,“ říká podnikatel. Jeho ambice není zrovna malá – chce se stát na poli AI produkce audioknih světovou jedničkou.
„Teď je volný trh. Před dvěma roky bylo brzo, za dva roky bude pozdě. Díky tomu, jak rychle se nám daří nabírat partnerství a zároveň řešíme distribuci, máme pocit, že jsme ve správný čas na správném místě,“ míní.
Spolupráci s českým Albatrosem má za mimořádně důležitou – Elredo si díky ní ověří funkčnost svého modelu v prostředí velkého vydavatelského domu a jeho rozsáhlého katalogu. „Byli zároveň první, kdo v Česku kývl na čistě ,robotický‘ hlas, ostatní se toho báli. Oproti tomu v Americe, když jsme nakladatelům říkali, že budou první, tak je to spíš nalákalo,“ popisuje Schmalz.
Do budoucna se chce startup na americký trh zaměřit víc. Mimo jiné kvůli jednoduššímu škálování. V Česku jsou licence obvykle uzavírány na sedm až deset let a historicky neobsahují doložku o zapojení AI, což vydavatele nutí žádat autory o individuální souhlas u každého titulu zvlášť. Oproti tomu v USA vydavatelé často drží primární práva na papír, e-book i audio v takové formě, která jim umožňuje o AI produkci rozhodnout samostatně a okamžitě.
„Vydavatelé se dnes už snaží do smluv protlačit AI. Ale je velice důležité v nich zmiňovat i to, aby samotný obsah knihy nemohl sloužit k učení nějakého AI modelu, role umělé inteligence musí být omezena čistě na distribuci. To je dnes hlavní limit, proč nemůžeme převádět na audio tolik knih, kolik bychom chtěli,“ říká Schmalz.
Vedle toho jeho startup dál rozvíjí svou už zmíněnou aplikaci ke čtení ušima pro samotné čtenáře, které se navzdory přicházejícím nabídkám na odkup zbavovat neplánuje. „Můžeme ji totiž využít i k testování našich audioknih předtím, než je vpustíme na širší trh, což bude podle mě atraktivní i pro vydavatele,“ uzavírá.