Zanalyzovat vloženou skladbu a nabídnout nejvhodnější alternativu. Právě to umí umělá inteligence naprogramovaná vývojáři z českého technologického startupu AIMS API. A umí to tak dobře, že za pouhý rok existence dokázala firma se svým produktem oslovit velké globální značky jako Universal Production Music nebo EMI Production Music.
Zčásti jde o podobný software, jaký užívají streamovací platformy nebo aplikace pro rozeznávání hudby. „Náš produkt je ovšem určený pro profesionály z audiovizuálního průmyslu,“ vysvětluje jeden z dvojice zakladatelů AIMS Martin Nedvěd.
Streamovací platformy, pro které je systém vyhledávání a doporučování hudby klíčovým nástrojem jejich byznysu, využívají kolaborativní filtrování: snaží se porovnat váš hudební vkus s podobnými uživateli a nabídnout vám novou, neznámou hudbu, která by vám sedla.
„AIMS ale umí pouze na základě analýzy audiostopy najít alternativní skladby k referenční nahrávce během několika vteřin a tím ušetřit desítky minut hledání,“ upřesňuje Nedvěd.
Zjednodušeně lze dovednosti umělé inteligence vysvětlit třeba na příkladu notoricky známého hudebního motivu z prvního dílu filmu Kill Bill Quentina Tarantina. Každý ví, že tento mistr filmového eklektismu pracuje ve velké míře s již existujícími nahrávkami a právě kýžený motiv objevil náhodou, když sledoval remake své oblíbené japonské gangsterky.
Kdyby místo toho použil AIMS, mohl hned najít desítky podobně znějících alternativ. „AIMS může pomoct třeba reklamnímu tvůrci, který chce hudbou ve spotu docílit podobné atmosféry,“ přibližuje Nedvěd.
Na mezinárodním trhu není AIMS prvním produktem svého druhu, přesto se mu – i vyšší ceně navzdory – daří vyhazovat konkurenci ze sedla. „Naše konkurenční výhoda spočívá v tom, že sami přicházíme z hudebního byznysu, a vnímáme proto specifické potřeby klientů, které outsideři z čistě technologických firem nevidí,“ domnívá se Nedvěd.
Léta totiž vede projekt Hudební banka, rodinnou firmu, která se v posledních letech vypracovala na největšího poskytovatele hudby pro audiovizuální projekty v Česku – a s úspěchem rozšířila svůj byznys i mezinárodně.
S nárůstem její hudební knihovny se však objevil i problém, jak se v rozsáhlém katalogu orientovat. Hledání skrze klíčová slova, jinak řečeno metadata, bylo zdlouhavé, a navíc naráželo na prostý fakt, že každý z uživatelů popisuje skladbu jinými slovy. Nahrávku, kterou jeden označí jako optimistickou, jiný popíše coby radostnou.
„Ukázalo se, že optimální řešení nespočívá v klíčových slovech, ale ve zvukové podobnosti,“ konstatuje Nedvěd. Právě takové řešení před časem Hudební bance nabídl francouzský startup Nieland. A bylo až tak skvělé, že firmu koupilo Spotify a hudební knihovna o službu přišla. Jelikož Nedvěd nenašel nikoho, kdo by mu podobně efektivní algoritmus dokázal nabídnout, rozhodl se vyvinout vlastní.
Tady na scénu vstupuje druhý z otců zakladatelů. Viktor Parma je muž, který učí stroje myslet skrze tzv. deep learning. „To znamená, že umělé neuronové síti poskytneme velké množství skladeb s metadaty a opakovaným trénováním různých modelů se postupně dobíráme stále lepších predikcí,“ popisuje Parma technologický proces za výsledným produktem.
Perfekcionista s elektrotechnickým vzděláním je také hudebník, což se ukázalo jako optimální kombinace. „Dnes už na trhu existuje spousta open source nástrojů, díky kterým můžete relativně snadno zprovoznit základní verzi podobného vyhledávače,“ konstatuje. AIMS vyvedly z průměru stovky malých optimalizací a také specifický způsob deskripce používaný v Hudební bance.
„Především jsme ale měli jasné zadání a hledali nástroj, který budeme sami používat – na rozdíl od častého modelu technologických firem, které nejprve vyvinou cool technologické řešení a až následně hledají jeho aplikaci v praxi,“ konstatuje Parma.
Reakce zatím potvrzují, že si v AIMS vybrali správný přístup. „Loni jsme měli prvního klienta, dnes jsme na měsíčním obratu 60 tisíc dolarů,“ říká Nedvěd, který má ve firmě na starosti byznys development. Na lokální zákazníky přitom vůbec nemíří, zajímá je globální trh.
„Našimi prvními klienty jsou hudební banky, protože to je prostředí, které sami detailně známe,“ zní lakonické vysvětlení. Dalším, finančně mnohem větším segmentem, do kterého se AIMS chystá proniknout, jsou televizní stanice. „Málokdo si uvědomuje, kolik hudby se v televizích používá. Editorům a hudebním dramaturgům jsme schopni ušetřit hodiny a hodiny času.“
Největší byznysové sousto, na které mají v AIMS chuť, představují nahrávací a nakladatelské společnosti. Tady by už ukusovali opravdu z miliardových obratů. „Snad to nebude znít příliš pateticky, ale chtěli bychom skrze AIMS ukázat, že čeští vývojáři nemusí své know-how prodávat zahraničním firmám. Že umíme špičkový produkt nejen vyvinout, ale i zobchodovat,“ zakončuje Martin Nedvěd.