Liangovi Wen-fengovi, bývalému datovému analytiku a zakladateli dva roky starého AI startupu DeepSeek, se musí nechat vícero. Ví, jak z podfinancovaného čínského technologického startupu vymáčknout marketingově maximum, umí být kreativní ve využívání zdrojů a obcházet tak americké obchodní restrikce. Dokáže tak zahanbit mnohem větší konkurenty.
To ostatně ještě předtím, než zaskočil západní svět, možná stihl i doma, protože doba jeho spuštění na domácím trhu nápadně koreluje se zahájením cenové války největších čínských dodavatelů služeb generativní umělé inteligence a velkých jazykových modelů.
Firmy jako Alibaba, Tencent, Baidu, Huawei a Bytedance, která je u nás známá hlavně jako mateřská společnost TikToku, za poslední rok snížily cenu za AI tokeny na pouhé setiny původních cen. I když to teoreticky může být jen náhoda, vsadili byste na to se současnými informacemi?
Západ Deepseek překvapil zatím především tím, že výkon jeho modelů DeepSeek-V3 a rychlejšího, ale méně přesného DeepSeek R1 je srovnatelný s jeho americkými protějšky, jako jsou GPT-4 a Claude 3, a to při podstatně nižších nákladech na trénink a provoz.
To zpochybnilo hned dvě dogmata, která se donedávna nikdo ani nenamáhal napadat. Vyvstávají proto znepokojivé otázky: je skutečně USA v oblasti umělé inteligence svrchovaným hegemonem a ostatním nezbývá než sklapnout podpatky a akceptovat jeho podmínky?
Druhá otázka, hlavně pro investory a potenciální technologické disruptory a inovátory, zní: opravdu jsou masivní investice do hardwaru a výpočetního výkonu jedinou a nejlepší strategií, jak vyjít ze současného AI zbrojení úspěšně?
Nejen na to jsme se zeptali Martina Dostála, člena investičního výboru fondu LOOK AI Ventures a experta na umělou inteligenci.
Jak vidíte dlouhodobější dopad startupu DeepSeeku a jejich technologie na celou oblast generativní umělé inteligence a tvorby velkých jazykových modelů?
V médiích se o DeepSeek a umělé inteligenci obecně objevují silné soudy. Ale řada okolností je stále nejasná a obtížně ověřitelná. Ostatně se stačí podívat, kolik nových skutečností stačilo vyjít na povrch za uplynulý pracovní týden. Osobně se nedomnívám, že se jedná o zásadní technologický průlom.
Pokud jde bouřlivou reakci trhu a veřejnosti, tu bych spíš připsal celkovému převažujícímu sentimentu. Podívejte se na to následovně. Valuace v celé oblasti umělé inteligence jsou momentálně neuvěřitelně vysoké a tím pádem i očekávání toho, co společnosti přinesou.
V případě technologických leaderů míří do sektoru enormní investice, nejde ale o žádnou dobročinnost, investoři právem očekávají, že se jim v budoucnu tento vklad také vrátí. Nejde tedy až tak o DeepSeek samotný.
Proč je tedy už týden hlavní hvězdou nejen technologického zpravodajství?
Když si to rozebereme velmi polopaticky, tak jejich úspěch má spočívat v tom, že dokázali efektivněji natrénovat velký jazykový model. To není ale vůbec žádná nová myšlenka. Stejně tak není nový fakt, že trénování velkých modelů je extrémně nákladné kvůli výpočetní náročnosti.
Každá z firem produkující velké modely používá různá specifická řešení, která se snaží tento proces vylepšit. V případě DeepSeek stojí za zmínku originální řešení s výpočty v plovoucí řádové čárce, kde na úkor o něco nižší přesnosti získali velkou výpočetní úsporu. Bod pro ně. Je to jeden z faktorů, který se pravděpodobně podílí na celé té momentálně glorifikované efektivitě trénování modelu DeepSeek R1.
Je ale podstatné si uvědomit, že když vyvíjíte inovace, je důležité se zaměřit na to, abyste inovace dosáhli, ne na to, abyste věci zároveň dělali co nejefektivněji. To se často dokonce vylučuje. Dobrým příkladem jsou evropské automobilky. Jsou sice v rámci toho, co dělají, velmi efektivní, ale, což je zdánlivý paradox, mají zároveň obrovský problém inovovat. Proč? To je jednoduché, mají totiž negativní vztah k riziku.
A v čem se AI odvětví liší?
V případě vývoje umělé inteligence je dnes trochu opačná situace. Firmy inovují, ale jejich technologie už nějaký čas potřebují zefektivnit a zlevnit. Dá se proto čekat, že na zvýšení efektivity se budou firmy více zaměřovat a že úloha DeepSeek v tomto procesu bude, že se ukáže jako katalyzátor priorit.
Dnes už existuje celá řada malých modelů západních firem, ty se ale obvykle zmenšují ex-post.
Je evidentní, že prostor pro zefektivnění je obrovský. Proč by DeepSeek měl být jedinou
firmou, která má v této oblasti výsledky? Já žádný takový důvod nevidím.
Jaký to bude mít dopad na společnosti vyvíjející, alespoň v západním světě, nejpopulárnější velké jazykové modely?
Obecně vzato, každá konkurence je dobrá. Očekávám, že firmy se budou snažit více
sledovat témata, jako je efektivita. Nemyslím si, že DeepSeek modely masivně nahradí modely firem OpenAI, META, Google a podobně.
Jaký to má důvod?
Například u nás v Evropské unii od srpna začne platit masivní regulace umělé inteligence –
EU AI Act, tedy pravidla pro obecné modely AI – a pochybuji, že bude čínská AI jejím požadavkům schopná dostát.
Navíc AI modely se od uživatelů učí, mohou od nich tak získávat cenná data, pokud jim je uživatelé poskytnou. Čili pro DeepSeek platí veškeré známé obavy, které obvykle spojujeme s čínskými firmami.
Jak vidíte dopad na výrobce hardwaru typu Nvidia, je to další voda na jejich mlýn, nebo spíš studená sprcha?
Důraz na efektivitu bude na výrobce hardwaru vytvářet tlak. AI modely navíc nebudou stále
tak explozivně růst, a to ani co do počtu, ani co do velikosti. Zároveň však platí, že se nedá
čekat, že by se potřeba hardwaru pro AI zastavila. Je to podobné jako si myslet, že skončí
potřeba výkonějších procesorů pro běžná zařízení.
Veřejnost nicméně vnímá Nvidiu jako neohroženého hegemona. To není úplně přesné,
Nvidia nemá sice konkurenci u hi-end čipů, ale na low-endu je konkurence naopak velmi bohatá.
Často lze jeden výkonný čip nahradit několika méně výkonnými, které ale mají mnohem lepší
poměr cena/výkon nebo výkon / energetická náročnost. Třeba proto, že si je navrhují některé
velké firmy jako Google, Meta nebo Amazon samy.
Nvidia hřeší na svoji pozici tím, že dává na své čipy obrovské marže. Dnes je například čistá marže společnosti na AI čipech okolo 55 procent, to je dlouhodobě těžko udržitelné. A když jsme u toho, totéž, myslím, platí pro cenu akcií, P/E poměr (poměr mezi tržní cenou akcie a čistým ziskem na akcii, který se odvozuje z čistého zisku společnosti – pozn. redakce) je u Nvidie okolo šedesáti a to je už také docela hodně.
A do třetice, jaký dopad to bude mít na softwarové společnosti a různé servisní služby?
Už dnes je k dispozici obrovské množství různých modelů. Firmy mají dvě cesty: buď levně integrují technologii třetí strany, nebo vyvíjejí technologie vlastní, respektive si, což je častější, upraví nějaký obecný model, aby získaly technickou konkurenční výhodu. První cesta je rychlá, ale přináší vyšší provozní náklady, druhá vyžaduje větší zapojení a počáteční investici. Zde se toho zase až tak moc nezmění.
A co tato změna znamená třeba pro společnosti jako Apple, který v AI zbrojení na začátku trochu zaspal?
V případě Applu je situace specifická tím, že Apple vlastní jak hardwarové, tak softwarové platformy a jejich produkty jsou typicky dobře a hluboko integrované. Zakládají si na tom a je to součást jejich DNA.
Nestačí totiž mít pouze dobrou technologii – pokud ji dobře neintegrujete a nedosáhnete vysoké míry uživatelské použitelnosti, nevyužijete plně její potenciál. A Apple z toho dlouhodobě těží, do velké míry na tom stojí úspěch celé firmy.
I když je Apple v AI pozadu a není AI leaderem, vzhledem k tomu, že má věrnou uživatelskou základnu, je docela možné, že z toho bude nyní paradoxně ekonomicky těžit.
S AI přichází sice později, poslední verze iOS už má AI modely integrované (Apple Intelligence), ale díky tomu se dá čekat, že na tom spálí mnohem méně peněz, protože Apple integruje už docela vyspělou technologii namísto vývoje technologie, která by byla kompletně vlastní.