Z pohledu IT žijeme v paradoxním světě. Na jedné straně již několik dekád optická vlákna přenášejí data extrémní rychlostí na obrovské vzdálenosti a lámou rekordy v datových přenosech. Na té druhé čipy v serverech a na deskách plošných spojů mezi sebou stále komunikují hlavně pomocí starých elektrických vodičů na bázi mědi.

To má řadu nevýhod, od prostojů až po zbytečnou spotřebu energie. Ta je občas skutečně masivní. Příkladem je situace s vodiči spojujícími grafické GPU akcelerátory, které dnes slouží k trénování generativní umělé inteligence. Ty totiž mohou trávit více než polovinu svého času nečinností a čekat na data z jiných zařízení v systému.

S ohledem na rozsah takových distribuovaných tréninkových procesů to pak může přinášet velmi nepříjemná překvapení v okamžiku, kdy dorazí účet za elektřinu. Tento problém se navíc stupňuje kvůli omezením rychlosti a šířky pásma na dnešních metalických elektrických obvodech.

Podle prognózy Goldman Sachs mají datová centra do roku 2030 polykat tři až čtyři procenta světové spotřeby energie. Velká část tohoto nárůstu jde přitom na vrub právě způsobu, jakým jsou dnes přenášena data během trénování pracovních úloh umělé inteligence.

IBM dnes představila průlomový výzkum v oblasti optických technologií, který by mohl do budoucna tento problém vyřešit. V nově publikovaném článku dostupném na arXiv výzkumníci IBM demonstrovali způsob, jak přenést výhody optiky do datových systémů.

Celé kouzlo se skrývá za novým prototypem takzvaného modulu CPO (co-packaged optics) pro vysokorychlostní optické připojení. Technologie nahrazuje elektrické vodiče současnosti polymerovými optickými vlnovody (PWG) a umožňuje tak propojení čipů rychlostí světla.

A právě úspěšný návrh a sestavení prvního funkčního veřejně oznámeného PWG pro chod této technologie je jádrem nového objevu. Článek dále uvádí, že CPO moduly s polymerovými vlnovody s roztečí padesát mikrometrů jsou první, které prošly všemi zátěžovými testy požadovanými pro komerční výrobu.

CPO modul s prvním veřejně oznámeným polymerovým optickým vlnovodem (PWG)

Nová technologie slibuje výrazně zvýšit šířku komunikačního pásma v datacentrech, což by minimalizovalo prostoje GPU, prodloužilo délku spojení a výrazně zrychlilo trénink umělé inteligence. Nové moduly CPO by podle IBM mohly snížit současnou dobu potřebnou k trénování standardního velkého jazykového modelu (o velikosti GPT-4) ze tří měsíců na tři týdny. Energetické náklady by pak měly klesnout pětinásobně.

„Díky tomuto průlomu budou čipy zítřka komunikovat podobně jako dnes optické datové spoje. Nastane nová éra rychlejších a udržitelnějších datových center,“ prohlásil k objevu Darío Gil, senior vice president a ředitel výzkumu ve společnosti IBM.

Výzkumníci navíc tvrdí, že výrobci čipů mohou na okraj čipu přidat šestkrát více optických vláken ve srovnání se současnými spoji. To znamená, že nový objev by mohl zvýšit šířku pásma mezi čipy oproti dnešku až osmdesátkrát. Pokud jde o energetickou úsporu a uhlíkovou stopu, firma prohlašuje, že na jeden vytrénovaný AI model se ušetří energie odpovídající roční spotřebě pěti tisíc amerických domácností.