Počítače v sobě ukrývají obrovský potenciál, který se již několik dekád projevuje v aritmeticky náročných operacích – jedná se například o nenahraditelného pomocníka v lékařství, vojenství či v modelech předpovědi počasí. Neustále se zvyšující výkon hardwaru však v posledních letech otevírá další netušené možnosti, do čehož postupně promlouvá i umělá inteligence. Zatím se sice nejedná o samostatně smýšlející stroje jako ze sci-fi románů, i tak nám ale současný stav jejích nejrůznějších podob čím dál tím více usnadňuje život a prostupuje do řady odvětví lidského vědění a činností. A jednou takovou oblastí jsou pochopitelně i počítačové hry.
Řeč není o umělé inteligenci tak, jak ji chápou hráči – tedy coby nástroj, který zpravidla ovládá a řídí protivníky – ale o takzvaných neuronových sítí a o strojovém učení. O tomto pojmu jste v poslední době mohli slyšet z celé řady zdrojů, v případě videoher je pak tato technologie využívána zejména ve spojení s restaurováním postarších her. Na pár takových příkladů narazíte níže, ovšem síla strojů a výpočetních modelů nasvědčuje, že v budoucnu nemusí umělá inteligence jen zvětšovat textury, ale pustit se rovnou do vlastní tvorby obsahu.
Přesto se u zdánlivě jednoduchého procesu zvětšování na chvilku zastavme. Každý dobře ví, že postupy seriálových kriminalistů jsou sci-fi, takže třeba zvětšování fotografie očí do té míry, aby z odrazu bylo možné přečíst poznávací značku, dalece přesahuje to, co současné technologie umí. Když zvětšujete třeba rodinnou fotku, začíná se povážlivě rozmazávat a na zvětšenině se objevují nejrůznější deformace a artefakty, přesto už umělá inteligence umí do určité míry dopočítávat chybějící místa a výsledky jsou obstojné. Tvůrci modifikací proto začali tuto technologii využívat a v několika uplynulých letech se objevila celá řada zajímavých „HD“ modifikací, upravující rozlišení z dnešního hlediska již nedostačujících textur.
Příkladem může být modifikace jménem Doom Neural Upscale 2X pro GZDoom (tedy upravenou verzí Doom enginu pro moderní stroje), která pracuje na principu rovnou osminásobného zvětšení a následného dvojitého zmenšení textur a spritů. Výsledkem je tedy dvojnásobná velikost oproti originálu a ono dvojité zmenšování je zvoleno proto, aby textury ve své finální podobě byly ostřejší, ale aby si zároveň zachovaly něco z původního nádechu. Osminásobně i čtyřnásobně zvetšené textury si prý navíc zachovaly množství artefaktů vzniklých dopočítáváním příliš velkých ploch, které zatím žádná technologie odstranit nedokáže.
Český pojem hlubokého učení se moc neujal a mnohem častěji narazíte na anglický ekvivalent. Ten označuje princip vyškolení umělé inteligence na rozpoznávání zvoleného typu vstupu. Umělá inteligence a potažmo neuronová síť na základě předložených dat sleduje určitý jev a dle toho se učí rozpoznávat další obdobné případy. Může se přitom jednat jen o tvar, barvu, osoby nebo třeba vozidla.
Celý proces si ale nepředstavujte jako kontinuální dřinu pokročilé umělé inteligence, pracující jako šedá eminence v pozadí pokaždé, když spustíte hru. Balíček nových textur vznikl jednorázově za pomoci technologií Nvidia GameWorks’s Super Resolution a Topaz AI Gigapixel, jež obě pracují na velmi podobném principu. Modař s přezdívkou hidfan neuronové sítě takzvaně nakrmil zvětšenými texturami a poté i jejich opětovně zmenšenými variantami. Podotýká ale, že zcela samostatný tento proces nebyl a po vygenerování textur bylo zapotřebí ještě detaily a začištění artefaktů provádět ručně.
Dalším předmětem zájmu „zvětšovačů“ textur je 17 let starý Morrowind, kterému se pravidelně dostává od fanoušků dodatečné péče, a to ať už za pomocí balíků textur, anebo komplexních předělávek do enginů z novějších dílů série. Jedna ze zajímavých modifikací nese poněkud fádní jméno Morrowind Enhanced Textures, ale podobně jako upscale Doomu představuje ve své podstatě ohromný technologický pokrok. Tam, kde dříve musela nastoupit armáda grafiků, pečlivě ladících jednotlivé textury, tam bude možné v řádu let (a možná ještě dříve) nasadit stroj a pohodlně se usadit s kávou v ruce.
Přeháním, samozřejmě, i tento typ stroje bude pravděpodobně ještě na dlouhá léta dopředu zapotřebí „krmit“ daty, korigovat a kontrolovat jeho výsledky stejně jako majitelé automobilů Tesla musí mít ruce na volantu i v případě, že jejich vůz funguje v autonomním režimu. Ale pokrok je nezastavitelný a jeho výsledky v tomto případě zcela hmatatelné. Respektive viditelné – Morrowindu to skutečně sluší a výsledek si můžete prohlédnout v galerii níže Nexus Mods. Použitou technologií je v tomto případě Enhanced Super-Resolution Generative Adversarial Networks (ESRGAN).
Výčet grafických modifikací ukončíme u Final Fantasy 7, kde není třeba zabíhat do přílišných detailů a kde vás mohou rovnou odkázat na Zdeňkův článek. Za vypíchnutí zde ale stojí, že klasiku z PlayStationu hráči v modifikaci jménem Remako HD Field Mod původně vylepšili technologií Gigapixel, na fórech s původním příspěvkem o této modifikaci lze ale nalézt i alternativní pokus s jinou technologií ESRGAN.
Co se týče již nastíněné tvorby vlastního obsahu umělou inteligencí, průkopníkem v tomto oboru může být Nvidia. Detaily pro magazín The Verge přinesl Bryan Catanzaro, viceprezident divize pro aplikaci strojového učení v Nvidii, a hovoří rovnou o revoluční tvorbě celých scén a světů za pomocí umělé inteligence. Ve videu představil výsledek dosavadní práce týmu, podotýká ovšem, že záběry nejsou fotorealistické a vykazují vady typické pro podobnou technologii. Jde o městský simulátor, ve kterém zatím můžete pouze jezdit autem, o vyrenderování veškeré grafiky se ale postarala právě umělá inteligence a výsledek je opravdu pozoruhodný. Samotné tvorbě virtuálního města v tomto případě předcházel vstup množství dat v podobě videí z řízení odlišnými metropolemi. Tato posbíraná videa byla následně snímek po snímku rozebrána na jednotlivé segmenty, aby bylo patrné, co jsou okolní vozy, co je silnice, obloha a tak dále. A na základě těchto kategorií pak byl počítač schopen učit se a následně generovat nová data a vytvářet předtím neviděné scenérie.
Struktura neuronové sítě vychází z biologického modelu neuronových sítí skládajících se ze vzájemně propojených neuronů. Jejich cíl je primárně porovnání se sadou předem naučených dat. Aplikace v praxi tak dnes spočívá například v rozpoznávání postav či obličejů, anebo i ve zcela specializovaných odvětvích, jako je například odhalování podezřelých finančních podvodů na základě předchozí praxe.
Nejzajímavější na tomto příkladu je ale bez debat to, že scény jsou jedinou grafickou kartou vytvářené v reálném čase, ačkoliv Catanzaro přiznává, že se jedná o Nvidii Titan V, jež má doporučenou maloobchodní cenu stanovenou na lidových 83 tisíc s DPH. Vysvětluje také, že základní kostra města byla vytvořena tradičním způsobem na Unreal Enginu a že se umělá inteligence stará „pouze“ o dosazování grafiky na základě pravidel, která se naučila během „sledování“ vstupních videí. A i když museli lidé z Nvidie řešit celou řadu problémů, spojených zejména s tím, aby grafika zůstávala na svém místě, slouží jim projekt jako důkaz, že technologie už existuje a nyní musí přijít řada na její vylepšování.
Na konci demonstračního videa lze ještě spatřit taneční kreace jednoho z členů vývojářského týmu. I v tomto případě jde o počítačem vytvořené video, ve kterém stroj na základě vzoru rozpohyboval jinou postavu. Praktický dopad v tomto případě může přesahovat pouhé herní světy a kromě toho, že by mohlo být možné vytvářet virtuální scény pro výukové jízdní simulátory, tak by rovněž bylo možné třeba i přenášet obličeje hráčů ve formě postav přímo do hry. Možností je celá řada a kam až to vše povede, toho teprve budeme svědky. Na druhé straně zde ale samozřejmě existují i určitá rizika. Nutně nemluvím o vzestupu Skynetu, ale například o takzvaných deepfakes, kdy je cizí obličej ve videu věrohodně promítán na obličej někoho jiného. To by samozřejmě mohlo vést ke ztrátě věrohodnosti videí jakožto relevantního zdroje informací, a už existují příklady. Zdá se být až děsivě snadné vzít tvář politika a „donutit“ ho říci něco, co původně nikdy netvrdil. Malovat čerta na zeď ale určitě nechci a je to i sama Nvidia, která se aktivně podílí na vývoji technologií s potenciálem podvržené záběry odhalit. A to samozřejmě jak jinak, než za pomocí umělé inteligence.
V případě her dokáží neuronové sítě hotové divy. Například technologie Nvidia GameWorks's Super Resolution se chlubí nejen tím, že umí obrázek i při nepřirozeném zvětšení dodatečně zostřit, ale že dokáže také vytvářet variace různých materiálů. Z matného povrchu vytvořit lesklý anebo z ukázky textury vytvořit její přirozenou variaci, čímž se lze vyhnout nepříjemnému opakování původního vzoru.
Nakolik je všemocná, si ale musíme ještě počkat a než nastane doba, kdy stroje začnou samy vytvářet komplexní světy a kdy bude zautomatizované i vylepšování starších titulů, může se toho stát opravdu hodně. Ostatně, i sám Bryan Catanzaro přiznává, že může trvat klidně i dekády, než se dočkáme běžného využívání této technologie. Vývoj bude postupný a pravděpodobně shodný s tím, jak se do popředí dostává ray tracing, o kterém jsem psal začátkem prosince. Technologie sledování světelného paprsku se sice dočkala prvních demoverzí již před mnoha lety, hmatatelné výsledky v herním průmyslu se ale dostavily až nyní. V případě neuronových sítí a deep learningu jsou praktické dopady ve hrách dostupné v omezené formě již nyní, omezená aplikace jim ale na pozoruhodnosti neubírá a z hlediska dalšího vývoje dokáží probouzet zvědavost.
Pro přidávání komentářů se musíte nejdříve přihlásit.
Jinak dnes už není k video fakenews potřeba ani ten herec. AI to zvládá celé sama. Mimika, hlas … všechno. Jen je potřeba ji dodat potřebné množství „studijního materiálu“ 🙂 Viz https://www.youtube.com/watch?v=o2DDU4g0PRo