Technologie DLSS 3.5 společnosti NVIDIA, která je dostupná na grafických kartách RTX demonstruje technologii upscalingu, která urychluje sledování paprsků a díky AI vypadá mnohem lépe.
Je tomu již 5 let, co společnost NVIDIA představila svou revoluční technologii DLSS na Gamescomu 2018. Od té doby, co se tato technologie stala základní součástí grafických karet RTX, zaznamenala postupné aktualizace, které technologii vylepšily díky AI a technologům, kteří neustále tvrdě pracují na jejím vylepšení. Po DLSS 1 společnost představila čtyři hlavní aktualizace, které jsou uvedeny níže:
- DLSS 1 (srpen 2018) – Představení supervzorkování Deep Learning do světa
- DLSS 2 (březen 2020) – Nová neuronová síť s lepší kvalitou a výkonem
- DLSS 2.3 (listopad 2021) – Vylepšené detaily v pohybu, rekonstrukce a časová stabilita
- DLSS 3 (říjen 2022) – Nová generace rámů nabízí až 2x vyšší výkon
- DLSS 3.1 (leden 2023) – Vylepšená stabilita a kvalita uživatelského rozhraní při rychlém pohybu
Letos na Gamescomu 2023 NVIDIA uzavřela svou druhou velkou aktualizaci DLSS 3 známou jako DLSS 3.5. S DLSS 3.5 NVIDIA specificky vylepšuje ray tracing se stejným modelem AI, který pomáhá trénovat DLSS. Ale abychom pochopili, co DLSS 3.5 dělá, musíme se podívat na to, jak ray tracing vlastně funguje.
Předchozí techniky samostatně řešily stíny, odrazy a globální osvětlení pro malý počet světelných zdrojů. Full ray tracing modeluje vlastnosti světla z prakticky neomezeného počtu emisních zdrojů a poskytuje fyzicky správné stíny, odrazy a globální osvětlení na všech objektech.
Typické zdroje osvětlení ray tracing nejprve vygenerují scénu s materiály a geometrií. V tomto okamžiku nejsou aplikovány žádné světelné efekty. Tento obraz je pak vzorkován s různými světelnými efekty, jako jsou odrazy a globální osvětlení.
Na obrázku níže můžete vidět, že scéna není zcela zakryta, takže zůstávají černé pixely, které jsou mezerami v informacích o osvětlení, a tato prázdná místa tam zůstávají, protože nemůžete pořídit dostatek paprsků, abyste vyplnili každý pixel ani když se paprsky odrážejí, nejsou rovnoměrně rozloženy. Výsledkem je, že vždy budou chybět pixely bez ohledu na to, kolik paprsků se na scéně nachází.
Zde nastupují odšumovače, které analyzují tyto vzorkované paprsky a doplňují chybějící pixely pomocí prostorových a časových technik. Herní engine může obsahovat více potlačovačů šumu pro každý efekt paprsku. Poté, co odšumovače dokončí svou práci, je obraz RT složen a poté převeden na nativní rozlišení. Odstraňovače šumu používají následující metody:
- Časová akumulace: Vzorkování paprsků napříč více snímky (může vést k duchům nebo špatné RT)
- Prostorová interpolace: Vyplní černé mezery a prolnutí se sousedními pixely (může vést k rozmazaným nebo nejednotným obrázkům)
Tyto odšumovače lze sice ručně vyladit pro jeden konkrétní titul, ale mohou vést k nepřesným světelným efektům, méně kvalitnímu globálnímu osvětlení a méně kvalitním odrazům. Kromě toho mohou odšumovače také odstraňovat vysokofrekvenční barevná data, která jsou potřebná pro upscaling, což vede ke konečnému obrazu, který po použití RT postrádá detaily.
Tady přichází na řadu DLSS 3.5!
NVIDIA tedy vymyslela nové řešení pro řešení těchto problémů a je tu nejnovější generace DLSS, DLSS 3.5. DLSS 3.5 podporované jako první u karet NVIDIA RTX 40, na jejichž nabídku se můžete podívat například na na Smarty.cz, přidává zcela novou funkci v DLSS známou jako RR nebo Ray Reconstruction. Ray Reconstruction v podstatě nahrazuje vícenásobné odšumovače, které se používají v tradičním RT toku, o kterém jsme hovořili výše.
NVIDIA uvádí, že RR je trénováno na 5krát více datech než DLSS 3, což je důvod, proč je RR mnohem chytřejší volbou pro implementaci do her a enginů. RR je trénován tak, aby začleňoval další data enginu, rozpoznával různé efekty sledování paprsků, rozpoznával dobré a špatné časové a prostorové pixely a uchovával vysokofrekvenční data pro upscaling.
Při detailním srovnání mezi tradičním odšumovačem a povoleným DLSS 3.5 můžeme vidět, že nová technologie Super Sampling zachovává dobré pixely a odstraňuje špatné pixely, což vede k mnohem lepší kvalitě sledování paprsku oproti odšumovači, který jednoduše mísí vzorkované paprsky a vede k nepřesnému osvětlení. Tohoto obrovského rozdílu je dosaženo díky obrovskému souboru dat, který je trénován offline a je mnohem náročnější na výpočetní výkon, než jaký je dostupný v reálném čase.
Osvětlení je opět jen jedním aspektem RT a odrazy také využívají výhod nového modelu umělé inteligence, který nabízí méně rozmazané snímky, protože data původního snímku jsou zachována a nejsou smíchána dohromady, jak by tomu bylo v případě potlačení šumu. To vede k ostřejším odrazům ve finálním vykresleném obrázku.
Lepší kvalita RT s ještě lepším výkonem
Zdá se, že všechno to RT vylepšení bude zatěžovat více GPU, ale ve skutečnosti ne, protože povolení Ray Reconstruction DLSS 3.5 vedlo k ještě lepšímu výkonu než původní DLSS 3. Vidět to můžete na příkladech z Cyberpunk 2077 a Alan Wake 2, kde můžeme vidět výkonnostní rozdíl mezi vypnutým DLSS a použitím různých technik AI.
NVIDIA vysvětluje, že jedním z aspektů vedoucích ke zvýšení výkonu je to, že mohou nahradit více popíračů jediným modelem AI a konečný výkon bude záviset na hře od hry.
Například titul Alan Wake 2 obsahuje kompletní sadu technologií DLSS, které maximalizují snímkovou frekvenci a kvalitu obrazu pomocí síly AI. Super rozlišení umožňuje všem hráčům GeForce RTX výrazně zrychlit snímkové frekvence. Frame Generation znásobuje výkon na grafických kartách GeForce RTX 40 Series, stolních počítačích a noteboocích až 4,5x. Reflex snižuje latenci systému, díky čemuž je hra ještě detailnější. Aktivace ray tracingu a DLSS v Alan Wake 2 na GeForce RTX GPU automaticky umožňuje Ray Reconstruction, nahrazující dva odšumovače sjednoceným modelem AI, který zlepšuje kvalitu ray tracingu, činí hru pohlcující a grafiku realističtější. Navíc Ray Reconstruction běží v našich benchmarcích až o 14 % rychleji, což dále zrychluje výkon pro hráče hrajících na grafických kartách GeForce RTX.
Pokud jde o integraci, NVIDIA říká, že se chystá udělat Ray Reconstruction stejně snadno implementovatelnou pomocí pluginů, jako je implementace Super Resolution. Vývojáři potřebují pouze vypnout interní odšumovače, protože informace musí být předány modelu DLSS AI. Z hlediska integrace to tedy zní dobře a v příštím roce můžeme očekávat ještě více titulů vylepšených RR.
Prostě to funguje (na všech GPU RTX)
Přichází podpora a dobrou zprávou je, že NVIDIA bude nabízet podporu DLSS 3.5 Ray Reconstruction u všech GPU GeForce RTX počínaje sérií RTX 20 až po GPU RTX 30 a RTX 40, na jejichž nabídku se můžete podívat na Smarty.cz. Rámec DLSS 3.5 bude také zahrnovat stávající technologie Super Resolution, DLAA a Frame Generation, které jsou podporovány napříč jejich vlastní specifickou generací GPU. Tyto technologie budou využívat technologii NVIDIA Tensor Core pro bezkonkurenční výkon a ohromující vizuální kvalitu.
Vývojáři si budou moci vybrat mezi všemi těmito technologiemi obsaženými v rámci DLSS 3.5 a záleží pouze na jejich preferencích, zda se chtějí zaměřit na výkon, kvalitu obrazu nebo obojí.
Budoucnost grafického výkonu je již tady!
NVIDIA DLSS 3.5 je nyní k dispozici ve třech hlavních titulech včetně Cyberpunk 2077 (s aktualizací Phantom Liberty) , Portal s RTX a také Alan Wake 2.
Článek NVIDIA DLSS 3.5 odhaluje své kvality s rychlejším a lepším Raytracingem, vylepšeným AI u titulů Cyberpunk 2077 a Alan Wake 2 se nejdříve objevil na GAME PRESS.