トップQs
タイムライン
チャット
視点

ディープ・ラーニング・スーパー・サンプリング

エヌビディアの画像アップスケーリング技術 ウィキペディアから

Remove ads

ディープ・ラーニング・スーパー・サンプリング英語: Deep learning super sampling(DLSS))は、NVIDIAによって開発され、一部のビデオゲームでリアルタイムに使用するためのNvidiaグラフィックカード専用英語版の画像アップスケーリングテクノロジーである。本項では略称である『DLSS』を用いて記述する。

概要

DLSSはその名の通り、ディープラーニング(深層学習)を使用して、低解像度の画像を高解像度にアップスケールし、高解像度のコンピューターモニターに表示する超解像技術の一つである。

NVIDIAによればこの技術は、ネイティブ画像と同等の品質・高解像度レンダリング並のアップスケールを実現する上、ビデオカードによる負荷(計算・性能)が少なくてすむため、特定の解像度ではより高いグラフィック設定とフレームレートが可能になるとしている[1]。バージョンが進んだ2.0に置いてNVIDIAは、「ネイティブ解像度に匹敵する画質を提供する」と説明した[2]。以降もバージョンの更新は継続されている。

2025年4月の時点で、このテクノロジーはGeForce RTX 20GeForce RTX 30GeForce RTX 40GeForce RTX 50シリーズGPUでのみ利用可能である。また、NVIDIAは2025年4月に同年6月5日発売の任天堂のゲーム機『Nintendo Switch 2』もDLSSに対応することを発表した[2]

Remove ads

歴史

要約
視点

NVIDIAは、2018年9月に発売されたGeForce RTX20シリーズGPUの主要機能としてDLSSを追加した[3]。当時は、限られた少数のゲームタイトル(『バトルフィールドV [4]』と『メトロエクソダス』)においてのみ対応されていた。またアルゴリズムを対応された各ゲームで個別に調整する必要があり、平時の効果は単純な解像度のアップスケーリングと比較して大きな差はなかった[5][6]

2019年、ゲームタイトル『コントロール』において、レイトレーシングとTensorCoreを使用しなかったDLSSの改良版が対応されていた[7][8]

2020年4月、NVIDIAはドライバーバージョン445.75を提供し、DLSS 2.0へのバージョンアップが行われた。これは前述の『コントロール』『ウルフェンシュタイン:ヤングブラッド英語版』などのいくつかの既存のゲームで利用でき、今後発売されるゲームでも対応し利用可能になるとしている。2.0ではTensor Coreを再び使用することでAI学習データを用いる事で、初期のバージョンで必要だった各ゲーム毎での個別調整する必要はなくなった[3][9]。ただし、ゲーム側の対応と実装は引き続き個別に必要となる。
2.0のデメリットとしてはMSAA英語版TSAA英語版などのアンチエイリアス手法が、適切に効果が発揮されない点がある。この設定の場合DLSSを有効にすると、パフォーマンスに大きな悪影響がある[10]

2021年11月に2.3へとバージョンアップ。動きの激しい場面で発生するゴーストを、モーションベクトルをより高度に利用するよう改善したことで軽減に成功したとしている[11]

2022年12月に3.0がリリース、通常のレンダリングと比べて性能が最大で4倍増、更に従来のアップスケールに加えてオプティカルマルチフレーム生成機能が追加された。また、CPUがボトルネックとなっていてもフレームレートを高めることが可能となる。レイテンシを軽減するためにNVIDIA Reflexが搭載。フレーム生成機能はGeForce RTX 40シリーズのみで対応しており[12]、アップスケーリング機能は従来のGeForce RTX 20・RTX 30シリーズでにも対応している。

2023年9月に3.5がリリース、「Ray Reconstruction(光線再構築)」と呼ばれる新技術が追加[13]され、この機能はRTX 20シリーズからRTX 30を含めた全てのRTXシリーズに対応する。

リリース履歴

さらに見る バージョン, リリース月 ...

ゲーム画質モード(2.0以降)

さらに見る 品質プリセット, スケールファクター ...
  1. アルゴリズムは必ずしもこれらのプリセットを使用して実装する必要はなく、実装者がカスタムの入力および出力解像度を定義することも可能。
  2. 入力解像度を出力解像度にアップサンプリングする際に使用されるスケールファクターのこと。例えば、540pでレンダリングされたシーンを2.00xのスケールファクターで表示すると、出力解像度は1080pになる。
  3. アップサンプリングの前に内部でシーンをレンダリングする際に使用される、出力解像度と比較したレンダリングスケールのこと。例えば、1080pのシーンを50%のレンダリングスケールでレンダリングした場合、内部解像度は540pになる。
Remove ads

バージョン

DLSS 1.0

NVIDIAはDLSS 1.0について、従来のスーパーサンプリングを使用して「完璧なフレーム」を生成することで、各ゲーム画像毎にニューラルネットワークで学習する必要があると説明した。 2番目のステップでは、初期結果でアンチエイリアシングやVRSといった映像処理をAIの処理に任せるという調整がなされた[19][20]

DLSS 2.0[21]

  • ニューラルネットワークは、スーパーコンピューターでの超高解像度のビデオゲームの「理想的な」画像と同じゲームの低解像度画像を使用して、NVIDIAによって学習され、ビデオカードドライバに保存される。 NVIDIAはDEX-1英語版サーバーを使用してネットワークのトレーニングを実行すると言われている[22]
  • ドライバーに保存されているニューラルネットワークは、実際の低解像度画像を参照と比較し、完全な高解像度の結果を生成するもの。調整されたニューラルネットワークによって使用される入力は、ゲームエンジンによってレンダリングされた低解像度のエイリアス画像と、同じくゲームエンジンによって生成された同じ画像からの低解像度の動きベクトルである。モーションベクトルは、次のフレームがどのように見えるかを推定するために、シーン内のオブジェクトがフレーム間を移動している方向をネットワークに通知している[23]

DLSS 3.0[12]

  • 全く新しいフレームを生成するオプティカルマルチフレーム生成を追加し、最適な応答性を実現するNVIDIA Reflex低遅延技術を統合している。
  • DLSS フレーム生成畳み込みオートエンコーダーは、現在と前のゲームのフレーム、オプティカルフローアクセラレータで生成されたオプティカルフローフィールド、モーションベクターや深度などのゲームエンジンのデータの4つの入力を受け取る。アクセラレータは、連続した2つのゲーム内フレームを解析しフローフィールドを計算、フレーム1からフレーム2へピクセルが移動する方向と速度を捉える。
  • アクセラレータは、ゲーム エンジンのモーションベクター計算には含まれないパーティクル、リフレクション、シャドウ、ライティングなどのピクセルレベルの情報を取得することが可能であるとしている。

DLSS 4.0[24][25]

アーキテクチャ

DLSSは、GeForce RTXシリーズのGPUで、Tensor Coresと呼ばれる専用の AIアクセラレータでのみ使用できる[23][26]

Tensor Coreは、Tesla V100の製品ラインで最初に使用されたNVIDIA Volta英語版 GPUマイクロアーキテクチャ以降に利用可能[27]。それらの特異性は、各Tensorコアが16ビット浮動小数点4 x 4マトリックスで動作し、コンパイラレベルでもCUDA C ++レベルで使用されるように設計されているように見えることである[28]

Tensor Coreは、32の並列スレッドでCUDA ワープレベルプリミティブを使用して、並列アーキテクチャを活用する[29]。ワープは、同じ命令を実行するように構成された32スレッドのセットである。

3.0はNVIDIA Ada Lovelaceアーキテクチャの新しい第4世代Tensor Coreとオプティカルフローアクセラレータによってのみ動作する。

Remove ads

他社の競合技術

  • AMD FSR
  • Intel XeSS

脚注

関連項目

外部リンク

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads