Ada Lovelace アーキテクチャ、GeForce RTX 4000、DLSS 3、2022 年に発表される Nvidia の新機能について知っておくべきすべてがここにあります。

Nvidia は、2022 年 9 月 20 日の GTC Beyond GeForce カンファレンスで、GeForce RTX 4000 グラフィックス カードを発表しました。これらの新しいカードは、Ada Lovelace アーキテクチャを使用しています。

グラフィックスカード

Nvidia GeForce RTX 4090

GeForce RTX 4090 は、Nvidia の Ada Lovelace グラフィックス カードの中で最も強力です。

その特徴は次のとおりです。

  • AD102
  • 16384 CUDA カラー
  • 512 Tensore コア (第 4 世代)
  • 128 RT コア (第 3 世代)
  • 周波数ブースト: 2520 MHz
  • VRAM : 24 Go GDDR6X – 384 ビット – 21 Gb/s
  • メモリ帯域幅: 1000 GB/秒
  • デュアル NVENC エンジン (互換性のあるアプリで 2 倍高速なエンコード)
  • TSMC 4N
  • TGP:450W
  • チップサイズ: 608.5 mm²

GeForce RTX 4090 は、2022 年 10 月 12 日に 1949 ユーロから発売されます。

Nvidia GeForce RTX 4080 (16 GB)

GA102 チップをベースとした GeForce RTX 3080 の後継として、Nvidia は AD103 チップを搭載した 16 GB バージョンの GeForce RTX 4080 を提供しています。

  • AD103
  • 9728 CUDA カラー
  • 304 Tensore コア (第 4 世代)
  • 76 RT コア (第 3 世代)
  • 周波数ブースト: 2505 MHz
  • VRAM : 16 Go GDDR6X – 256 ビット – 22,4 Gb/s
  • メモリ帯域幅: 716.8 GB/秒
  • デュアル NVENC エンジン (互換性のあるアプリで 2 倍高速なエンコード)
  • TSMC 4N
  • TGP:320W
  • チップサイズ: 378.6 mm²

GeForce RTX 4080 (16GB) は 2022 年 11 月に 1,469 ユーロから発売されます。

Nvidia GeForce RTX 4080 (12 GB)

GA104 チップが GeForce RTX 3070 を生み出したとすれば、Nvidia は AD104 チップについて、グラフィックス カードを GeForce RTX 4080 (12GB) と命名することにしました。

GeForce RTX 4080 16 GB と GeForce RTX 4080 12 GB はメモリの変更だけでなく、特性も大きく異なるため、混乱を招く可能性のある名前です。

  • AD104
  • 7680 CUDA コア
  • 240 Tensore コア (第 4 世代)
  • 60 RT コア (第 3 世代)
  • 周波数ブースト: 2610 MHz
  • VRAM : 12 Go GDDR6X – 192 ビット – 21 Gb/s
  • メモリ帯域幅: 504 GB/秒
  • デュアル NVENC エンジン (互換性のあるアプリで 2 倍高速なエンコード)
  • TSMC 4N
  • TGP:285W
  • チップサイズ: 294.5 mm²

GeForce RTX 4080 (12GB) は 2022 年 11 月に 1099 ユーロから発売されます。

L'Architecture エイダ・ラブレス

Ada Lovelace は、コンシューマ カード向けに 2022 年に発売された Ampere の後継となる Nvidia の新しいアーキテクチャの名前です。ハイパフォーマンス コンピューティングの分野では、Nvidia は Ada のいとこである Hoper アーキテクチャも提供しています。したがって、この巨人は、2018年に最初のカードに採用した、デュアルVoltaおよびTuringアーキテクチャの戦略を再開しています。レイトレーシング

Nvidia は、Ada Lovelace をいくつかの柱に基づいて、同等の消費でより多くのコンピューティング パワーを約束します。

  • TSMC 4Nの製造プロセス
  • RT コアの新しいアーキテクチャ
  • シェーダー実行の並べ替え
  • DLSS 3 用の新しいオプティカル フロー アクセラレータ
  • AV1ビデオエンコーディング用の新しいNVENCエンジン

TSMC 4N: トランジスタ数の増加

新しい機能の最初は、TSMC 4N 製造プロセスへの移行です。これは、Ampere GeForce RTX 3000 カードで使用されている Samsung 8nm プロセスを置き換えるもので、Nvidia はチップの動作周波数を高めるだけでなく、トランジスタの数、つまり処理ユニットの数もさらに増やすことができます。

Nvidia は、完全な Ada Lovelace AD102 チップにおいて、450W TGP に 2.5 GHz を超える周波数を備えた 763 億個のトランジスタまたは 18,432 個の CUDA コア (Ampere GA102 より 70% 多い) を統合すると発表しました。

Ada Lovelace に基づく AD102 チップの回路図 // 出典: Nvidia

比較のために、Apple M1 Max チップには 570 億個のトランジスタがあり、CPU、GPU、その他の要素が統合された完全な SoC です。競争という点では、AMD の最高の RDNA 2 チップは 268 億トランジスタで止まります。

新しい RT コア

Nvidia は、グラフィックス カードのパフォーマンスを向上させるために、コンピューティング ユニットの数を直線的に増やしただけではありません。このメーカーは、レイ トレーシングに関連した計算を担当する RT コアの新しいアーキテクチャも強調しています。

第 3 世代の RT コアは、三角形と光線の交差を 2 倍の速さでテストすることを約束します。

Nvidia は、Opacity Micromap Engine を追加しました。これにより、透明度のあるテクスチャを使用するモデルでのレイ トレーシング効果が高速化されます。一言で言えば、これにより、モデルのどの部分が不透明で、どの部分が透明かを判断しやすくなります。

図 b の不透明度マイクロマップ // 出典 : Nvidia

最後に、Displaced Micro-Mesh Engine は、ますます複雑になる 3D オブジェクトのジオメトリをより適切に管理するのに役立ちます。

これらすべてにより、より正確で高速なレンダリングが可能になります。前世代では、レイ トレーシングは、特定の環境または特定のモデル、特に非常に密集したフォリッジで限界が見つかりました。

シェーダー実行の並べ替え

哲学的には似ているアウトオブオーダー実行プロセッサーの (アウトオブオーダー実行)、Shader Execution Reordering は新しいコンピューティング技術です。

これには、レイ トレーシング作業を最適化するためにシェーダー計算の順序を動的に再編成することが含まれます。 Nvidia によると、この機能だけで、Cyber​​punk 2077 のパフォーマンスを最大 44% 向上させることができます。レイトレーシングオーバードライブが作動しました。

AV1をサポートしていますか

Ada Lovelace の最新ニュースは、コンテンツ クリエイターに関するものです。このアーキテクチャには、第 8 世代の NVENC エンコード ハードウェア エンジンが統合されました。特に、同じビットレートでより良い画質を可能にする AV1 コーデックのエンコーディングが追加されています。 AV1 エンコードは H.264 よりも 40% 効率的です。

DLSS3

DLSS 2.0 は、近年 Nvidia によって開発された最高のテクノロジーの 1 つとしての地位を確立しました。 DLSS をゲームで提供すると、AI によって画像の解像度を高めることができます。より具体的には、これにより、ゲームのレンダリング解像度を下げてパフォーマンスを向上させ(720p ゲームは 4K ゲームよりも計算が容易です)、その後 AI によって解像度を上げ、2 つのテーブルで利益を得ることが可能になります。品質とパフォーマンス。

DLSS 3 は、次のシステムを追加することでさらに進化しています。フレーム生成したがって、追加のフレームが人為的に計算され、ゲームのパフォーマンスがさらに向上します。Nvidia によると、これにより DLSS 2 と比較して 1 秒あたりのフレーム数を 2 倍にすることが可能になります。

このバージョンの DLSS は Ada Lovelace 専用であり、GeForce RTX 4000 に搭載された新しいオプティカル フロー アクセラレータ エンジンが必要です。

フル フレームを追加すると追加の遅延が発生する可能性があるため、DLSS 3 を提供するゲームには Nvidia Reflex も含まれています。レイテンシーを補償できるようにする必要があります。これはやはり、DLSS 3 がそもそも競技ゲームを目的とすべきではないことを意味します。

一方、プロセッサによって制限されるゲームでは、グラフィックス カードが完全な自律性で 1 秒あたりのフレームを追加できる DLSS 3 から大きな恩恵を受けるはずです。このように Nvidia は、CPU によって非常に制限されることが知られている Microsoft Flight Simulator ゲームでデモを行いました。

DLSS 3 を、レイ トレーシングを備えたゲーム上の Ada アーキテクチャの他の新機能と組み合わせることで、Nvidia はパフォーマンスが最大 4 倍向上することを約束します。


Twitch ショー「SURVOLTÉS」隔週水曜日の午後 5 時から午後 7 時までです。電気自動車や電動自転車、ディベート、インタビュー、分析、ゲームなどについてお話しましょう。