Ada Lovelace アーキテクチャ、GeForce RTX 4000、DLSS 3、2022 年に発表される Nvidia の新機能について知っておくべきすべてがここにあります。
Nvidia は、2022 年 9 月 20 日の GTC Beyond GeForce カンファレンスで、GeForce RTX 4000 グラフィックス カードを発表しました。これらの新しいカードは、Ada Lovelace アーキテクチャを使用しています。
グラフィックスカード
Nvidia GeForce RTX 4090
GeForce RTX 4090 は、Nvidia の Ada Lovelace グラフィックス カードの中で最も強力です。
その特徴は次のとおりです。
- AD102
- 16384 CUDA カラー
- 512 Tensore コア (第 4 世代)
- 128 RT コア (第 3 世代)
- 周波数ブースト: 2520 MHz
- VRAM : 24 Go GDDR6X – 384 ビット – 21 Gb/s
- メモリ帯域幅: 1000 GB/秒
- デュアル NVENC エンジン (互換性のあるアプリで 2 倍高速なエンコード)
- TSMC 4N
- TGP:450W
- チップサイズ: 608.5 mm²
GeForce RTX 4090 は、2022 年 10 月 12 日に 1,949 ユーロから発売されます。
Nvidia GeForce RTX 4080 (16 GB)
GA102 チップをベースとした GeForce RTX 3080 の後継として、Nvidia は AD103 チップを搭載した 16 GB バージョンの GeForce RTX 4080 を提供しています。
- AD103
- 9728 CUDA カラー
- 304 Tensore コア (第 4 世代)
- 76 RT コア (第 3 世代)
- 周波数ブースト: 2505 MHz
- VRAM : 16 Go GDDR6X – 256 ビット – 22,4 Gb/s
- メモリ帯域幅: 716.8 GB/秒
- デュアル NVENC エンジン (互換性のあるアプリで 2 倍高速なエンコード)
- TSMC 4N
- TGP:320W
- チップサイズ: 378.6 mm²
GeForce RTX 4080 (16GB) は 2022 年 11 月に 1,469 ユーロから発売されます。
Nvidia GeForce RTX 4080 (12 GB)
GA104 チップが GeForce RTX 3070 を生み出したとすれば、Nvidia は AD104 チップについて、グラフィックス カードを GeForce RTX 4080 (12GB) と命名することにしました。
GeForce RTX 4080 16 GB と GeForce RTX 4080 12 GB はメモリの変更だけでなく、特性も大きく異なるため、混乱を招く可能性のある名前です。
- AD104
- 7680 CUDA コア
- 240 Tensore コア (第 4 世代)
- 60 RT コア (第 3 世代)
- 周波数ブースト: 2610 MHz
- VRAM : 12 Go GDDR6X – 192 ビット – 21 Gb/s
- メモリ帯域幅: 504 GB/秒
- デュアル NVENC エンジン (互換性のあるアプリで 2 倍高速なエンコード)
- TSMC 4N
- TGP:285W
- チップサイズ: 294.5 mm²
GeForce RTX 4080 (12GB) は 2022 年 11 月に 1099 ユーロから発売されます。
L'Architecture エイダ・ラブレス
Ada Lovelace は、コンシューマ カード向けに 2022 年に発売された Ampere の後継となる Nvidia の新しいアーキテクチャの名前です。ハイパフォーマンス コンピューティングの分野では、Nvidia は Ada のいとこである Hoper アーキテクチャも提供しています。したがって、この巨人は、2018年に最初のカードに採用した、デュアルVoltaおよびTuringアーキテクチャの戦略を再開しています。レイトレーシング。
Nvidia は、Ada Lovelace をいくつかの柱に基づいて、同等の消費でより多くのコンピューティング パワーを約束します。
- TSMC 4Nの製造プロセス
- RT コアの新しいアーキテクチャ
- シェーダー実行の並べ替え
- DLSS 3 用の新しいオプティカル フロー アクセラレータ
- AV1ビデオエンコーディング用の新しいNVENCエンジン
TSMC 4N: トランジスタ数の増加
新しい機能の最初は、TSMC 4N 製造プロセスへの移行です。これは、Ampere GeForce RTX 3000 カードで使用されている Samsung 8nm プロセスを置き換えるもので、Nvidia はチップの動作周波数を高めるだけでなく、トランジスタの数、つまり処理ユニットの数もさらに増やすことができます。
Nvidia は、完全な Ada Lovelace AD102 チップにおいて、450W TGP に 2.5 GHz を超える周波数を備えた 763 億個のトランジスタまたは 18,432 個の CUDA コア (Ampere GA102 より 70% 多い) を統合すると発表しました。
比較のために、Apple M1 Max チップには 570 億個のトランジスタがあり、CPU、GPU、その他の要素が統合された完全な SoC です。競争という点では、AMD の最高の RDNA 2 チップは 268 億トランジスタで止まります。
新しい RT コア
Nvidia は、グラフィックス カードのパフォーマンスを向上させるために、コンピューティング ユニットの数を直線的に増やしただけではありません。このメーカーは、レイ トレーシングに関連した計算を担当する RT コアの新しいアーキテクチャも強調しています。
第 3 世代の RT コアは、三角形と光線の交差を 2 倍の速さでテストすることを約束します。
Nvidia は、Opacity Micromap Engine を追加しました。これにより、透明度のあるテクスチャを使用するモデルでのレイ トレーシング効果が高速化されます。一言で言えば、これにより、モデルのどの部分が不透明で、どの部分が透明かを判断しやすくなります。
最後に、Displaced Micro-Mesh Engine は、ますます複雑になる 3D オブジェクトのジオメトリをより適切に管理するのに役立ちます。
これらすべてにより、より正確で高速なレンダリングが可能になります。前世代では、レイ トレーシングは、特定の環境または特定のモデル、特に非常に密集したフォリッジで限界が見つかりました。
シェーダー実行の並べ替え
哲学的には似ているアウトオブオーダー実行プロセッサーの (アウトオブオーダー実行)、Shader Execution Reordering は新しいコンピューティング技術です。
これには、レイ トレーシング作業を最適化するためにシェーダー計算の順序を動的に再編成することが含まれます。 Nvidia によると、この機能だけで、Cyberpunk 2077 のパフォーマンスを最大 44% 向上させることができます。レイトレーシングオーバードライブが作動しました。
AV1をサポートしていますか
Ada Lovelace の最新ニュースは、コンテンツ クリエイターに関するものです。このアーキテクチャには、第 8 世代の NVENC エンコード ハードウェア エンジンが統合されました。特に、同じビット レートでより良い画質を可能にする AV1 コーデックのエンコーディングが追加されています。 AV1 エンコードは H.264 よりも 40% 効率的です。
DLSS3
DLSS 2.0 は、近年 Nvidia によって開発された最高のテクノロジーの 1 つとしての地位を確立しました。 DLSS をゲームで提供すると、AI によって画像の解像度を高めることができます。より具体的には、これにより、ゲームのレンダリング解像度を下げてパフォーマンスを向上させ(720p ゲームは 4K ゲームよりも計算が容易です)、その後 AI によって解像度を上げ、2 つのテーブルで利益を得ることが可能になります。品質とパフォーマンス。
DLSS 3 は、次のシステムを追加することでさらに進化しています。フレーム生成したがって、追加のフレームが人為的に計算され、ゲームのパフォーマンスがさらに向上します。Nvidia によると、これにより DLSS 2 と比較して 1 秒あたりのフレーム数を 2 倍にすることが可能になります。
このバージョンの DLSS は Ada Lovelace 専用であり、GeForce RTX 4000 に搭載された新しいオプティカル フロー アクセラレータ エンジンが必要です。
フル フレームを追加すると追加の遅延が発生する可能性があるため、DLSS 3 を提供するゲームには Nvidia Reflex も含まれています。レイテンシーを補償できるようにする必要があります。これはやはり、DLSS 3 がそもそも競技ゲームを目的とすべきではないことを意味します。
一方、プロセッサによって制限されるゲームでは、グラフィックス カードが完全な自律性で 1 秒あたりのフレームを追加できる DLSS 3 から大きな恩恵を受けるはずです。このように Nvidia は、CPU によって非常に制限されることが知られている Microsoft Flight Simulator ゲームでデモを行いました。
DLSS 3 を、レイ トレーシングを備えたゲーム上の Ada アーキテクチャの他の新機能と組み合わせることで、Nvidia はパフォーマンスが最大 4 倍向上することを約束します。