AI に興味があり、有料サービスを使用せずにテキストや画像を自分で生成したいと考えていますか?第 30 世代または第 40 世代の Nvidia GeForce RTX カードをお持ちの場合は、(かなり) 簡単に実行できます。その方法については、この記事で説明します。
もし後ろの企業がチャットGPT、旅の途中、またはGoogle ジェミニサーバーの Nvidia グラフィック カードに依存して生成 AI を実行しているのに、なぜ同じことができないのでしょうか?実際には、それは十分に可能です。 Nvidia は数か月間、個人が実行できる無料ツールを提供してきました。LLM の (大規模言語モデル)または拡張機能を使用して、ローカルで安定した拡散を利用してパフォーマンスを向上させます。手を汚すことを恐れずに恩恵を受ける限り、グラフィックスカード 十分なVRAMを搭載、これらのツールのインストールは比較的簡単です。
ChatRTX: 自分のドキュメントを分析するための生成テキスト AI
2024 年 2 月から利用可能、チャットRTXコンピューターの能力とデータのみに基づいて ChatGPT クローンを作成することを約束します。実行するには、次のような構成が必要です。
- Nvidia グラフィックス カード少なくとも 8 GB の VRAM を備えた世代 30 または 40
- 16GBのRAM
- Windows 10 または 11
- SSD 上のスペース: 最低 35 GB
これらの前提条件があれば、この LLM インターフェイスのインストールと使用は非常に簡単です。これは実行可能ファイルによって自動的に行われます。大したことではないように思えますが、この構成作業がバックグラウンドで自動的に実行されるという事実自体が、すでに小さな功績です。
ChatRTX を初めて起動する場合は、混乱する可能性があります。コマンドラインを含むウィンドウが表示され、不明瞭なプログラムが実行されます。この窓口は「シェル» がプログラムの核心です。バックグラウンドで実行されている推論プロセスを視覚化すること以外に、何もすることも入力することもまったくありません。
AI 自体との対話は Web ブラウザー (Web UI) 経由で行われ、コンピューター上のローカル IP アドレスでホストされ、シンプルなインターフェイスで表示されます。ユーザーのリクエストを有名なシェル ウィンドウに変換するのは、このインターフェイスです。
ChatRTX の主な特徴は、この AI が機能するためにインターネット接続を必要としないことです。ナレッジ ベース (この場合は、PC 上でユーザーにアクセスを許可することに同意したファイル) を提供するかどうかはユーザーの責任です。現在、AI がスキャンできるのはテキスト形式と PDF 形式のみです。たとえば、大きな PDF ドキュメントに目を通したり、電子ブックのライブラリで要約したりする場合、これは答えを見つけるのに非常に興味深いものになる可能性があります。
Cookie やその他のトラッカーを受け入れていないため、このコンテンツはブロックされています。このコンテンツは YouTube によって提供されています。
これを表示するには、YouTube によるお客様のデータの使用を受け入れる必要があります。この使用は、コンテンツの表示とソーシャル メディアでの共有を可能にし、Humanoid とその製品の開発と改善を促進する目的で使用される可能性があります。パートナー、あなたのプロフィールとアクティビティに基づいてパーソナライズされた広告を表示し、パーソナライズされた広告プロファイルを定義し、このサイト上の広告とコンテンツのパフォーマンスを測定し、このサイトの視聴者を測定します(もっと詳しく知る)
「すべてを受け入れる」をクリックすると、Humanoid とそのパートナー。
あなたはいつでも同意を撤回するオプションを保持します。詳細については、ぜひお読みください。クッキーポリシー。
このビデオ (英語) は、ChatRTX の機能を非常に明確に示しています。
LLM をローカルで実行するための最先端のテクノロジー
この結果をローカルで達成するために、Nvidia は主に 3 つのテクノロジーに依存しました。回復によって世代が拡大(検索拡張生成またはRAG)、オープンソース ライブラリ TensorRT-LLMそして最後にAmpere アーキテクチャに基づいたチップであらゆるものに電力を供給。 RAG テクノロジは、LLM をユーザーの PC 上に存在するデータに接続する役割を果たします。TensorRT-LLM ライブラリは Tensor コアを使用しますグラフィックス カードを使用して AI 分析を最適化し、強化します。
ChatRTX は現在デモ段階にのみあります。 Nvidia は時間をかけて改良し、数か月以内に完全版を提供する予定です。 Nvidia は現在、LLM を操作するために簡単にインストールして使用できるツールを提供している唯一のプレーヤーです。
ChatRTXは写真を分析できます
Nvidia はソフトウェアを継続的に改善しており、数か月以内に完全版を提供する予定です。最新のアップデートは 2024 年 5 月 1 日にリリースされ、多くの新機能が追加されました。
- Google の最新 LLM である Gemma や、オープンなバイリンガル (英語と中国語) LLM である ChatGLM3 などの新しい LLM がサポートされています。
- ソース可能なファイル内の写真のサポート。このようにして、ChatRTX ユーザーは、複雑なメタデータにラベルを付けることなく、自分の写真データをローカルで簡単に検索して操作できます。OpenAI CLIP機能。
- ChatRTX が話し言葉を理解できるようになった AI 自動音声認識システムである Whisper のサポートのおかげで、ChatRTX ユーザーは自分のデータを使って (マイクを使って) 話すこともできます。
TensorRT と安定拡散を使用して画像を生成する
自分のPCからAIによる画像生成も可能です。このタイプの操作で最も簡単なのは、やはり安定拡散を使用することです。インストールするには、次の前提条件が必要です。
- GitHub アカウント (ダウンロードとインストール用)自動1111) ;
- アカウントハグ顔;
- Python バージョン 3.10 をダウンロードしてインストールします (お勧めします)Microsoft Storeを経由する設置を容易にするため);
- ハードドライブ上に約 30 GB の空き容量。
- 初めて行う場合は、インストールに少なくとも 1 時間はかかります。
AUTOMATIC1111 インターフェイスを使用して PC に Stable Diffusion をローカルにインストールするプロセスについては詳しく説明しません。エマニュエル・コレイアYouTube チャンネル AiAndPixels より非常にわかりやすくフランス語で説明しています。
Cookie やその他のトラッカーを受け入れていないため、このコンテンツはブロックされています。このコンテンツは YouTube によって提供されています。
これを表示するには、YouTube によるお客様のデータの使用を受け入れる必要があります。この使用は、コンテンツの表示とソーシャル メディアでの共有を可能にし、Humanoid とその製品の開発と改善を促進する目的で使用される可能性があります。パートナー、あなたのプロフィールとアクティビティに基づいてパーソナライズされた広告を表示し、パーソナライズされた広告プロファイルを定義し、このサイト上の広告とコンテンツのパフォーマンスを測定し、このサイトの視聴者を測定します(もっと詳しく知る)
「すべてを受け入れる」をクリックすると、Humanoid とそのパートナー。
同意はいつでも撤回できます。詳細については、ぜひお読みください。クッキーポリシー。
時間を節約して手順をスキップするために、ダウンロードしてインストールすることもできます安定性マトリックス。これはインストーラーですオールインワン» これにより、作成するさまざまなソフトウェアやアカウントのバージョンについて質問する必要がなくなります。
すべてがうまくいけば、Web ブラウザー (Web UI) に表示されるビジュアル インターフェイスにアクセスできるようになります。非常に完成度が高く、公式の Stable Diffusion オンライン インターフェイスよりもいくつかのオプションが提供されています。ただし、それを理解するには、いくつかのチュートリアルやその他のオンライン ドキュメントを参照することをお勧めします。
AI による画像生成における Nvidia GeForce RTX 30 または 40 グラフィックス カードの利点
ハードウェア側では、イメージを生成するために Nvidia GeForce グラフィックス カードを搭載することは必須ではありません。ただし、イメージ生成を開始するための最小構成は堅牢である必要があります。始めるにはプロンプター良好な状態では、PC に少なくとも 8 GB の VRAM と 16 GB の RAM を搭載した GPU を数えてください (快適に使用するには、これらの値を 2 倍にします)。一方、すべてのグラフィックス カードのパフォーマンスが同じというわけではありません。この分野では、Nvidia が良いスタートを切りました。
実際、最初に実行されたベンチマークはプロキオン入り3D Mark の作成者による新しいベンチマーク ソフトウェアであることは明らかです。公開された結果シェハードウェアと共同競合他社に対する Nvidia の GeForce の優位性を非常に明確に示しています。単純»GeForce RTX 4070したがって、競合他社の最も高価なグラフィックス カードよりも高いスコアが得られます。
Nvidia: 生成 AI の世界で一歩先を行く
Nvidia の AI 分野での進歩としては、これは驚くべきことではありません。ディープラーニング特にソフトウェアの側面が重要です。同社は単に生産するだけではなく、ハードウェア現場で最も効率的であり、それを最大限に活用するためのドライバーとソフトウェア拡張機能も提供します。 Nvidia エンジニアが最近提供したのは、安定拡散専用の TensorRT ライブラリの拡張機能:安定した拡散 Web UI のための TensorRT 拡張機能AUTOMATIC1111 のインターフェースに直接接続できます。
Cookie やその他のトラッカーを受け入れていないため、このコンテンツはブロックされています。このコンテンツは YouTube によって提供されています。
これを表示するには、YouTube によるお客様のデータの使用を受け入れる必要があります。この使用は、コンテンツの表示とソーシャル メディアでの共有を可能にし、Humanoid とその製品の開発と改善を促進する目的で使用される可能性があります。パートナー、あなたのプロフィールとアクティビティに基づいてパーソナライズされた広告を表示し、パーソナライズされた広告プロファイルを定義し、このサイト上の広告とコンテンツのパフォーマンスを測定し、このサイトの視聴者を測定します(もっと詳しく知る)
「すべてを受け入れる」をクリックすると、Humanoid とそのパートナー。
あなたはいつでも同意を撤回するオプションを保持します。詳細については、ぜひお読みください。クッキーポリシー。
生成 AI 分野における Nvidia の進歩はすぐには止まらないでしょう。このアメリカのブランドは現在、ビデオ ゲームにおけるテキスト、ビデオ、画像の生成、アートにおける画像の生成と 3D 表現など、AI のあらゆる面で活躍しており、Nvidia はあらゆる場所に存在しています。メーカーのハードウェアおよびソフトウェア ソリューションが提供する可能性の範囲を発見するために、この分野の進歩を見逃さないように、ブランドのブログにも専用のセクションがあります。