クアルコムは、Android スマートフォン上でローカルに動作する AI である ControlNet を再びデモしています。ソース画像と説明から、12 秒で画像を生成できます。
AI の未来が、大量のデータが詰まった大規模なサーバーで展開されなかったらどうなるでしょうか。GPU、しかし逆に、私たちのデバイス上で私たちに非常に近いです。これが達成しようとするものですクアルコムの創設者SoC注ぐスマートフォンなどラップトップ。メーカーは、次のプログラムを作成することに成功しました。人工知能簡単なスマートフォンから画像を生成できます。
2月にクアルコムは、安定した拡散Androidスマートフォンで。メーカーは期間中に実験を繰り返しました。コンピュータビジョンとパターン認識に関するカンファレンス(CVPR) は、米国の電子技術者の専門家団体である IEEE が毎年主催する科学会議です。
AI に関する科学研究を専門とするクアルコムの部門は、15 億のパラメーターで構成される視覚および言語 AI モデル (LVM) である ControlNet を発表しました。画像とテキストの説明を入力として Stable Diffusion に指示することで、画像の生成を正確に制御できます。
画像を生成するには合計 16 のステップが必要です。でQualcomm AI Research が公開したビデオデモAI がオブジェクトの輪郭を作成し、色とテクスチャを追加して、最終的に 2 つを結合することがわかります。
なぜAIを働かせるのか?ローカルで»
全てスマートフォン上で動作し、12秒以内に画像を生成できるモデル。ここでの特別な点は、インターネットやクラウド サービスへのアクセスが必要ないことです。計算は Qualcomm チップ上で直接実行されます。使用したモデルは市販のスマートフォンではなく、クアルコムが開発したテスト端末で、Snapdragon 8 Gen 2 チップ。
AIを活用するメリットローカルで» クアルコムによれば、複数あります。この方法は、より安価で効率的で、より高度なパーソナライゼーション、データ保護、セキュリティを提供します。これにより、AI による画像生成に伴う電力消費も削減されます。これは、地球温暖化と消費量削減の観点から、ますます重要な課題となっています。
ただし、これは単なるデモンストレーションです。示されている例からわかるように、結果は、より高度な AI モデルである Midjourney が提供できるものとは程遠いものです。バージョン5では。
注目されがちな手法グーグル、許可したい人はChrome で直接 AI 生成を行う。テキスト ジェネレーターに関しては、LLaMA が知られています。Meta の言語モデルが数か月前に流出、コンピュータ上で実行できます。