人工知能についてはどこでも、時には何についても耳にします。しかし、彼女は本当に何ができるのでしょうか? AIの具体的な活用例をご紹介します。
集団的想像力の中に存在する人工知能は、SF のファンタジーです。 HAL 9000 のことは忘れてください、アシモフのロボットのことは忘れてください、ターミネーターの T800 のことは忘れてください。私たちの人工知能はまだ目標からは程遠いです。 2018年末、FacebookのAI研究責任者ヤン・ル・クン氏はこう宣言した。人工知能はネズミの脳のレベルにも達していない»。
幻想に騙される人もいるかもしれないが、Googleアシスタント, Alexa、特に Siri は実際に私たちと会話することはできません。これらのパーソナル アシスタントは、対応するサービスから事前定義された回答を取得するために、文章を区切る特定の用語を部分的にしか理解しません。彼ら全員はチューリングテストに合格するにはまだ程遠いです。Google Duplex、会話型 AIGoogle I/O 2018 で発表またはアリババが開発した中国のライバル。
ただし、AI(英語ではAI)人工知能)どこにでも存在します。この言葉を一度も言及したことのないテクノロジーカンファレンスはほとんどありません。では、それは実際には何であり、何のためにあるのでしょうか?
人工知能とは何ですか?
私たちは現在の AI を、SF 作品の中で説明されているものとして見るのではなく、AI を通じて自らを学習したデバイスとして見るべきです。機械学習。おかげでニューラルネットワーク人工知能は大量のデータを活用して、2 つのテスト応答の違いを識別することで特定の要素を認識し、最終的には自ら改善することができます。
その後、必要な答えが得られるようにすべてを調整するのはプログラマーの責任です。たとえば、小さくて毛が生えていて尻尾があるものはすべて猫だと AI に教えることは可能ですが、犬を見せられると誤ってしまう危険性があります。したがって、全体を調整して (たとえば)「ニャー」パラメータを追加する必要があります。そうしないと、応答が広範になりすぎる危険があります。
それでも今日、人工知能は非常に専門化されており、研究分野の数とほぼ同じ数があります。たとえば、Google フォトの AI は非常に優れていますが、Google Home のリクエストに応答するものではなく、その逆も同様です。
また、現在、人工知能に関するプロジェクトが非常に多くあります。多くの用途に使用できる具体的なプロジェクト。一般の人々もアクセスできる場合もあります。日常的にはあまり役に立たないものもあります (例:顔を作成できるこのAI) ですが、日常生活ではもっと実用的なものもあります。
人工知能は何に使われますか?
AI には複数のユースケースがあります。これにより、特定の既存の要素を改善したり、ハードウェアの制限を置き換えたりすることができます。ザグーグルピクセルこれは、写真の前景と後景に何があるかをほぼソフトウェアだけで判断できる、特に洗練されたポートレート モードを備えた完璧な例です。しかし、人工知能にはどのような可能性があるのか見てみましょう。
写真やビデオの場合
上で述べたように、イメージングは人工知能の統合に役立つ分野であり、より小型の製品で最高の品質を提供したいと考えています。 Google は、ポートレート モードだけでなく、何よりもナイト モードを備えており、この分野で重要な役割を果たしています。
単純な長い休憩よりもはるかに効果的です。Googleの「夜景」モード完全にブロックされた領域の情報を復元し、デジタルノイズなしで情報を転写するだけでなく、測色を調整することもできます。そのアイデアは、Pixel 3 のカメラが暗闇の中で目よりもはるかに効率的に赤い靴下を見つけられるようにするというものです。
もちろん、この分野に参入しているのは Google だけではなく、今日では多くのメーカーが多かれ少なかれ説得力のあるナイト モードを提供していますが、これは単純な写真と長い一時停止を組み合わせる単純なアルゴリズムで実現可能であるとよく想像できます。デジタルノイズリダクションシステム。現時点では、Pixel のようにこの色精度を達成できるものはほとんどありません。
ただし、Oppo や Huawei などの他の企業はズームに重点を置いているため、それぞれに独自の領域があります。望遠レンズを使用して少し近づけ、人工知能がデジタル ズームによって失われたピクセルを「再作成」することで、「ロスレス」の x5 または x10 の「ズーム」が得られます。
また、シーン検出、カメラ設定の調整、目に最適な結果をレンダリングするためのその後のソフトウェア処理、または単純な写真で非常にコントラストの高い画像から情報を見つけることができるすべてのスーパー HDR モードのケースも多数見つかりました (通常は「クラシック」HDR の場合は少なくとも 3 つ必要です)。
人工知能の安定化も一部の人にとっては印象的です。実際、カメラを安定させる方法はいくつかあります。センサーを複数の軸で安定させる方法、レンズを (複数の軸で) 安定させる方法、またはソフトウェア機能を使用する方法があります。現在、多くのメーカーがハードウェアの安定化と、ハードウェアの安定化に基づくハイブリッド技術を使用しています。機械学習これにより、多かれ少なかれ長い一時停止時間でも、ぼやけの少ない写真を撮影できます。ビデオについても同様です。
ただし、これを単純なアルゴリズムと混同しないように注意してください。
ほとんどのピクセルがソフトウェアで再構成された非常に詳細な写真の「超解像度」を約束するものもあります。ただし、これを、近くのピクセルの平均を取ることによって空洞を埋める単純なアルゴリズム (すべての優れた写真編集ソフトウェアに含まれる機能) と混同しないように注意してください。
クアルコムはまた、いくつかのデモンストレーションを実施しました。Snapdragon 855のプレゼンテーションビデオ内でその場でポートレート モード (背景にぼかしを含む) を作成する可能性 (最近、Skype にも同様の機能が統合されました) など、いくつかの用途がありますが、常にその場で背景を完全に変更する可能性もあります。同じジャンルでは、ビデオにおけるインテリジェント フォーカスの向上についても言及できます。
ただし、AI を使用して誰かの顔をビデオに添付することもできるため、すべてがバラ色というわけではありません。一部のポルノ愛好家を喜ばせた。
これらの後者の機能は、主な被写体の顔認識のおかげで特に可能になります。
顔認識と生体認証
顔認識は一般に、人工知能研究において非常に人気のある分野でもあります。なぜなら、長期的には、典型的なプロファイルを定義し、特定の要素を認識することでさらに進歩し、たとえば、顔の表情やその他の筋肉のチックに基づく攻撃を阻止できる可能性があるからです。 。現在でも不正確な研究。
それでも、Google フォトと Apple フォトは、日常的にシーンやオブジェクトを認識する能力の高さを示しています。私の場合、Googleフォトで「缶」を検索すると、実際に飲み物が背景に写っている写真に出会えたのですが、なかなか迫力があります。
さらに進んで、人工知能は多数の生体認証ソリューションを提供し、たとえば、ひげのある顔とない顔、またはメガネの有無を常に同じ精度で認識できます。
ArcSoft、AnyVision、Morpho などのスタートアップ企業は、AI による生体認証を主力製品にしています。
オーディオ
しかし、AI は画像だけに基づいているわけではありません。サウンドの分野でもいくつかの偉業を挙げることができます。もちろん、次のような構成もあります。シューベルトの未完の交響曲を完成させたファーウェイのスマートフォン, しかし、日常的にはもっと具体的なメリットもあります。
主なものは音声認識に関するもので、これにより多くの応用分野が開かれます。リアルタイム翻訳に目を向けた人もいます。Google と Pixel Buds、 だけでなく他のスタートアップ。さらに、外来ノイズの低減に焦点を当てたものもあります。騒がしいバーで電話をかけることを想像してください。発信者にはあなたの声だけが聞こえます。すべて 1 つのマイクで行われます (一方、今日の携帯電話は上部に 2 つ目のマイクを使用して、周囲の騒音を捉えて抑制します)。もう一度、ハードウェア要素の交換に戻ります。
Cookie やその他のトラッカーを受け入れていないため、このコンテンツはブロックされています。このコンテンツは YouTube によって提供されています。
これを表示するには、YouTube によるお客様のデータの使用を受け入れる必要があります。この使用は、コンテンツの表示とソーシャル メディアでの共有の許可、Humanoid とその製品の開発と改善の促進を目的として使用される可能性があります。パートナー、あなたのプロフィールとアクティビティに基づいてパーソナライズされた広告を表示し、パーソナライズされた広告プロファイルを定義し、このサイト上の広告とコンテンツのパフォーマンスを測定し、このサイトの視聴者を測定します(もっと詳しく知る)
「すべてを受け入れる」をクリックすると、Humanoid とそのパートナー。
あなたはいつでも同意を撤回するオプションを保持します。詳細については、ぜひお読みください。クッキーポリシー。
少し異なるジャンルでは、Shazam に似た音楽認識ソリューションや、単に Google に統合されたオプションも挙げることができます。
まだまだこれから
これらは、私たちが日常的に遭遇する可能性のある AI のほんの数例にすぎませんが、もちろん、AI は現在すでに他にも多数の用途に使用されており、今後数年間でさらに多くの用途が登場するでしょう。
たとえば、多くのメーカーが現在 IoT に注力しています。冷蔵庫にカメラが設置されていて、お気に入りの食べ物や飲み物がなくなるとそれを知らせてくれるのを想像してみてください。電波の伝播だけで家の中の人の存在を検出できるルーターを想像してみてください。使用の可能性はほぼ無限です。今残っているのは、それらを発明し、そして何よりも実践することだけです。