DeepMind は人間よりも唇を読み取ることができるようになりました。これは、数千時間のテレビ番組で AI を訓練した Google の人工知能部門の研究者らによる発表です。
Google は、次の分野での取り組みを続けています。人工知能そして、DeepMind から新たな偉業を発表したところです。世界最高の囲碁プレイヤーの一人に勝った後、人間よりも唇を読むことができるようになりました。
唇を読むのに5000時間費やした
DeepMind の新たな偉業は、BBC のさまざまな番組で人間の唇を読み取るために何千時間も費やしてきたことによって可能になりました。この膨大なリソースのおかげで、彼は次の資料を収集することができました。118,000フレーズ分析すること。そこで研究者らは「」と呼ばれるモデルを開発した。見て、聞いて、参加して、綴ってください”。これにより、高レベルの人間のインタープリタよりも優れた結果を得ることができ、次のことが可能になります。単語の 46.8% を解読できるのに対し、人間の通訳はわずか 12.4%、2010 年から 2015 年までの BBC 番組からランダムに選ばれたビデオ。
どのような用途に?
この大量のデータは、この分野の他の研究者も活用できるように公開する必要があります。これらの新機能により、パフォーマンスが向上する可能性があります。Googleのような音声アシスタント。あるいは、彼はできるかもしれないより名誉ある目的を果たす、したがって、たとえば、聴覚障害者や聴覚障害者の日常生活を支援します。テクノロジーが監視ツールの改善に利用されるのではないかと懸念しているなら、そこには大きなハードルがあります。実際、これらのシーンはすべて、非常に明るく管理された環境でテレビで放映されています。したがって、特に夜間に、路上で通行人の唇を読むことは、現時点では依然として不可能な領域にとどまります。