コンピューターへの入力は、キーボードやマウスの他に、音声(マイク)や写真(カメラ)がある。この音声や画像の認識能力がこの1年で更に向上した。
まず、音声だが、話し言葉を認識する率はどんどん向上している。
話し言葉を認識できない割合が、昨年7月には8.5%だったのが、現在では4.9%と減ってきている。
また、Google Homeでは、人の話を認識するために8つのスピーカーを使っていたが、現在では2つのスピーカーで認識できるようになった。さらに、家庭内での6人までの人を認識することも出来る。これらの改善はディープラーニングのおかげである。
音声で改善されたのと同様に、画像でも改善は行われている。
上のような写真を見て、それがどんな場面かを読み取ることができる。写真に写っているあらゆるものを分析して、写真を総合的に判断する。上の画面のように、少年、腕、家族、パーティ、ろうそく、ケーキ、喜びの顔、などを読み取っているのだ。
従って、上のグラフにあるように、画像認識は人間よりもレベルがなくなった。
また、Google Pixlirを使用して、ノイズのある写真を、ノイズのないきれいな絵に修正できる。
上の写真が夜間に撮影したノイズのある元の写真で、下がそれをノイズを取り除いて修正した写真である。
また、写真の中の邪魔なものを取り除く技術も向上した。
上の写真のように金網が写っている写真を金網を自動的に取り除いて、下の写真のようにすることも近々できるようになる。
写真を使用したアシスタント機能も向上した。
撮った花がなんという花かを教えてくれる。
ネットワークセッティング用のIDとパスワードのバーコードを読み取り、それを使ってネットワークに接続してくれる。
街の中でお店を撮るとそのお店の情報を教えてくれる。
以上、音声と画像に関連するGoogleの取り組みの紹介があった。
登録:
コメントの投稿 (Atom)
なぜ中東問題は解決しないのか?イギリスが仕掛けた「絶対に解けない罠」
先日、 『なぜ中東問題は解決しないのか?100年前にイギリスが仕組んだ「絶対に解けない罠」』 というYouTube動画を見ました。 この動画は、現在も泥沼化が続く中東紛争の源流にある「イギリスが仕組んだ罠」について詳しく説明しており、現代社会を生きる私たちへの教訓も示されてい...
-
元大蔵省(現在の財務省)官僚で経済学者の高橋洋一先生のYouTube動画、「自民党がAI提言 そもそもAIの実力はどうなの?実践してみた」を視聴しました。 この動画は、最新版のChatGPTを使用し、東京都区部消費者物価指数を題材に「AIが最近の物価動向をどこまで正しく理解し...
-
Pythonのバージョンを 3.12.1 にアップデートしたら、これまで使っていた日本語化モジュール「japanize-matplotlib」が使えなくなってしまった。 japanize-matplotlibは、matplotlibのフォント設定を自動で日本語化するモジュールで...
-
2週間ほど前だったと思うのだが、「ディスク管理」を開こうとしたところ、 「このアプリは保護のためにブロックされました」というメッセージが出てきて、ディスク管理が使えなくなっていた。 このディスク管理が使えなくなるという問題は、ネット検索をするといくつか対処方法が書かれている。た...










0 件のコメント:
コメントを投稿