コンピューターへの入力は、キーボードやマウスの他に、音声(マイク)や写真(カメラ)がある。この音声や画像の認識能力がこの1年で更に向上した。
まず、音声だが、話し言葉を認識する率はどんどん向上している。
話し言葉を認識できない割合が、昨年7月には8.5%だったのが、現在では4.9%と減ってきている。
また、Google Homeでは、人の話を認識するために8つのスピーカーを使っていたが、現在では2つのスピーカーで認識できるようになった。さらに、家庭内での6人までの人を認識することも出来る。これらの改善はディープラーニングのおかげである。
音声で改善されたのと同様に、画像でも改善は行われている。
上のような写真を見て、それがどんな場面かを読み取ることができる。写真に写っているあらゆるものを分析して、写真を総合的に判断する。上の画面のように、少年、腕、家族、パーティ、ろうそく、ケーキ、喜びの顔、などを読み取っているのだ。
従って、上のグラフにあるように、画像認識は人間よりもレベルがなくなった。
また、Google Pixlirを使用して、ノイズのある写真を、ノイズのないきれいな絵に修正できる。
上の写真が夜間に撮影したノイズのある元の写真で、下がそれをノイズを取り除いて修正した写真である。
また、写真の中の邪魔なものを取り除く技術も向上した。
上の写真のように金網が写っている写真を金網を自動的に取り除いて、下の写真のようにすることも近々できるようになる。
写真を使用したアシスタント機能も向上した。
撮った花がなんという花かを教えてくれる。
ネットワークセッティング用のIDとパスワードのバーコードを読み取り、それを使ってネットワークに接続してくれる。
街の中でお店を撮るとそのお店の情報を教えてくれる。
以上、音声と画像に関連するGoogleの取り組みの紹介があった。
登録:
コメントの投稿 (Atom)
第5回:【基本操作編】回答の質が劇的に変わる「プロンプトのコツ」3つの黄金ルール
1. はじめに:Geminiは「指示待ち」のアシスタントです 第4回までに、Geminiへのアクセス方法と、簡単な質問の仕方をマスターしました。 「卵焼きのレシピ」や「旅行先のアイデア」など、Geminiはすぐに回答を返してくれますが、時々「なんか、欲しい答えとちょっと違うな...
-
GoogleはChromeのバージョン101をリリースした。 新しいバージョンは以下の手順で入手できる。 Chromeの画面で、右上の縦の3つの点をクリックし、出てきたリストから、「ヘルプ」を選択すると、リストが出てくる。そのリストの中の「Google Chromeについて」を...
-
絵画展で素敵な作品を見つけて撮影したのに、斜めから撮ったせいで台形になってしまった…なんて経験はありませんか? そんな時に便利なのが、無料のWebアプリ「Photopea」です。Photopeaを使えば、台形に写ってしまった絵画を簡単に長方形に補正することができます。 ここでは...
-
11月03日(日)付の毎日新聞に掲載されている辛口数独の解き方を説明する。唐辛子のマークが5つついており、たいへん難しい問題という表示になっている。 問題は上のようなものである。 とりあえず、簡単にわかるところだけを埋めてみる。以下のようになる。 これ以上は単純な考え方だけでは...










0 件のコメント:
コメントを投稿