2026年5月20日水曜日

Google I/O発表の最新AIで動画作成に挑戦!「油売りの職人技」は再現できるか?

 5月19日から開催されているGoogle I/Oにて、マルチモーダル機能(Omni)を搭載した新しいGeminiの可能性が示されました。その中で注目したのが、高度な生成能力を活かした動画作成の新機能です。


詳しい説明を聞くよりも「まずは自分で試してみるのが一番!」ということで、早速Gemini Ominiを使って動画作成に挑戦してみました。Google I/Oで発表された「Gemini 1.5 Pro/Flash」を使用して、プロンプトを作成すると、マルチモーダルなリアルタイム会話機能「Project Astra(Omni機能)」で会話する形で、動画作成ができます。


 第一の挑戦:基本のプロンプトを入力


お題として選んだのは、日本の歴史でお馴染みの「油売り(斎藤道三の逸話など)」のワンシーンです。一文銭の小さな穴に油を注ぎ込むという、高度な職人技をAIがどう表現するか試してみました。


入力したプロンプトはこちらです。


> 「日本の戦国時代に一人の油売り商人が道端で店を開いている。あるのは油を入れた壺と、それを汲み出す柄杓だけ。その場所に油を買いに来た客が現れ、油壺を彼の前に置く。その差し出された油壺の口に一文銭を載せ、漏斗(じょうご)を使わずに、少し高い位置から柄杓に入れた油を細く垂らして、一文銭の穴に直接通していく。」という動画を作成してください。


できあがった動画の一部の画像がこちらです。



……残念ながら、一文銭を持ち出しているのが「お客」の方になっており、私の意図した通りの満足な動画にはなりませんでした。


第二の挑戦:対話しながら修正を試みる


そこで、AIに修正のリクエスト(プロンプト)を送ってみました。


> 「上手にできていますね。ただ、一文銭を置く壺が、買い手が持ってきた壺ではなく、商人の壺のように見えます。一文銭を置くのは買い手の持ってきた油壺です。また、一文銭を置くのは商人の方で、買い手ではありません。もう一つ訂正してもらいたいのは、周りに人がいないことです。右手の屋根の下などに、数人の子供も含めた見物人がいてもいいと思います。


実はこのプロンプトを入力した際、うっかり商人を「承認」と誤変換してしまったのですが、AIは文脈からその間違いを賢く認識して、動画を作成し直してくれました。こうした「多少の誤字は汲み取ってくれる」のはAIの嬉しいところですね。



背景に人物(見物人)を入れてくれたものの、一文銭を乗せるのは相変わらず「客」の方のままでした。


この後も、「一文銭を乗せるのは商人です」とピンポイントで指示を出してみましたが、リクエストがうまく伝わらず、客が商人の壺に一文銭を乗せるような、ちぐはぐな動画が生成され続けました。


第三の挑戦:プロンプトを一から書き直す


部分的な修正ではAIが混乱しているようだったので、もともとのプロンプトを全面的に構造化し、一からリクエストを書き直してみました。


> 「もう一度、依頼文を書き直して、わかりやすくしてみました。以下のプロンプトに従って、作成した動画を作り直してください。

> 『日本の戦国時代に一人の油売り商人が道端で店を開いている。あるのは油を入れた壺と、それを汲み出す柄杓だけ。その場所に油を買いに来た客が現れ、油壺を彼の前に置く。その客の差し出した油壺の口に、商人は持っていた六文銭を載せます。そして、漏斗(じょうご)を使わずに、少し高い位置から柄杓に入れた油を細く垂らして、六文銭を汚さずにその穴に油を通して、客の油壺に油を注いでいく。』という動画を作成してください。」



今度は、ようやく商人が一文銭(プロンプトでは六文銭)を置くようになりました!

しかし、せっかく前回表示されていた周りの見物人が消えてしまい、肝心の油を注ぐ場面では、最初は一文銭を使わずに注いでしまうなど、なかなか完璧な整合性は保てませんでした。


今回の検証で分かったこと


結局、今回は100%思い通りの動画を作成することはできませんでした。

今回の題材である「日本の油売りの話」は、AIにとって少しハードルが高かったようです。特に「一文銭の四角い穴を通して油を入れる」という、日本の歴史的な文脈や、物理的な細かい因果関係を正確に理解するのが難しかったのかもしれません。


別途、斎藤道三が一文銭を通して油を注ぐ参考絵画がないか検索してみましたが、見つけることができませんでした。もし、あらかじめ自分でイメージに近い絵を描くか、構図の資料を用意して「画像+テキスト」で指示(マルチモーダルな指示)を出していれば、もっと良い動画ができた可能性があります。


最後に

思った通りの動画を完璧に作るのはまだ難しい一面もありますが、それでも「それっぽい雰囲気の良い映像」を瞬時に作ってくれる能力には目を見張るものがあります。


AIとのやり取りを数回繰り返す中で、「どう伝えればAIが理解しやすいか」のコツが少しずつ分かってきました。適切なプロンプトの出し方を工夫していけば、理想の動画にどんどん近づけられるはずです。皆さんもぜひ、恐れずに色々なプロンプトを試してみてはいかがですか!



2026年5月18日月曜日

高橋洋一先生の動画から考える、現在のAIの実力と課題

 元大蔵省(現在の財務省)官僚で経済学者の高橋洋一先生のYouTube動画、「自民党がAI提言 そもそもAIの実力はどうなの?実践してみた」を視聴しました。

この動画は、最新版のChatGPTを使用し、東京都区部消費者物価指数を題材に「AIが最近の物価動向をどこまで正しく理解しているか」を検証したものです。

動画内では、以下のような質問をAIに投げかけ、どのような回答が返ってくるかを紹介していました。

  • 「東京都区部の4月のCPIはどうなってますか?」

  • 「なぜ日銀が重視するコアコアとして、生鮮食品とエネルギーを除く指標をとるのですか?」

  • 「食料品とエネルギーを除く『欧米版コア』の数字はどうですか?」

欧米で一般的に使われる「食料品とエネルギーを除くコアCPI」に近い指標について、ChatGPTは「食料(酒類を除く)及びエネルギーを除く総合は1%前後まで低下しているとみられています」と回答しました。これに対し、高橋先生は「1%前後ではなく、0.9%だ」と間違いを指摘しています。

なぜAIは間違えたのでしょうか。それは、ChatGPTが総務省公表の「2020年基準 消費者物価指数 東京都区部 2026年(令和8年)4月分(中旬速報値)」という一次データを確認せずに回答を生成してしまっていたからです。指摘を受けたChatGPTは、素直に間違いを認めていました。

私はこれまで経済についてAIに質問したことがなかったため、大変面白いと感じ、Gemini(Pro 3.1)にも同じ質問を試してみました。

するとGeminiからは、『2026年4月の東京都区部における「欧米版コア(食料〈酒類を除く〉及びエネルギーを除く総合)」の具体的な数値については、総務省の中旬速報値の主要ヘッドラインでは公表されていない』という回答が返ってきました。

実際には中旬速報値は公表されているため、その点を指摘すると、「大変申し訳ありません。ご指摘の通りです。私は発表された総務省の詳細な統計表を直接確認せずに回答してしまいました」と謝罪がありました。つまり、GeminiもChatGPTと同様に、総務省の一次情報を見ずに回答を作っていたのです。

高橋先生は動画内で「ま、このレベルなの」と、AIを少し軽視するようなコメントをされていました。ご自身の持論が優先的に取り上げられなかったことへの不満も少なからずあったように見受けられます。

今回、ChatGPTとGeminiの回答を比較してみて、私はいくつかの点に気づきました。

  1. 回答のスタイル:ChatGPTの方がGeminiよりも長文で、丁寧に回答する傾向がある。ただ、Geminiの回答が情報不足かというとそうではなく、必要十分な回答をしている。

  2. 一次情報の未確認:ChatGPTもGeminiも、今回のような最新の統計表など、一次情報までしっかりチェックせずに回答を生成してしまうことがある。

  3. 情報源の活用:本来AIはYouTube動画の要約なども得意なはずだが、自発的にそういった動画情報を拾い上げて回答に活かすような動きは見られなかった。

これらの挙動を見ていると、現在のAIは「経済分野」の学習やデータ参照の優先度をそこまで高く設定していないのではないか、と感じました。経済よりも、例えば工学やプログラミングといった分野であれば、より正確に一次情報まで確認して回答する傾向があるように思います。

もう一つ不思議に思ったのは、高橋先生ご自身は普段あまりChatGPTなどのAIをお使いになっていないのではないか、という点です。今回の動画でも、実際にChatGPTを操作していたのは質問する側の方でした。「AIの実力はまだまだで使い物にならない」と感じておられるのかもしれません。

しかし、様々な分野で実際にAIに触れてみれば、その仕組みへの理解が深まり、有用性も実感できるはずです。動画の最後で先生は「AI高橋を作ってよ」と仰っていましたが、それならば、まずはご自身でAIに触れ、今のうちから取り組んでみるのが一番良いのではないかと感じました。


大谷翔平選手の「ファン対応動画」を見て感じた、ネット情報の裏側

 先日、YouTubeで大谷翔平選手のある動画を見ました。サインを待つ子供に対する、素晴らしい神対応のエピソードです。

その少年は、試合中に大谷選手にサインをねだりますが、試合中ということもあり大谷選手は一度断ります。しかしその代わり、「試合が終わったら書くよ」と少年と約束を交わしたのです。

試合後、なかなか現れない大谷選手にしびれを切らした両親は「もう来ないから帰ろう」と促します。少年が「あと5分だけ待って、来なければ帰る」と決めたそのとき、大谷選手が現れ、約束通りサインをしてあげたというストーリーでした。

この動画を見て、私も「なんて良い話なんだろう」と胸が熱くなりました。

しかし、少し冷静になって考えてみると、こうした素晴らしいファン対応は、果たして大谷選手だけがしていることなのでしょうか?

もちろん、約束を果たす大谷選手の誠実さは本物です。ただ、MLBの選手であれば、球団側からファンサービスを徹底するよう促されていますし、選手自身もその重要性を深く理解しています。これと全く同じシチュエーションではなくとも、似たような「神対応」は、日々多くの選手によって行われているはずです。

そう考えると、この動画の投稿者は「大谷選手」という圧倒的な知名度を利用することで、自身の動画をより多くの人に見てもらう(再生数を伸ばす)仕掛けをしたのだ、という側面も見えてきます。

YouTubeに限らず、ネット上には有名人のエピソードをフックにして、自身の利益や注目を集めようとするコンテンツが溢れています。今回の動画のように「良い話」であれば実害はありませんが、時には悪意のある切り抜きや、誇大広告に繋がるケースもあります。

素敵なエピソードに感動しつつも、その情報の背景にある「発信者の意図」まで一歩引いて見極めること。そんな冷静な視点を持ってネットと付き合っていくことが、これからの時代には大切なのだと改めて気づかされました。


2026年5月17日日曜日

一つのイヤホンを二人でシェア!驚きの「同時双方向通訳」ガジェットと未来の集客アイデア

 先日、大変興味深いYouTube動画を見つけました。

タイトルは『【1台1500円で翻訳同時に双方向(日→英と英→日)翻訳イヤホンセット】英会話AIグラスを超える…』というもの。なんと、2人同時に双方向通訳ができるイヤホンセットが、米国で3,000円ほどの低価格で流通しているというお話です。

従来のスマホ翻訳との違い

これまで同時通訳といえばスマートフォンを使うのが一般的でした。しかし、スマホ翻訳は画面を見つめながら、交互に端末を相手に向けて話し掛けなければならず、どうしても操作の手間や心理的な距離感が生まれてしまいます。

一方、この動画で紹介されたイヤホンは、左右のイヤホンを会話する2人が片方ずつ耳に装着して使用します。

設定によって、片方は「日本語→英語」、もう片方は「英語→日本語」という別々の翻訳機能をそれぞれの耳に割り当てることができるのです。これなら、お互いにハンズフリーで自然に顔を合わせながら会話ができるため、非常にスマートで簡単です。

(※ただし、実際の翻訳処理はどちらか1人のスマートフォンに専用アプリを入れて同期させておく必要があります)

気になるコストパフォーマンス

価格の内訳は、イヤホン本体が約1,500円、アプリの同時通訳機能(5時間分)のチャージに約1,500円。時間が経過すれば追加チャージが必要ですが、それにしても超格安です。

「日本でもすでに同じような製品が売り出されているのでは?」と思い、さっそく楽天とAmazonで探してみました。

すると、楽天で2,730円という超格安の翻訳イヤホンを見つけました。しかもこちらは「翻訳機能はずっと無料」とのこと。ただし詳しく見てみると、これは動画で説明されていたような「左右のイヤホンに別々の言語を割り当てる(独立した双方向通信)」タイプではないようでした。

とはいえ、「左右分離での双方向即時翻訳」も、今は一部有料ですが、そう遠くないうちに無料で提供するメーカーが現れるでしょう。無料でなくとも、さらに低価格で競争が激化していくはずです。

インバウンドビジネスへの応用アイデア

この技術を進化させれば、外国人観光客向けのお店で面白い集客ができるのではないでしょうか。

例えば、「翻訳機能付きの店頭スピーカー」のような商品です。店員さんがマイクに向かって日本語でタイムリーなおすすめ商品を喋ると、お店の前を通る海外の方々に向けて、それぞれの母国語にリアルタイム変換されてスピーカーから流れる──。そんなシステムがあれば、言葉の壁を越えた強力な呼び込み(販売促進)に役立つはずです。

AI翻訳の進化によって、私たちのコミュニケーションだけでなく、ビジネスの形を変える新しい商品がこれからどんどん現れてきそうですね。非常にワクワクする時代になってきました。




2026年5月17日(日)付毎日新聞の辛口数独の解き方

 2026年5月17日(日)付の毎日新聞に掲載されている辛口数独の解き方を説明します。唐辛子のマークが5つついており、たいへん難しい問題という表示になっています。



問題は上のようなものです。




とりあえず、簡単にわかるところだけを埋めてみます。以下のようになります。



これ以上は単純な考え方だけでは数字が埋められません。少し工夫してみる必要があります。


ここで下の図を見て下さい。左側上段の9つの箱に注目します。この図で赤の直線で示した部分には「5」と「8」がその直線上にあります。従って、赤の丸で示した2つの箱のいずれかに、「5」もしくは「8」が入り、他の数は入らないことがわかります。



これを使うと、左側上段の9つ箱の一つに、「9」が入ることがわかります。


これ以降も、難しいところもあると思いますが、じっくり考えれば解くことができると思います。

頑張ってみて下さい。



2026年5月15日金曜日

2026年5月15日(金)付毎日新聞夕刊の上級数独の解き方

 5月15日(金)付の毎日新聞夕刊に掲載されている第5359回・毎日数独上級の解き方を説明します。



問題は上のようなものです。




とりあえず、簡単にわかるところだけを埋めてみます。以下のようになります。



ここで下の図を見て下さい。右側下段の9つの箱に注目します。この図で赤の直線で示した部分には「4」と「7」がその直線上にあります。従って、赤の丸で示した2つの箱のいずれかに、「4」もしくは「7」が入り、他の数は入らないことがわかります。



これを使うと、右側上段の9つ箱の1つの箱の一つに、「1」が入ることが分かります。それ以降分かるところを埋めていくと以下の図の以下のようになります。



ここで下の図を見て下さい。中央下段の9つの箱の中にある赤い丸印で示した箱注目します。この図で赤の2つの直線上にある数字と、赤の四角の9つの箱の中にある数字に注目します。「1」から「9」までの数字のうち「4」だけがないので、赤い丸印で示した箱には「4」が入ることがわかります。



これ以降、これと同じ方法を使用して、特定の箱に入る数字を判定することができる場面がいくつかあります。じっくり考えれば解くことができると思います。頑張ってみて下さい。




2026年5月14日木曜日

作成したスライドを元に動画を作成しました

 前のブログ「複数の写真をAIに講評してもらい、スライドまで自動作成しました」

で、作成したスラドがありますが、それを元に動画を作成してもらいました。


作成はスライドを作成したNotebookLMを使いました。


作成には数分かかりました。動画は8分51秒の長さになっています。音声も自動的につけられており、わかりやすい説明をしてくれています。


動画は以下のところから見ることができます。


https://youtu.be/aqNm_rfRI2E



Google I/O発表の最新AIで動画作成に挑戦!「油売りの職人技」は再現できるか?

  5月19日から開催されているGoogle I/Oにて、マルチモーダル機能(Omni)を搭載した新しいGeminiの可能性が示されました。その中で注目したのが、高度な生成能力を活かした動画作成の新機能です。 詳しい説明を聞くよりも「まずは自分で試してみるのが一番!」ということで...