2026年5月12日火曜日

Geminiに「お作法」としてのプロンプトは本当に必要なのか

 Geminiなどの生成AIを使う際、「効果的なプロンプト(指示文)の作り方」を解説するブログや動画をよく見かけます。

例えば料理のレシピを聞く場合、「あなたはプロの料理人です」と役割を指定し、手持ちの食材や調味料を細かく入力するのが「正解」だと説明されることが多いようです。確かに、役割を丁寧に説明することで回答の質が上がるという話は以前から耳にします。



しかし、私は今でもそのような「お勧め」に従わず、ごく普通の言葉でプロンプトを書いています。

例えばレシピを知りたい時は、手元にある食材を列挙して「これでできる料理を教えてください」と頼むだけです。もし提案されたレシピに必要な調味料がなければ、回答の後に「その調味料がないので、別のものを教えて」と追加で依頼します。「夜食なのでもっと軽いものを」といった微調整も、回答を見てから伝えれば済みます。

事前にあれこれ条件を詰め込むよりも、AIの回答を見てから「足りない要素」を補っていく方が、結果的に手間も時間もかからないと思うからです。

そもそも、友人にレシピを聞く時に「うちは今、お酢がないんだ」などと最初から全て説明することはありません。人間を超える知能を持つはずのGeminiに対して、特別に構えて情報を提供するのは、どこか本末転倒な気がします。

「役割の指定」にしても、質問の内容さえ明確なら、Gemini側で自分がどう振る舞うべきかは判断できるはずです。もし一度で伝わらなくても、対話を繰り返す中でAIは自分の役割を理解していくべきですし、今のAIにはその実力があります。

最近のGeminiは、設定次第で私のGmailやドキュメントの情報も参照できるようになりました。そうなれば、初対面の人間や、あるいは長年の友人よりも、Geminiの方が私の状況をよく理解している可能性さえあります。

対話を重ねることで、私の好みや体調まで考慮した「私に最適なレシピ」を提案してくれる――。それこそが、AIのあるべき姿ではないでしょうか。

プロンプトの書き方を人間が必死に工夫しなければならないうちは、AIの実力はまだまだ発展途上なのかもしれません。


古い写真をGeminiでカラー化してみた:想定外の「おまけ」が!?

 Geminiを使って、古い写真のカラー化に挑戦してみました。

今回依頼したのは、1970年頃にアメリカ・アリゾナの砂漠で、サボテンを背景に撮影された写真です。写真が変色していたため、当時の色を復元したいと考えました。

元の写真:



最初に試したプロンプトは、以下の通りです。

「この写真は1970年代の古い写真です。写真の色が変色しているので、元の色に戻してください。」


【1回目の結果】予期せぬ「太陽」の出現

Geminiが作成してくれたのが、こちらの写真です。



しかし、よく見ると、元の写真にはなかったはずの「太陽の輝き」が追加されていました。そこで、この太陽を消すように追加で依頼しました。


【2回目の結果】今度は「電柱」が登場

太陽は無事に消えましたが、今度は写真の左端中央に「電柱」が表示されてしまいました。まさかの展開に、再び電柱の除去を依頼することに。



【3回目の結果】ついに完成、その精度は?

そして、修正を重ねて完成したのがこちらの写真です。



当時の色を完全に再現したとは言い切れませんが、元の写真と比べると、ほぼ満足のいく仕上がりとなりました。


単にカラーの復元を依頼しただけなのに、余計なオブジェクト(太陽や電柱)を追加してしまうという欠点が明らかになりました。今後は、意図しない追加要素が発生しないよう、Geminiのさらなる改善に期待したいと思います。




2026年5月11日月曜日

Geminiに写真の「講評」をしてもらいました

 最近、生成AIのGeminiに自分の撮った写真の講評をお願いしています。

AIがどのように写真を分析し、どのようなアドバイスをくれるのか、その過程をご紹介します。

まず、Geminiの画面で講評してもらう写真をアップロードします。以下の写真です。



プロンプト(指示文)には、

「この写真を講評してください。技術的にこうした方が良い点などを挙げてください。」

と入力してみました。

Geminiはいつも、提出した写真の良いところを最初に見つけて、とても上手に褒めてくれます。これだけでもモチベーションが上がりますが、今回はあえて「改善点」を依頼したので、具体的に3つのポイントを回答してくれました。

  • 前ボケの整理: 画面左手前のピンボケした葉は視線を遮るので、外した方が主役が引き立つ。

  • 垂直要素の扱い: 右側の木の幹は、中途半端に入れるよりは外すか、あるいはアクセントとして全体を見せるべき。

  • 明暗差のコントロール: 木漏れ日による「白飛び」や「黒潰れ」を、画像処理ソフトやレタッチで調整した方が良い。

いくつかの写真で試してみたところ、Geminiは主に以下の3つの観点から提案をしてくれることが分かりました。

  1. 構図・バランス: 余白の取り方、エッジの処理、建物のパース(垂直線)の補正など

  2. 色彩・明暗: 露出とコントラスト、赤色の飽和、高感度ノイズの処理など

  3. 空間の整理: 視線誘導の工夫、不要な映り込みの除去、副題の配置など

指摘された内容は「なるほど」と納得できるものが多く、客観的な視点を得るツールとして、Geminiは写真のレベルアップにとても役立つと感じています。


AI軍事利用の暴走を防ぐために――国際ルールと「人類を守る科学」の構築

 昨日の毎日新聞朝刊に「海図なき世界 AIの軍事利用 リスクを制御できるのか」という社説が掲載されていました。

その要旨は、AI兵器が攻撃の効率を高める一方で、人間の判断責任を曖昧にし、倫理観の喪失を招く危うさを指摘するものです。特に、人間の関与なしに殺傷を行う「自律型致死兵器システム(LAWS)」の実用化への懸念が示されています。AIは「第2の核」とも称されます。私たちは今、かつての核軍拡競争にも似た、人類の歴史を左右する危うい岐路に立たされているといえるでしょう。



現在のウクライナ情勢や中東情勢を見ても、すでに戦略の中にAIが深く組み込まれていることが分かります。

現代戦の主流となりつつあるドローンの自律飛行や、衛星画像から車両の動きを解析して兵器の所在を特定する技術などは、すでに実用段階にあります。

社説が警鐘を鳴らすLAWSも、現在のAIの進化スピードを考えれば、決して遠い未来の話ではありません。かつてSF映画の中だけの存在だった「標的を選ばず殺戮を繰り返すロボット」が現実のものとなる可能性は、否定できないところまで来ています。さらに恐ろしいのは、プログラムの暴走や予期せぬ誤作動により、自らが生み出した兵器が味方や制作者自身に牙を向くシナリオです。

野放図な開発を防ぐための「国際的なルール作り」が急務であることは間違いありません。しかし、それと同時に、万が一の暴走から人類を物理的・技術的に守るための「抑止の科学」を確立することも、今を生きる私たちに課せられた重要な課題ではないでしょうか。


2026年5月8日金曜日

2026年5月8日(金)付毎日新聞夕刊の上級数独の解き方

 5月8日(金)付の毎日新聞夕刊に掲載されている第5354回・上級数独の解き方を説明します。



問題は上のようなものです。




とりあえず、簡単にわかるところだけを埋めてみます。以下のようになります。



ここで下の図を見て下さい。中央中段の9つの箱の中にある赤い丸印で示した箱に注目します。この図で赤の2つの直線上にある数字と、赤の四角の9つの箱の中にある数字に注目します。「1」から「9」までの数字のうち「4」だけがないので、赤い丸印で示した箱には「4」が入ることがわかります。



これを使うと、右側4列目の9つ箱の2つの箱に、上にあげた考えと同じ考え方で、数字が入るのがわかります。そして、もう少し分かるところを入れていくと次の図のようになります。



ここで下の図を見て下さい。右側下段の9つの箱に注目します。この図で赤の直線で示した部分には「1」と「2」がその直線上にあります。従って、赤の丸で示した2つの箱のいずれかに、「1」もしくは「2」が入り、他の数は入らないことがわかります。



これを使うと、右側下段の9つ箱の一つに、「5」が入ることがわかります。


これ以降も、難しいところもあると思いますが、じっくり考えれば解くことができると思います。頑張ってみて下さい。




2026年5月7日木曜日

Geminiに画像作成を依頼したら不思議な現象が発生

 Geminiに画像作成を依頼しました。プロンプトは以下の通りです。

「立川の昭和記念公園のチューリップ畑で魔法使いに扮した若い女性の画像を作成してください。」


生成された画像を見て「少し昭和記念公園の風景とは違うな」と感じたため、先日私が現地で撮影した写真を3枚添付し、それらを学習・参考にするよう再度依頼しました。

「これらの写真は実際に昭和記念公園で撮影したものです。これらの写真を参考にして、画像を作成し直してください。」

すると、Geminiは指示通りに添付写真の風景を反映した、より写実的な画像を作成してくれました。


ところが、ここで不思議なことが起こりました。作成された画像を「ダウンロード」してみたところ、保存されたのは以下のような画像だったのです。


画面に表示されているものと全く異なるため、確認のために2、3度やり直してみましたが、ダウンロードされるのはやはり同じ「謎の画像」でした。

そこで、画面上の画像を直接「右クリックでコピー」し、Windowsの「ペイント」に貼り付けてみたところ、今度は正しく生成された画像が表示されました。

どうやら、Geminiのプレビュー画面に表示されている画像と、ダウンロード用としてサーバー側に準備されているデータとの間で、何らかの不整合(あるいは生成プロセスの違い)が起きているようです。AIとの対話では、こうした予期せぬ挙動に遭遇するのも一つの醍醐味かもしれません。



Geminiの「Google Workspace」連携強化 — あなた専用の「AI秘書」が実現する未来

 Googleは2026年に入り、Gmail、Googleドライブ、ドキュメントといった「Google Workspace」との連携を大幅に強化しています。

このアップデートの最大の特徴は、Geminiがまるで「秘書」のように振る舞えるようになった点です。チャット欄で「@Gmail」や「@Drive」と入力するだけで、以下のような高度なサポートが可能になりました。

  • 情報の横断検索と要約:
    「先週の打ち合わせに関するメールを3行で要約して」と頼むだけで、膨大な履歴から該当箇所を探し出し、要点を抽出します。

  • ドキュメント作成の自動化:
    「ドライブ内の資料を元にスライド構成案を作って」といった指示により、複数ファイルにまたがる情報をGeminiが読み取り、新たなドキュメントやスライドにまとめ上げます。

  • 複雑なタスクの実行(Workspace Intelligence):
    2026年4月に発表された「Workspace Intelligence」 により、メールの返信案作成やスケジュール調整など、アプリを横断した作業まで代行できるようになっています。



ここで気になるのが、個人データの取り扱いです。Googleはプライバシー保護について、以下のルールを公表しています。
  1. 「回答」には使うが「学習」には使わない: 個人のデータがAIモデル自体の改善に利用されることはありません。

  2. 人間の目は介在しない: Googleのスタッフが内容を読み取ることはありません。

  3. いつでもオフにできる: 設定から連携を簡単に無効化できます。

さらに最新のアップデートでは、テキストだけでなく画像、PDF、動画データの処理も可能になりました。領収書から金額を抽出してスプレッドシートにまとめたり、動画の内容を要約したりといった、実務的な「エージェント機能」も実用化されています。

私自身も早速、来月の旅行計画をGeminiに相談してみました。すると、私のGmailの履歴から予約済みのフライト情報や宿泊先を正確に把握し、それに基づいた具体的なスケジュールを提案してくれました。

これまではネット上の一般知識や、こちらが入力した情報だけで回答していたAIが、今では「私自身のデータ」を安全に活用することで、より具体的でパーソナライズされた回答をくれるようになっています。まさに「かゆいところに手が届く」個人専用の秘書と言えるでしょう。

ただし、現段階では情報の取り間違えが起こる可能性もゼロではありません。最終的な確認は人間が行うという意識を持ちつつ、この便利なパートナーを賢く活用していきたいですね。


Geminiに「お作法」としてのプロンプトは本当に必要なのか

  Geminiなどの生成AIを使う際、「効果的なプロンプト(指示文)の作り方」を解説するブログや動画をよく見かけます。 例えば料理のレシピを聞く場合、「あなたはプロの料理人です」と役割を指定し、手持ちの食材や調味料を細かく入力するのが「正解」だと説明されることが多いようです。確...