2024年9月23日月曜日

Geminiで画像生成モデル「Imagen 3」を使ってみた

 Googleからは、画像生成モデルの「Imagen 3」がGeminiで使えるようになったという知らせを受けていたのだが、使っていなかった。


先週くらいから少し使ってみた。そのいくつかを以下の紹介する。


「小さな赤いポストに動物のくまさんが手紙を入れている絵を描いてください。」



「色々の色の木の葉で描かれた「Factory」という文字を描いてください。バックグラウンドは黒で。」



「噴水のある池で子どもたちが遊んでいる風景を描いてください。」



「日本のとある田舎の田んぼがある風景を描いてください。」



次のような依頼には、絵を作成するのを拒否された。


「あるエレキバンドのグループが劇場で演奏している風景を描いてください。」

「可愛らしい女の子が歌を歌っている絵を描いてください。」


これらの依頼には、次のようなコメントが返されてきた。

「まもなく Gemini Advanced で人物の画像生成を利用できるようになります。」


何らかの理由があってのことだと思うのだが、人物が大きく表現されることで、それを他の目的に利用されるのが問題と考えているのではないか。これを解決するのはなかなか難しいと思うのだが、「人物の画像生成をまもなく利用できる」ということなので、期待したい。





0 件のコメント:

コメントを投稿

第5回:【基本操作編】回答の質が劇的に変わる「プロンプトのコツ」3つの黄金ルール

  1. はじめに:Geminiは「指示待ち」のアシスタントです 第4回までに、Geminiへのアクセス方法と、簡単な質問の仕方をマスターしました。 「卵焼きのレシピ」や「旅行先のアイデア」など、Geminiはすぐに回答を返してくれますが、時々「なんか、欲しい答えとちょっと違うな...