なんでもデジタルな生活: Geminiで画像生成モデル「Imagen 3」を使ってみた

2024年9月23日月曜日

Googleからは、画像生成モデルの「Imagen ３」がGeminiで使えるようになったという知らせを受けていたのだが、使っていなかった。

先週くらいから少し使ってみた。そのいくつかを以下の紹介する。

「小さな赤いポストに動物のくまさんが手紙を入れている絵を描いてください。」

「色々の色の木の葉で描かれた「Factory」という文字を描いてください。バックグラウンドは黒で。」

「噴水のある池で子どもたちが遊んでいる風景を描いてください。」

「日本のとある田舎の田んぼがある風景を描いてください。」

次のような依頼には、絵を作成するのを拒否された。

「あるエレキバンドのグループが劇場で演奏している風景を描いてください。」

「可愛らしい女の子が歌を歌っている絵を描いてください。」

これらの依頼には、次のようなコメントが返されてきた。

「まもなく Gemini Advanced で人物の画像生成を利用できるようになります。」

何らかの理由があってのことだと思うのだが、人物が大きく表現されることで、それを他の目的に利用されるのが問題と考えているのではないか。これを解決するのはなかなか難しいと思うのだが、「人物の画像生成をまもなく利用できる」ということなので、期待したい。

なんでもデジタルな生活