2023年12月7日木曜日

Googleのマルチモーダルな生成AIモデル「Gemini」

 Googleは12月6日、Google I/Oで予告したマルチモーダルな生成AIモデル「Gemini」の最初のバージョンを発表した。


その詳細は以下のところで見ることが出来る。

https://deepmind.google/technologies/gemini/#introduction


このサイトは英語なのだが、英語が不得意な人でも、その中で紹介されているビデオは動画を見ているだけで、わかるものが多くて、今回のGemini、そして、Googleの対応、ChatGPTとの比較などを理解するには良いのが色々ある。


これはそれほど役立つ動画ではないが、見ていると面白いので紹介する。以下のところで動画は見ることが出来る。もちろん、上にあげたサイトから探し出すことも可能だ。

https://www.youtube.com/watch?v=mHZSrtl4zX0


この動画は、Geminiの機能が追加されたGoogle Bardの力を借りて、紙飛行機をつくるというものだ。ただの紙飛行機ではなく、離れたところにある火のリングを通り抜けることが出来る紙飛行機を作るというものだ。


Bardの助けを借りて、色々と紙飛行機を改良して、最後には火のリングを通り抜ける紙飛行機を作成する。その過程を紹介しているのだが、面白い。


Bardの手助けがなかったら、大変な時間を必要とするはずだったが、3週間でつくkることが出来たようだ。


これからは、こういう生成AIの力を借りて、何事もやる時代が来るのではないかと思う。


「Gemini」の発音だが、日本では各新聞ともに「ジェミニ」と表記しているが、向こうの人の発音を聞いていると、「ジェミナイ」と最後の「i」を「アイ」と発音している。




0 件のコメント:

コメントを投稿

スマホの写真をパソコンに保存する方法 - Googleフォト編

 スマホで撮った写真、どんどん増えていきますよね。機種変更のタイミングや、万が一スマホが壊れてしまったときのために、パソコンにバックアップしておくと安心です。 Googleフォトを使えば、スマホの写真を簡単にパソコンにダウンロードできます。今回はその方法をステップごとにご紹介しま...