12月13日のアナウンスメールを受け取り、早速「Gemini Advanced」の設定画面を確認したところ、最新の3つのモデルが利用できるようになっていました。(実際のメールお案内では、「Google AI studio」に案内されます。)
私は、Gemini Advancedを利用しているので、その最初の画面で右上にある「Gemini Advanced」の表示の隣にある下向けの矢印をクリックすると、以下のようなリストが表示されます。
Gemini Advancedとして利用できる最新のものが、3つ表示されており、それぞれの項目をクリックすると、選択したものを使用できるようになっています。
試しにFlash Experimentalを選択して、3つのGeminiの違いを聞いてみました。
質問:「Gemini Advancedの3つのモデル、1.5Pro、1.5Flash、2.0Flash Experimentの機能の違いについて説明してください。」
回答:
Gemini Advanced には、現在(2024年12月時点)、大きく分けて 3 つのモデルが存在します。Gemini 1.5 Pro、Gemini 1.5 Flash、そして Gemini 2.0 Flash です。それぞれの機能の違いについて説明します。
**全体的な特徴**
まず、Gemini は、Google が開発した大規模言語モデル(LLM)であり、テキスト、コード、画像、音声、動画など、様々な種類の情報を理解し、生成することができます。この「マルチモーダル」な能力が大きな特徴です。また、非常に長いコンテキストウィンドウ(一度に処理できる情報量)を持つことも特徴です。
**各モデルの違い**
それぞれのモデルは、速度、性能、機能において違いがあります。一般的に、Pro モデルはより高い性能を持ち、Flash モデルはより高速に動作するように設計されています。
* **Gemini 1.5 Pro**
* 高い性能を持つモデルです。複雑なタスクや詳細な応答が求められる場合に適しています。
* 非常に長いコンテキストウィンドウを持っており、大量の情報を一度に処理することができます。(最大 200 万トークン)
* マルチモーダル入力に対応しており、画像、動画、音声などを入力として使用できます。
* API 料金は、入力と出力が 128K トークン未満の場合、1M トークンあたり入力 5.00 ドル、出力 10.00 ドル。128K トークン以上の場合、1M トークンあたり入力 1.25 ドル、出力 2.50 ドルです。
* **Gemini 1.5 Flash**
* 高速に動作するように設計されたモデルです。迅速な応答が求められる場合に適しています。
* Pro モデルと比較すると、性能はやや劣りますが、それでも高い性能を持っています。
* マルチモーダル入力に対応しています。
* API 料金は Pro モデルよりも安価です。レート制限は Pro モデルより高くなっています。
* **Gemini 2.0 Flash**
* Gemini 1.5 Pro の 2 倍の速度で動作し、より強力なパフォーマンスを実現しています。
* マルチモーダル入力に加えて、マルチモーダル出力もサポートしています。つまり、テキストだけでなく、画像や音声などを出力することも可能です。
* ネイティブツール呼び出しが可能になっています。
* コーディングエージェントとしての機能も強化されています。
* Gemini 2.0 ファミリーは、Pro モデルと Flash モデルで展開されると思われますが、現在(2024年12月時点)リリースされているのは Flash モデルのみです。
**比較表**
| モデル | 速度 | 性能 | マルチモーダル入出力 | コンテキストウィンドウ | API 料金 | その他の特徴 |
| :------------- | :------ | :------ | :--------------- | :------------------ | :------- | :------------------------------------------ |
| Gemini 1.5 Pro | 普通 | 高い | 入力のみ | 最大 200 万トークン | 高い | 複雑なタスク、詳細な応答向け |
| Gemini 1.5 Flash| 高速 | 中程度 | 入力のみ | 最大 200 万トークン | 安い | 迅速な応答向け、レート制限が高い |
| Gemini 2.0 Flash| 非常に高速 | 高い | 入出力両方 | 不明 | 不明 | マルチモーダル出力、ネイティブツール呼び出し、コーディングエージェント |
**まとめ**
どのモデルを選択するかは、具体的な用途によって異なります。高い性能と長いコンテキストウィンドウが必要な場合は Gemini 1.5 Pro を、迅速な応答が必要な場合は Gemini 1.5 Flash または Gemini 2.0 Flash を選択すると良いでしょう。マルチモーダル出力が必要な場合は、Gemini 2.0 Flash を選択する必要があります。
これらの情報は、2024年12月時点のものです。今後のアップデートによって変更される可能性がありますので、最新の情報は Google の公式ドキュメントなどを参照することをお勧めします。
以上が回答です。
画面コピー(一部)だけで済まそうと思ったのですが、内容も参考になると思い、すべて紹介しました。**で囲われている部分は、実際にはBold(太字)で書かれています。
Gemini 2.0 Flashは、マルチモーダル対応で、画像や音声も処理可能。ネイティブツール呼び出しも可能になり、さらに高度なタスクを実行できます。興味深い機能が満載なので、ぜひ皆さんも試してみてください。