主要な公開モデルについて議論する際、Google Geminiに触れないことは不適切です。これは、マルチモーダリティ(つまり画像、テキスト、音声、動画)に対応するよう一から設計された、最初の公開モデルの一つであり、おそらくは最初のモデルそのものでした。そこで当然のことながら、Google GeminiのプロセスアクティビティとAIコントロールタワーのセットをご紹介します。
Google Gemini プロセスアクティビティ
- 画像の分析
- チャットの補完
Google Gemini AIコントロールタワー
- 画像の分析
- 画像の分析 – フローを調整
- 画像の分析 – アドホックタスクを実行
- 画像の分析 – サブプロセスを開始
- 画像の分析 – 通知を送信
- チャットの補完
- チャットの補完 – フローを調整
- チャットの補完 – アドホックタスクを実行
- チャットの補完 – サブプロセスを開始
- チャットの補完 – 通知を送信
注:この動画は、本機能がベータ版である間に録画されたものです。正式リリース(GA)の時点で、一部のラベルやアイコンが変更される可能性がありますが、これらのアクティビティの設定に関する基本的な考え方は変わりません。
コメント
コメントを投稿