Googleは2026年3月3日、Gemini 3シリーズの中で最も高速かつコスト効率に優れたモデル「Gemini 3.1 Flash-Lite」をプレビュー版として公開しました。 このモデルは、特に大量の処理を要求される開発者のワークロード向けに設計されており、その価格帯とモデル階層において高品質なパフォーマンスを提供します。 主な用途として、リアルタイムでの翻訳、コンテンツモデレーション、ユーザーインターフェース生成、シミュレーション作成などが挙げられます。 開発者はGoogle AI StudioのGemini APIや、エンタープライズ向けにはVertex AIを通じて利用を開始できます。

性能面では、旧世代の2.5 Flashを凌駕しており、最初のトークンが出力されるまでの時間(Time to First Answer Token)が2.5倍速く、出力速度も45%向上しています。 Arena.aiのリーダーボードで1432という高いEloスコアを記録し、GPQA Diamondで86.9%、MMMU Proで76.8%というベンチマークスコアを達成するなど、同等クラスの他モデルを上回る推論能力と多峰性理解能力を示しています。 さらに、100万トークンという広大なコンテキストウィンドウを持ち、テキスト、画像、音声、動画、PDFといった多様なモーダルからの入力を受け付けます。

価格設定は、その高い性能に対して非常に競争力があります。入力トークン100万あたり$0.25、出力トークン100万あたり$1.50と、特に高頻度のワークフローにおいてコストを重視する開発者にとって魅力的な選択肢となっています。 この価格設定は、大規模なAIアプリケーションの運用コストを大幅に削減する可能性を秘めています。Flash-Liteは、AIの能力をより多くの開発者や企業が大規模に展開できるようにすることを目的とした、Googleの戦略的なモデルと言えるでしょう。