クローズドソース Multimodal, LLM

Google Gemini 3.1 Flash-Lite

モデル詳細データ

得意分野	高速なリアルタイム処理, 大規模なデータ処理, 翻訳, 要約, コンテンツモデレーション
知能スコア	High (MMLU 88.9%)
コンテキスト長	1M
マルチモーダル	テキスト, 画像, 音声, 動画, PDF

料金・API情報

サブスクリプション	Google AI Studioを通じて無料アクセス枠あり
API 無料枠	Google AI Studioにて無料利用枠あり
API 入力 (1M tokens)	$0.25
API 出力 (1M tokens)	$1.50

Google Gemini 3.1 Flash-Liteは、2026年3月3日にGoogleによってプレビュー版として発表された、Gemini 3ファミリーの中で最も高速かつコスト効率に優れたAIモデルです。主に、大量のタスクを高速かつ低遅延で処理する必要がある開発者や企業向けに設計されており、OpenAIのGPT-3.5 TurboやAnthropicのClaude Instantといった効率性を重視したモデルと直接競合します。このモデルの登場は、AI業界のトレンドが、最高の性能を追求するだけでなく、特定の用途における速度とコストのバランスを重視する方向へとシフトしていることを示しています。

Gemini 3.1 Flash-Liteのアーキテクチャは、より大規模なGemini 3 Proモデルをベースにしています。その核となる特徴は、ネイティブなマルチモーダル能力であり、テキスト、画像、音声、動画、PDFといった多様な形式の情報を一度に処理できる100万トークンの広大なコンテキストウィンドウを備えています。また、「思考レベル（thinking levels）」と呼ばれる独自の機能が導入されており、開発者はタスクの複雑さに応じてモデルの推論の深さを調整し、応答品質と速度の最適なバランスを取ることが可能です。この柔軟性により、単純なデータ抽出から複雑な指示を伴うワークフローまで、幅広い用途に対応できます。

Gemini 3.1 Flash-Liteの最大の強みは、その卓越したコストパフォーマンスにあります。従来モデルであるGemini 2.5 Flashと比較して、最初のトークンが出力されるまでの時間を2.5倍高速化し、全体の出力速度も45%向上させたと報告されています。これにより、リアルタイムでの応答が求められるチャットボット、大量のコンテンツの翻訳やモデレーション、構造化データの抽出といった、高頻度かつ大規模な処理が求められるシナリオで優れた性能を発揮します。 MMLUで88.9%という高いベンチマークスコアが示すように、その効率性にもかかわらず、インテリジェンスにおいても妥協のない性能を提供します。