概要

Mistral Large 3は、フランスのAIスタートアップMistral AIが2025年12月に発表した、Mistral 3ファミリーのフラッグシップモデルです。 これは、オープンソース(Apache 2.0ライセンス)のマルチモーダル大規模言語モデル(LLM)であり、Sparse Mixture-of-Experts(MoE)アーキテクチャを採用しています。 総パラメータ数6750億に対し、推論時にアクティブなパラメータを約410億に抑えることで、巨大な知識量を維持しつつ、比較的小規模なモデルと同等の推論コストと効率を実現しています。

アーキテクチャと性能

Mistral Large 3は、約3,000基のNVIDIA H200 GPUを使用した大規模なクラスタでトレーニングされました。 その結果、256Kトークンという長大なコンテキストウィンドウを持ち、複雑なドキュメントの読解や分析が可能です。 テキストと画像の両方をネイティブに処理できるマルチモーダル機能を備えており、一般的な指示応答タスクにおいて最高のオープンウェイトモデルと遜色のない性能を発揮します。 各種ベンチマークでは高い評価を得ており、特に多言語対話(英語・中国語以外)でクラス最高の性能を示します。 例えば、MMLU(8言語)では約85.5%の正答率を達成し、LMSYS Chatbot Arenaではオープンソースの非理系モデルの中で第2位にランクされています。

エコシステムと利用

Mistral Large 3は、完全なオープンソースモデルとして提供されており、研究者から企業まで幅広い層が自由にカスタマイズ・導入できます。 APIを通じた利用も可能で、Amazon Bedrock、Microsoft Azure、Google Cloudなど、複数の主要クラウドプラットフォーム経由でもアクセスできます。 その高い汎用性から、高度なRAG(Retrieval-Augmented Generation)システムや、複雑なエンタープライズワークフロー、対話型アシスタントなど、多岐にわたる用途での活用が期待されています。