OpenAI GPT-4oは、2024年5月に発表された汎用マルチモーダルAIモデルです。名称の「o」は「omni(すべて)」を意味し、テキスト、画像、音声といった複数のモダリティを統合的に処理できる点が最大の特徴です。全ての入力と出力を同じニューラルネットワークで処理するため、情報の損失が少なく、より自然なインタラクションが可能です。GPT-4oは、従来のGPT-4 Turboと比較して同等以上の性能を持ちながら、音声応答速度は最短232ミリ秒(平均320ミリ秒)と人間とほぼ同等の速さを実現しています。また、非英語圏での精度向上、日本語対応の強化が図られています。APIのコストもGPT-4 Turbo比で50%削減されており、開発者にとって非常に魅力的なモデルです。2026年2月13日をもってChatGPTのUI上からは引退しましたが、API経由では引き続き利用可能です。その技術は後継モデルであるGPT-5.2やGPT-5.4に引き継がれています。GPT-4o miniは、より小型でコスト効率に優れたモデルとして提供されており、テキストとビジョン(マルチモーダル機能)をサポートし、数学、コーディング、マルチモーダル推論など様々なタスクで高いパフォーマンスを発揮します。