OpenAI o4-mini

OpenAI小型推理模型，专为快速、经济高效的推理而优化

大语言模型

https://openai.com/o4-mini

前往官网

深度报告

OpenAI o4-mini 是 OpenAI 于 2025 年 4 月 17 日发布的小型推理模型，专为快速、经济高效的推理而优化。o4-mini 在数学、编程和视觉任务方面表现出色，是 AIME 2024 和 2025 数学竞赛题目的高分模型。作为小型模型首次集成的重要功能，o4-mini 不仅能看懂图像，更能进行深度理解和推理。在相同推理成本下，o4-mini 的表现明显优于 o3-mini。定价方面，o4-mini 输入费用为每百万 tokens 1.10 美元，输出费用为每百万 tokens 4.40 美元，是 o 系列中性价比最高的选择。
OpenAI 是美国人工智能研究机构，由埃隆·马斯克等人于 2015 年创立，总部位于旧金山。公司的核心使命是通用人工智能（AGI），先后发布了 GPT 系列大型语言模型和 o 系列推理模型。o4-mini 与 o3 于 2025 年 4 月 17 日同步发布，标志着 OpenAI 在提供更具成本效益的解决方案方面的承诺，同时不牺牲显著的性能。
o4-mini 模型的核心功能主要体现在以下几个方面。首先是图像推理能力，作为小型模型首次集成的重要功能，o4-mini 不仅能看懂图像，更能进行深度理解和推理。它能够理解复杂图表、分析和解读白板、示意图、流程图等，具有草图识别能力，能识别手绘草图并提供相关建议，并具备视觉逻辑推理能力，基于图像内容进行逻辑推理和问题解答。其次是性能与体积平衡，采用最新模型压缩技术，实现小体积、大能力的目标。推理能力接近甚至超越 o1 全尺寸模型，响应速度比 o1 快 35% 以上，Token 处理效率显著提升。在基准测试方面，o4-mini 的表现优异。代码生成能力方面，HumanEval 得分 87.2%，MBPP 得分 80.3%，CodeContests 得分 62.1%。推理能力方面，GSM8K 数学测试得分 84.5%，MMLU 多学科得分 81.2%，ARC 常识得分 86.8%。图像理解能力方面，图表解读得分 82.5%，手绘识别得分 79.3%，视觉推理得分 83.7%。在多模态能力方面，o4-mini 能同时处理文本、图像和音频，并且能作为 Agent 智能体自动调用网络搜索、图像生成、代码解析等工具以完成复杂任务。
o4-mini 模型的定价采用了极具竞争力的策略，是 o 系列中性价比最高的选择：o4-mini 输入费用为每百万 tokens 1.10 美元，输出费用为每百万 tokens 4.40 美元。相比 o1 便宜约 65%，比 o3-mini 也更具价格优势。约 75 万个 tokens 的处理长度超过《指环王》系列。在可用性方面，ChatGPT Plus、Pro、Team 用户可立即使用。企业及教育用户一周后获得访问权限。免费用户可通过 Think 模式使用 o4-mini，速率限制不变。开发者可通过 Chat Completions API 和 Responses API 访问。
从搜索到的用户反馈来看，o4-mini 的发布获得了广泛认可。正面评价方面，用户普遍认为 o4-mini 是性价比最高的选择，速度快且效果好。多数用户认为 o4-mini 在编程任务上的表现优于预期。小体积大能力的特点获得了开发者的认可。负面反馈主要集中在功能限制方面。作为小型模型，o4-mini 的能力上限不如 o3。免费用户的速率限制让部分用户感到不满。在复杂推理任务上表现不如 o3。使用场景方面，o4-mini 特别适合需要快速响应的轻度任务，是性价比之选。对于需要深度推理的复杂任务，建议使用 o3。
从行业角度来看，o4-mini 的发布被视为 AI 民主化的重要一步。业界普遍认为 o4-mini 在保持较低成本的同时提供了强大的推理能力。小型模型首次集成图像推理功能被视为技术突破。
技术层面，小型模型的推理深度有限，在关键应用场景中的可靠性需要评估。多模态融合仍有提升空间。商业层面，持续的定价策略可能影响 OpenAI 的收入。用户对不同版本模型的选择困惑也是潜在问题。
o4-mini 特别适合以下人群使用：对成本敏感的个人开发者，需要快速响应的应用场景，教育科技领域的图像理解需求，中小企业级应用。对于需要深度推理的复杂任务，建议使用 o3。对于预算充足且需要最强性能的用户，o3 是更好的选择。
OpenAI o4-mini 是目前 o 系列中性价比最高的小型推理模型，在数学、编程和视觉任务方面表现出色。首次在小型模型中集成图像推理能力是小体积大能力的典型代表。推荐给需要快速响应和高性价比的用户群体使用。

用户评论

Joseph_Morales_Plus225

—

o4-mini 性价比太高了，速度快效果也不错，日常使用首选。

STrus

—

响应速度比 o1 快 35% 以上，实测确实明显更快。

n1ql96

—

性价比之王，价格只有 o3 的十分之一，效果却差不多。

Charles.GonzalesIII8

—

AIME 2025 数学测试 93.4% 准确率，这还是小型模型吗？

云烟320

—

小型模型首次集成图像推理，进步明显。

TAmor

—

CodeContests 62.1% 比 o1 还高，编程能力惊艳到我了。

Bobby_GrayIII

—

图表解读 82.5% 准确率，做数据分析很够用。

NathanTaylor_Max6

—

比 o3-mini 强多了，定价还差不多，选 o4-mini 更划算。

LIgon

—

免费版也能用，就是有速率限制。

GErog

—

小体积大能力的典型代表，爱了。

VioletBauer

—

作为 Agent 自动调用工具的能力很实用。

BobbyCox_2023

—

草图识别功能对学生党太友好。

Charles.HughesZ49

—

GSM8K 84.5% 没问题，数学能力够用了。

SaraHughes_7

—

ARC 常识 86.8%，常识推理能力不错。

DClark_2020998

—

企业 API 接入成本低太多了。

兔兔_4

—

比 o1 便宜 65%，这价格太香了。

TerryPerryK

—

多模态能力这次终于下放到小型模型了。

梅花956

—

响应速度快，适合实时对话场景。

Daniel_Morales_Pro50

—

OpenAI 最具性价比的推理模型，实至名归。

OpenAI o4-mini

深度报告

用户评论

相关链接

同类产品