OpenAI 推出新一代小型 AI 模型 GPT-4o miniOpenAI 于凌晨发布了 GPT-4o mini 模型,旨在取代 GPT-3.5 Turbo 的小型 AI 模型

一个小站的自留地

「upcoming-gpt-mini」可能是一个轻量级模型，旨在替代 GPT-3.5 或作为一个设备端模型使

OpenAI 推出新一代小型 AI 模型 GPT-4o mini

OpenAI 于凌晨发布了 GPT-4o mini 模型,旨在取代 GPT-3.5 Turbo 的小型 AI 模型。GPT-4o mini 的主要特点如下:

1. 性能卓越:在多项基准测试中均优于 GPT-3.5 Turbo 和同类小型模型。如在 MMLU 测试中得分 82%,高于 Gemini Flash 的 77.9% 和 Claude Haiku 的 73.8%。在编程能力测试 HumanEval 上,更是以 87.2% 的得分超越了 GPT-4。

2. 价格优势:每百万输入 token 仅需 15 美分,输出 token 60 美分,比 GPT-3.5 Turbo 便宜 60% 以上。OpenAI CEO Sam Altman 表示,与 2022 年最先进的 text-davinci-003 模型相比,GPT-4o mini 性能大幅提升,成本降低了 100 倍。（编注：约合输入 1¥/M Token，输出 4.4 ¥/M Token，略高于DeepSeek API 每百万输出 Tokens 2元）

3. 多模态能力:支持文本和图像输入输出,未来将支持音频和视频处理。

4. 长上下文:支持 128K token 的上下文窗口,每个请求最多支持 16K 个输出 token。

5. 安全性提升:采用新的「指令层次结构」方法,提高了抵御越狱和提示注入的能力。

6. 应用广泛:适用于需要低延迟、高频调用的场景,如客户服务聊天机器人等。

7. 即刻可用:从今天起,ChatGPT 的免费、Plus 和 Team 用户均可使用 GPT-4o mini,企业用户下周可用。API 用户立即可用。

尽管 GPT-4o mini 在多项测试中表现出色,但 OpenAI 并未公开其具体参数规模,仅表示与 Llama 3 8b、Claude Haiku 和 Gemini 1.5 Flash 等小型模型处于同一量级。这意味着在某些复杂任务或需要深度推理的场景中,GPT-4o mini 可能无法完全替代 GPT-4 等大型模型。

OpenAI 表示,GPT-4o mini 的发布旨在让更多人负担得起并使用先进的 AI 技术,推动 AI 在更多领域的应用。这一发布也标志着 ChatGPT 正式进入「4」时代,GPT-3.5 或将成为历史。

（OpenAI、TechCrunch、Reuters）