Google 发布 Gemini 3 Flash
Google DeepMind 于 12 月 18 日发布 Gemini 3 Flash 模型,主打「前沿智能」与「极低成本」的结合。该模型在 GPQA Diamond(博士级推理)测试中得分 90.4%,在 Humanity's Last Exam 中无工具辅助得分 33.7%。值得注意的是,Gemini 3 Flash 在 MMMU Pro 多模态理解(81.2%)和 SWE-bench Verified 代码能力(78%)测试中的表现均超越了旗舰级的 Gemini 3 Pro。
效率方面,新模型相比 Gemini 2.5 Pro 速度提升 3 倍,日常任务的词元(Token)消耗减少 30%。定价方面,输入价格为 0.5 美元 / 100 万词元(合人民币约 3.63 元),输出为 3 美元 / 100 万词元(合人民币约 21.79 元)。
即日起,开发者可通过 Google AI Studio、Vertex AI 及新平台 Google Antigravity 调用该模型;普通用户可在 Gemini App(已取代 2.5 Flash 成为默认模型)及 Google 搜索的 AI 模式中免费体验。
(综合媒体报道)
Google DeepMind 于 12 月 18 日发布 Gemini 3 Flash 模型,主打「前沿智能」与「极低成本」的结合。该模型在 GPQA Diamond(博士级推理)测试中得分 90.4%,在 Humanity's Last Exam 中无工具辅助得分 33.7%。值得注意的是,Gemini 3 Flash 在 MMMU Pro 多模态理解(81.2%)和 SWE-bench Verified 代码能力(78%)测试中的表现均超越了旗舰级的 Gemini 3 Pro。
效率方面,新模型相比 Gemini 2.5 Pro 速度提升 3 倍,日常任务的词元(Token)消耗减少 30%。定价方面,输入价格为 0.5 美元 / 100 万词元(合人民币约 3.63 元),输出为 3 美元 / 100 万词元(合人民币约 21.79 元)。
即日起,开发者可通过 Google AI Studio、Vertex AI 及新平台 Google Antigravity 调用该模型;普通用户可在 Gemini App(已取代 2.5 Flash 成为默认模型)及 Google 搜索的 AI 模式中免费体验。
(综合媒体报道)
OpenAI 于 12 月 16 日宣布推出新版 ChatGPT 图像生成功能,由全新的旗舰模型 GPT-Image 1.5 驱动。新版本在生成速度上最高提升 4 倍,并显著增强了指令遵循能力、编辑精度和画面细节的一致性。
(OpenAI)
OpenAI 发布 GPT-5.2 模型系列
OpenAI 今日正式发布 GPT-5.2 模型系列,包含 Instant、Thinking 和 Pro 三个版本。其中 Instant 主打快速响应,Thinking 擅长深度推理与编程,Pro 则专注于解决高难度任务。
在衡量真实工作能力的 GDPval 测试中,GPT-5.2 Thinking 取得了 70.9% 的胜率,成为首个在 44 种职业知识工作任务上达到或超过人类专家水平的模型;在抽象推理测试 ARC-AGI-2 中,其得分从前代的 17.6% 跃升至 52.9%;AIME 2025 数学竞赛更是取得 100% 满分。
此外,新模型在长文档分析(256k 上下文)、多模态空间理解及代码生成(SWE-Bench Pro 准确率 55.6%)方面均有显著提升,幻觉率降低约 30%。
目前 GPT-5.2 已向 ChatGPT 付费用户开放,API 同步上线,价格较 GPT-5.1 上涨约 40%,但官方称因效率提升综合成本反而更低。
(综合媒体报道)
OpenAI 今日正式发布 GPT-5.2 模型系列,包含 Instant、Thinking 和 Pro 三个版本。其中 Instant 主打快速响应,Thinking 擅长深度推理与编程,Pro 则专注于解决高难度任务。
在衡量真实工作能力的 GDPval 测试中,GPT-5.2 Thinking 取得了 70.9% 的胜率,成为首个在 44 种职业知识工作任务上达到或超过人类专家水平的模型;在抽象推理测试 ARC-AGI-2 中,其得分从前代的 17.6% 跃升至 52.9%;AIME 2025 数学竞赛更是取得 100% 满分。
此外,新模型在长文档分析(256k 上下文)、多模态空间理解及代码生成(SWE-Bench Pro 准确率 55.6%)方面均有显著提升,幻觉率降低约 30%。
目前 GPT-5.2 已向 ChatGPT 付费用户开放,API 同步上线,价格较 GPT-5.1 上涨约 40%,但官方称因效率提升综合成本反而更低。
(综合媒体报道)
Meta 拟推迟下一代模型发布并转向闭源策略
据 CNBC 和 Digitimes 报道,Meta 计划将代号为「Avocado」的下一代旗舰 AI 模型推迟至 2026 年第一季度发布,并放弃此前坚持的开源策略,转而开发闭源的专有模型。这一战略调整伴随着 Meta AI 部门的重大重组:新模型将由首席 AI 官 Alexandr Wang 领导的 Meta 超级智能实验室(MSL)加强控制开发;基础 AI 研究(FAIR)实验室近期遭遇裁员,著名科学家 Yann LeCun 已离职,长期产品高管 Chris Cox 也退出了 AI 领导团队。
报道称,促成这一转变的因素包括 Llama 4 系列市场反应冷淡、开源模型被 DeepSeek 等竞争对手利用的安全担忧,以及公司急需通过 API 或订阅服务实现 AI 投资回报的商业压力。
(综合媒体报道)
据 CNBC 和 Digitimes 报道,Meta 计划将代号为「Avocado」的下一代旗舰 AI 模型推迟至 2026 年第一季度发布,并放弃此前坚持的开源策略,转而开发闭源的专有模型。这一战略调整伴随着 Meta AI 部门的重大重组:新模型将由首席 AI 官 Alexandr Wang 领导的 Meta 超级智能实验室(MSL)加强控制开发;基础 AI 研究(FAIR)实验室近期遭遇裁员,著名科学家 Yann LeCun 已离职,长期产品高管 Chris Cox 也退出了 AI 领导团队。
报道称,促成这一转变的因素包括 Llama 4 系列市场反应冷淡、开源模型被 DeepSeek 等竞争对手利用的安全担忧,以及公司急需通过 API 或订阅服务实现 AI 投资回报的商业压力。
(综合媒体报道)