和现有的 GPT-4.1 类似地,GPT-5 系列也将有 GPT-5、GPT-5-mini、GPT-5-nano 三个模型变体。
预料 GPT-5 的性能跨越将会超过 GPT-4o 到 GPT-4.5 的进步。进步幅度接近或超越 GPT-4o 到 GPT-4.1 系列。
早前媒体报道,去年曾被寄予希望以 GPT-5 身份发布的 Orion(猎户座)模型,最终已经以 GPT4.5 的身份发布,性能进步和性价比表现不及预期。
——————
另外,马斯克今日称,他即将开源Grok-2。
——————
OpenAI 官宣,将于北京时间 8 月 8 日(本周五)凌晨 1 点召开发布会。
OpenAI 正式发布 gpt-oss-120b 和 gpt-oss-20b 开源推理模型。
8 月 5 日上午,网易旗下多款游戏突发登录异常。据媒体报道,网易内部办公平台 POPO 也出现部分功能不可用。
网易内部发布公告称,此次宕机由「机房故障」引发。
今年 2 月 28 日,网易云音乐也曾因「机房交换机故障」而出现宕机。
8 月 5 日,Qwen 团队宣布开源 Qwen-Image,这是一个参数规模为 20B 的 MMDiT 模型,在各类生成与编辑任务中达到了开源模型的最佳水平 (SOTA)。
据本频信源,Anthropic 于八月起对涉及 Claude Max 订阅的 Claude Code 滥用行为实行了「前所未有的」风控措施。涉及的账户大多订阅了 Claude Max 200 套餐,有同 IP 多账户、并发多会话的行为特征,且长时间大量使用 Claude Code。
此轮封禁亦存在自动化的特征,即 Anthropic 会在非美国办公时间封禁账户,最快情况下,滥用的账号会在 5 分钟内被定点清除。
此前,Anthropic 宣布为 Claude Pro 和 Max 订阅用户的 Claude Code 访问实施附加限制,即对周用量增加封顶限制。据介绍,部分使用量极端的账户,在一个月内可以消耗上万美元的 API 额度。
Openrouter 近日上线匿名测试模型 Horizon Alpha,这是一个上下文长度 256k 的非推理模型。
在社区自发的评测中,该模型表现在一众非思考模型中表现优秀,且行为类似 OpenAI 的 o3 模型。
本频对该模型的分词器进行了测试,可以确认这一模型来自 OpenAI。
根据目前社区的预测,这可能是 OpenAI 即将发布的开源模型。
OpenAI 上一次于 Openrouter 上线匿名测试模型是 GPT-4.1 发布前夕,彼时上线的测试模型和 GPT-4.1 同样具有 1M 上下文窗口,且所有分词器特征都与 OpenAI 的 GPT-4o 保持一致。
阿里云公共 DNS 服务短暂异常
自北京时间约 29 日 0 时起,Github 多个服务出现服务降级。Git 操作、Raw 文件下载、GitHub Enterprise Importer、API 请求,Issues 和 Pull 请求有概率出现失败问题。
Github 官方在状态页面称,这可能由于对 Github 的大量未授权爬取导致服务器过载。官方正在制定新的速率限制策略,并尽快上线新的服务器以缓解流量。
截至发稿,绝大多数未登录用户仍无法顺畅使用 GitHub 的服务。
据彭博社、赛博禅心,智谱将于今晚发布其下一代开源大模型 GLM-4.5 系列。
根据目前已知的消息,GLM-4.5 系列至少有以下两个尺寸:
GLM-4.5:旗舰模型,总参数量 355B,激活参数 32B;
GLM-4.5-Air:次旗舰模型,总参数量 102B,激活参数 12B。
其中旗舰模型 GLM-4.5 预料将会超过此前刷榜的 Kimi-K2 和 Qwen3,成为新的开源 SOTA。
但在翻译评测结果中与 GPT-4.1 不相上下。
该模型已在阿里云百炼平台上线 API 调用,但模型本身暂未开源。
前者是 Qwen3-235B-A22B 的更新版,分为思考和非思考两个模型。据介绍,该模型在多语言的长尾知识覆盖方面取得进步,在主观任务中更能契合人类偏好,上下文长度提高到 256k Tokens。
后者是 Qwen 系列首个 MoE 代码模型,总参数 480B ,激活参数 35B,上下文 256k,可拓展至 1M。该模型主要改进了前代 Coder 模型缺失的 Agent 能力。
阿里还专门开源了命令行工具 Qwen Code,并且 Qwen Coder 模型也可通过 Anthropic 格式的 API 接入 Claude Code。
有消息称,OpenAI 即将发布 gpt-5-alpha 。这一模型可能融合了推理与非推理模型,支持通过思考预算调节模型是否开启思考能力。
另据 BleepingComputer,OpenAI 正在测试 o3-alpha,这一模型在编程和前端设计方面优于 o3 和 o3-pro。
该测试完全依赖模型的推理能力,解题过程中完全不使用外部工具。
据本频信源,本次用于评测的模型并非任何一款公开的模型,且未针对 IMO 任务微调,思考时间可达数小时,该模型并未计划在未来几个月内公开发布。
CloudFlare 称,本次事故源于其任播(anycast)系统的配置错误,意外将 1.1.1.1 的服务前缀包含在了暂不启用的配置块中,导致 1.1.1.1 的任播路由被错误撤下。受此影响,DoH 服务(不依赖被撤下的 IP)在故障期间仍可用。
CloudFlare 同时注意到,在 1.1.1.1 路由宣告被撤下后,Tata Communications India(AS4755)宣告了 1.1.1.0/24 ,但这并不是造成 1.1.1.1 无法访问的原因。
CloudFlare 承诺,将加快对遗留系统的淘汰,以提供更高标准的文档和测试覆盖。
(CloudFlare Blog)
ChatGPT Agent 的功能类似 Manus,可以执行浏览器操作、代码生成和运行、文档生成等,运行一个任务需要的时间在 5~30 分钟不等。
1.1.1.1 公共 DNS 出现故障
2025 年 7 月 15 日凌晨 6 时 13 分(北京时间),Cloudflare 公共 DNS 解析服务(1.1.1.1)发生短暂服务中断,部分用户在该时间段无法获取有效的 DNS 响应。此次事件未影响托管在 CloudFlare 的域名的权威 DNS 服务。
(CloudFlare Status)
Cloudflare 2025 年 7 月 15 日凌晨 6 时 13 分(北京时间),Cloudflare 公共 DNS 解析服务(1.1.1.1)发生短暂服务中断,部分用户在该时间段无法获取有效的 DNS 响应。此次事件未影响托管在 CloudFlare 的域名的权威 DNS 服务。
(CloudFlare Status)
由于能支付宝充值,因此该卡片是国内推广最多的卡片之一。
目前相对正规的U 卡基本已经不支持在国内消费,比如Bybit 等卡片已经无法绑定主流支付方式。
月之暗面于 2025 年 7 月 12 日发布并开源 Kimi K2 大模型,总参数量达 1 万亿,采用 MoE 架构,激活参数 32 亿。该模型支持 128K 最大上下文长度,在自主编程、工具调用和数学推理等基准测试中表现突出,取得开源模型 SOTA 成绩。模型技术亮点包括 MuonClip 优化器,在 15.5 万亿词元数据上实现稳定训练,以及大规模 Agentic 数据合成和通用强化学习;未来将加入思考和视觉理解能力。
本次开源包括 Kimi-K2-Base(基础预训练模型)和 Kimi-K2-Instruct(指令微调版本),遵循修改版 MIT 协议,可商用。
API 服务已上线,定价为输入 4 元/百万词元,输出 16 元/百万词元。
(月之暗面)