起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
一个小站的自留地
OpenAI API 与 ChatGPT 出现大规模服务中断 2024 年 12 月 12 日,OpenAI 旗下的 API、ChatGPT 和 Sora 系统遭遇了严重服务中断问题,导致用户无法正常调用 API 和登录平台。根据 OpenAI 的更新公告,问题于北京时间 12 月 12 日上午 7:17 开始被调查,在此之后快速展开修复工作。 OpenAI 在 8:24 宣布已经找到了问题的原因,并正在全力推出解决方案。尽管中断期间 ChatGPT、Sora 以及 API 功能受到了较大影响,工程团…
OpenAI 发布大规模服务中断复盘

当地时间 2024 年 12 月 11 日,OpenAI 遭遇了一次严重的全平台服务中断事件。本次事件起因于一个新的遥测服务部署,意外导致了 Kubernetes 控制平面崩溃,进而引发了全系统性的服务降级。事件发生在当地时间下午 3 时 16 分,直至晚间 7 时 38 分才完全恢复。

本次事件的主要原因在于一个新部署的遥测服务配置错误,导致集群中每个节点都执行了大量资源密集型的 Kubernetes API 操作。由于这些操作的开销随集群规模增长,最终使得 Kubernetes API 服务器不堪重负。虽然 Kubernetes 的数据平面可以独立运行,但 DNS 服务依赖于控制平面,这导致了服务发现系统的级联故障。

时间线:
- 12 月 10 日:新遥测服务在临时集群测试通过
- 12 月 11 日 14 时 23 分:变更合并,部署流程启动
- 14 时 51 分至 15 时 20 分:变更应用到所有集群
- 15 时 13 分:系统告警触发
- 15 时 16 分:用户开始受到影响
- 19 时 38 分:所有服务完全恢复

OpenAI 表示,此次事件源于一次内部变更,与安全事件或产品发布无关。具体原因是新部署的遥测服务意外导致 Kubernetes 控制平面过载,进而引发连锁故障。目前所有服务已恢复正常运行,公司正在落实多项技术改进措施以防止类似事件再次发生。

(OpenAI)
一个小站的自留地
ChatGPT 遭遇 6 小时全球性重大故障 2024 年 8 月 15 日,OpenAI 旗下广受欢迎的 AI 聊天机器人 ChatGPT 经历了一次严重的全球性故障,影响了数百万用户。 故障始于美国东部时间上午 9:30 左右,直到下午 4:15 才恢复正常,持续约 6 小时 45 分钟。根据中断跟踪网站 Downdetector 的数据,用户报告的问题数量在美东时间中午 12 时左右达到峰值。 大多数用户在这段时间内无法访问 ChatGPT 平台,一些用户还遇到了 OpenAI 网站或 ChatGPT…
OpenAI API 与 ChatGPT 出现大规模服务中断

2024 年 12 月 12 日,OpenAI 旗下的 API、ChatGPT 和 Sora 系统遭遇了严重服务中断问题,导致用户无法正常调用 API 和登录平台。根据 OpenAI 的更新公告,问题于北京时间 12 月 12 日上午 7:17 开始被调查,在此之后快速展开修复工作。

OpenAI 在 8:24 宣布已经找到了问题的原因,并正在全力推出解决方案。尽管中断期间 ChatGPT、Sora 以及 API 功能受到了较大影响,工程团队表示正在加紧恢复服务,并对给用户带来的不便表示歉意。

截至 8:55,部分流量已经恢复正常,团队继续努力将所有服务返回到正常状态。OpenAI 重申正在推进修复,尽快恢复完整功能。

OpenAI Status
一个小站的自留地
今日,Google 发布了 Gemini-exp-1206 模型,重回大模型竞技场榜首。该模型拥有完整的 2M 上下文,支持 API 调用。 作为连更的第二天,OpenAI 则发布了强化微调(Reinforcement Fine-Tuning, RFT),允许用户基于少量数据,通过强化学习优化模型的推理能力,显著提升其在特定领域(比如编程、金融、法律、医疗和科学研究)的专业表现。
Gemini Flash 2.0 已经向部分用户推出。

该模型并未在面向开发者的 AI Studio 上出现过,而是直接灰度推送给了 Gemini 的部分用户。

——————

Google 发布 Gemini 2 Flash。开发者现在就可以在AI Studio和Vertex AI上试用Gemini 2.0 Flash,完整版本将于明年1月全面推出。

Google 宣称新的 Gemini 2.0 支持实时的文本、视频、语音和屏幕共享,速度是上代的两倍,性能和 Gemini 1.5 Pro 相近。
一个小站的自留地
#Update #ChatGPT OpenAI 刚刚发布了 ChatGPT Canvas 功能: - 专为代码和写作场景设计 - Canvas 在独立窗口打开 - 为写作场景提供的快捷方式:建议、修改长度、修改写作水平等 - 为代码场景提供的快捷方式:代码审查、添加日志、修复 bug、代码语言转换等 从今天开始,向 Plus 和 Team 用户灰度推出,选择 GPT-4o with canvas 模型即可体验。
OpenAI 12 天连更的第四天,ChatGPT Canvas 现支持直接运行 Python 代码,也支持在 GPTs 内使用 Canvas。

——————

在本次直播中,OpenAI 研究员 Karina Nguyen 展示的新功能界面中出现了ChatGPT ε(第五个希腊字母,读作Epsilon)。网友猜测,这极可能就是之前被传出的下一代模型「猎户座 Orion」。这一模型将有可能在本次 OpenAI 12 天连更中亮相。

媒体此前报道,由于训练「猎户座」使用了先前模型(GPT-4和o1)生成的数据,可能导致它重现旧模型的一些行为,最终质量提升小于从GPT-3到GPT-4的飞跃。因此 OpenAI 大概率不会将其命名为 GPT-5。
一个小站的自留地
OpenAI Sora API 意外泄露三小时后紧急关闭 北京时间 11 月 26 日,OpenAI 旗下视频生成模型 Sora 的 API 访问权限意外泄露。该 API 原本仅提供给特定艺术家进行测试,但被部分测试者在 Hugging Face 平台上部署了公开访问的前端界面。 泄露的版本为 Sora Turbo,支持生成 1080p 分辨率、10 秒长度的视频。根据请求负载显示,完整版本包含多种模型和风格选项,但泄露版本仅开放了「自然」风格。 OpenAI 在泄露大约三小时后即关闭了相关访问权限…
OpenAI 正式发布 Sora 视频生成工具

OpenAI 于 12 月 10 日凌晨在其连续 12 天直播活动的第三天,正式向公众发布了期待已久的文生视频模型 Sora。这是自今年 2 月首次展示以来,Sora 首次面向大众开放。

本次发布的是全新的 Sora Turbo 模型,相比 2 月版本在性能和效率上都有显著提升。用户可以通过 sora.com 网站生成视频,该服务已整合进 ChatGPT 的会员体系。20 美元每月的 ChatGPT Plus 会员每月可生成最多 50 个视频,最高支持 720p 分辨率和 5 秒时长;200 美元每月的 Pro 会员则可生成最多 500 个视频,支持 1080p 分辨率和 20 秒时长,并可无水印下载

Sora 的产品体验超出预期,不仅是简单的视频生成工具,更像是一个完整的创意工作平台。其核心功能包括:

故事板(Storyboard):允许用户在时间轴上设计分镜,为每一帧添加不同的文本描述,实现连贯的故事叙述。
重混(Remix):用户可通过文本提示词修改已生成视频的特定元素,且支持调节修改强度。
混合(Blend):能将两段不同视频无缝融合,创造出独特的过渡效果。
循环(Loop):可生成完美循环的视频片段。
风格预设:提供多种预设风格模板,包括纸版、黑白电影、怀旧录像等。

平台还设有社区功能,用户可以在 Featured 和 Recent 版块浏览他人作品,查看生成提示词,汲取创作灵感。

在技术层面,Sora 采用了扩散模型和 Transformer 架构,借鉴了大语言模型在互联网规模数据上训练的范式。OpenAI 引入了视觉块(visual patches)的概念,有效统一了视频和图像的表示方式。这种技术创新使得 Sora 能够生成具有连贯性的长视频,并保持画面中物体的一致性。

为确保安全使用,OpenAI 采取了多重防护措施。所有由 Sora 生成的视频都会嵌入 C2PA 元数据以标明其 AI 生成属性,并默认添加可见水印。系统还限制了人物照片和视频的上传,禁止生成包含未成年人、暴力和色情的内容。在技术层面,OpenAI 通过多模态审核分类器、自定义大语言模型过滤、图像输出分类器等多重机制进行内容审核。

不过,目前的 Sora 仍存在一些局限性。据早期测试者反馈,模型在物理规律模拟方面还不够完善,经常出现物体突然消失或穿透等问题。在处理包含腿部运动的对象时,也会出现前后腿位置混乱的情况。此外,由于访问量过大,目前 Sora 的新用户注册已暂时关闭。该服务目前在全球大部分地区可用,但受限于监管原因,英国和欧盟地区暂未开放

OpenAI 表示,将继续完善安全机制,并计划在明年推出针对不同用户群体的定制定价方案。

(综合媒体报道)
一个小站的自留地
OpenAI 的推理模型 o1 即将提出其完全体 o1 Pro,拥有更长更深入的思考能力。 包含这一模型的新套餐定价每月200美元/200英镑/229欧元,可无限制使用o1、o1-mini、GPT-4o 和高级语音功能。 (AGI Hunt) (小道消息,待核实) —————— Google Deepmind 早前发布了最新基础世界模型 Genie 2。 OpenAI 也宣布将启动为期 12 天的特别活动。在未来 12 天的每个工作日举行直播发布一个更新。据媒体报道,OpenAI 大概率会至少发布…
OpenAI 即将发布面向公众开放的视频生成模型 Sora V2。该模型将可以生成长达一分钟的视频,并且支持文本转视频或文本+图像/文本+视频的组合作为输入。

OpenAI的Chad Nelson在伦敦的C21Media主题演讲中 展示 了Sora v2的效果,并表示:正如Sam Altman所预示的,我们将很快看到这一切。

另外,OpenAI 还将发布支持视频输入的高级语音模式,也就是 OpenAI 在发布会上演示的视频对话功能。该功能允许用户向 ChatGPT 展示摄像头或电脑屏幕中的内容。

预计以上两个功能都将包含在 ChatGPT Pro 订阅中,在未来几天内陆续发布。

(小道消息,待核实)
一个小站的自留地
GitHub Universe 2024:AI 驱动开发体验迈向新纪元 GitHub 于近日举办的 2024 年 Universe 大会上发布了一系列重磅更新,进一步强化其作为全球最大开发者社区的地位。据 GitHub 官方博客报道,自 10 年前首次举办以来,GitHub Universe 一直致力于优化开发者体验。今年的活动标志着该平台在 AI 驱动开发方面的重要里程碑。 AI 原生体验全面升级 GitHub 为其 AI 编程助手 Copilot 引入了多种新的 AI 模型,包括 Anthropic…
GitHub Copilot Chat 支持 GPT-4o 64K 上下文窗口

GitHub 宣布,Copilot Chat 在其官方网站、移动应用、命令行工具及支持的集成开发环境中,已支持 OpenAI GPT-4o 的 64K 词元上下文窗口。此次升级将为用户处理大型文件和代码仓库时提供更好的响应体验。

GitHub 表示,所有 Copilot 用户无需任何操作即可使用此功能。新版本将帮助 Copilot 在执行技能时检索更多信息,从而提供更贴合上下文的回应。

值得一提的是,Visual Studio Code Insiders 版本的 GitHub Copilot 用户可以使用高达 128K 的上下文窗口,这也是 GPT-4o 支持的最大容量。

(GitHub Blog)
一个小站的自留地
Meta 发布 Llama 3.2 北京时间2024 年 9 月 26 日凌晨,Meta 发布 Llama 3.2。 本次发布,包含 4 种尺寸的模型,包括 1B、3B、11B 和 90B,以及一些硬件:一款新的雷朋 AI 眼镜 和 Meta Quest 3S: 1B/3B:旨在提供边缘算力,也就是可以在如移动设备上运行,目前已支持Arm、高通(Qualcomm)和联发科(MediaTek) 11B/90B:具备多模态能力,并可直接替代 Llama 3.1 8B 和 70B。 Llama St…
Meta 发布 Llama 3.3

Meta 发布了新一代大语言模型 Llama 3.3 70B,该模型采用优化的 Transformer 架构,支持 128k 的上下文长度,并通过监督式微调 (SFT) 和基于人类反馈的强化学习 (RLHF) 进行训练。

官方宣称,Llama 3.3 70B 的性能与 Llama 3.1 405B 模型相当。

Llama 3.3 的主要特点包括:
- 支持英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等 8 种语言
- 在多个基准测试中展现出色表现,如在 MMLU 测试中达到 86%,HumanEval 代码评估达到 88.4%
- 训练数据量超过 15 万亿词元,训练截止日期为 2023 年 12 月

据 Meta 介绍,Llama 3.3 在合成数据生成和知识蒸馏等应用场景中表现优异。模型已通过 Llama 3.3 社区许可协议开源,可用于商业和研究用途。

Meta
一个小站的自留地
OpenAI 的推理模型 o1 即将提出其完全体 o1 Pro,拥有更长更深入的思考能力。 包含这一模型的新套餐定价每月200美元/200英镑/229欧元,可无限制使用o1、o1-mini、GPT-4o 和高级语音功能。 (AGI Hunt) (小道消息,待核实) —————— Google Deepmind 早前发布了最新基础世界模型 Genie 2。 OpenAI 也宣布将启动为期 12 天的特别活动。在未来 12 天的每个工作日举行直播发布一个更新。据媒体报道,OpenAI 大概率会至少发布…
今日,Google 发布了 Gemini-exp-1206 模型,重回大模型竞技场榜首。该模型拥有完整的 2M 上下文,支持 API 调用。

作为连更的第二天,OpenAI 则发布了强化微调(Reinforcement Fine-Tuning, RFT),允许用户基于少量数据,通过强化学习优化模型的推理能力,显著提升其在特定领域(比如编程、金融、法律、医疗和科学研究)的专业表现。
一个小站的自留地
OpenAI 推出新模型 o1:推理能力大幅提升 北京时间 9 月 13 日凌晨,OpenAI 发布了全新的推理模型系列——o1 系列。该系列包含两个版本:o1-preview 和 o1-mini,分别面向不同的用户群体。据 OpenAI 官方消息,o1 系列在复杂推理任务上的表现显著提升,尤其是在科学、编程和数学等领域。为了彰显这一突破性进展,OpenAI 将计数器重置为 1,并将该系列命名为 o1。 o1 系列的推理能力远超此前的 GPT-4o 模型。例如,在国际数学奥林匹克(IMO)资格考试中,GPT…
OpenAI 的推理模型 o1 即将提出其完全体 o1 Pro,拥有更长更深入的思考能力。

包含这一模型的新套餐定价每月200美元/200英镑/229欧元,可无限制使用o1、o1-mini、GPT-4o 和高级语音功能。

(AGI Hunt)
(小道消息,待核实)

——————

Google Deepmind 早前发布了最新基础世界模型 Genie 2。

OpenAI 也宣布将启动为期 12 天的特别活动。在未来 12 天的每个工作日举行直播发布一个更新。据媒体报道,OpenAI 大概率会至少发布 Sora 和 o1 的完整版。

有小道消息称,Google 正加快 Gemini 下一代模型的发布进度。
一个小站的自留地
本频从多个信源观察到,OpenAI 的风控政策正在近期进一步升级。 对于部分长期使用网关登录的账号(如部分合租面板、逆向号池),OpenAI 强制更改了密码,要求开启两步验证。 对于部分长期使用非家宽节点登录的账户,OpenAI 会在不通知用户的情况下更改模型为较低智能的 gpt-4o-mini,表现为无法调用任何工具,如使用记忆、联网、生图等。用户上传文件或图片后,OpenAI 会自动将该对话交由 gpt-4o 处理。并正常消耗配额。全程完全为黑箱操作,用户侧无提示。付费用户也可能受到影响。 对于部分有风险的…
一个小站猜测,OpenAI 对于网页版 ChatGPT 的模型风控主要是基于 IP 判断的。对于部分合租面板、逆向号池,一个 IP 地址会对应相当多的账号,也即一个 IP 地址会非常频繁地发出对话请求。而对于普通用户,如果使用的代理的解锁 IP 使用人数过多,也会有风控现象。

根据一个小站在九月的测试,可以通过非登录情况下能否对话来测试 IP 是否有风控风险。对于正常 IP,OpenAI 应当允许免登录对话。

本次风控实际上是强制进行了模型替换。无论用户是否付费,在前端选择了什么模型,被风控后发送的请求,都将被 ChatGPT-Auto 模型回复。 这是免费版用户的默认模型。和其他模型的差距为,该模型不支持联网、画图、查看文件等大多数工具操作,并且会根据任务难度决定是由 gpt-4o-mini 模型回复,还是由 gpt-4o 模型回复。

哪怕是 o1 系列模型,OpenAI 也会将其偷换为免费版用户的 ChatGPT-Auto 模型,因此出现了 o1「不思考」的现象。

根据 openssora 的介绍, OpenAI 使用 PoW(Proof of Work)来决定是否对某一 IP 实施风控。

工作量证明 (Proof of Work, PoW) 是一种广泛应用于区块链和其他分布式系统的共识算法,用于防止滥用资源(如垃圾邮件)和确保系统的安全性。 通过 PoW,系统要求参与者完成某种计算任务来证明他们做了 “工作”。

根据 PoW(Proof of Work)的机制,会生成一个 16 进制的 difficulty。difficulty 数值越大,IP 环境就越安全。正常大于 4 位以上的 16 进制,基本就不会降智了。

同时,仓库也提供了一系列独立的解除风控方案:

套 cf,如 Cloudflare Warp。

切换到 ChatGPT APP 版本

网页版按 F12,进入控制台之后,改为移动端展示,然后刷新页面,就会解除(这个方式,是最快让你解除降智的,但临时方案,不推荐一直这么做)

切换到比较干净的 IP,不要使用共享、便宜的魔法

上传一张白图,强制启动

移动端触发 o1 思考,web 端同步刷新,也能恢复

同时,这两个仓库的作者都将风控解决方案打包成了浏览器插件或油猴脚本,可以进行 PoW 的检查和尝试风控解除。

一个小站测试发现,在网页版控制台切换为平板且横屏,刷新页面后保持控制台开启,是最方便地骗过风控,以移动端身份进行对话的方式,且 UI 和桌面端也无太大区别。推荐使用。

——————

本文内容受到了以下仓库的启发,在此表示感谢。

https://github.com/openssora/chatgpt-degrade-checker

https://github.com/KoriIku/chatgpt-degrade-checker
一个小站的自留地
Kimi 上线数学推理模型 k0-math 国内 AI 大模型公司月之暗面推出 k0-math 模型驱动的 Kimi 数学版,官方宣称「k0-math 模型数学能力对标 o1 系列」。 (月之暗面) —————— 根据SuperCLUE-Math6o「小学奥数」基准测评总榜,数学模型 k0-math 在数学任务中表现出对应用题和计算较强的处理能力,但在行程问题和几何任务上略显薄弱。 与o1-preview相比,数学模型 k0-math 在 SC-math6o 上仍有 18 分的差距,尚有较大的…
阿里开源推理大模型 QwQ-32B-Preview

阿里 Qwen 团队发布了专注于推理和思维链的新一代大语言模型 QwQ-32B-Preview。该模型基于 Qwen2.5 32B 的架构,采用 Apache 2.0 许可证开源,支持商用

QwQ 在多个复杂推理基准测试上展现出突出表现:在 GPQA(研究生级问答)得分 65.2%,在 AIME(美国数学邀请赛)达到 50.0%,在 MATH-500 基准测试中达到 90.6%,在 LiveCodeBench(实际编程场景)测评中达到 50.0%。这些分数显示其在推理、数学和编程领域均具有较强实力。

该模型特点是通过深入思考和自省方式解决问题。在处理复杂问题时,它不会直接给出结论,而是模拟人类思维,通过分步推导和不断反思来得出答案。然而,模型目前也存在一些限制,如语言切换不稳定、可能陷入递归推理循环、部分安全机制尚待完善等。

Qwen 团队 指出 ,该模型本质上体现了推理缩放规律 (inference scaling law):允许模型有更长的思考时间,推理能力会相应提升。QwQ 作为开源领域首个专注推理能力的大模型,为开发者提供了一个可直接使用的基础工具。

(DataLearner)
一个小站的自留地
OpenAI发布文生视频大模型Sora OpenAI宣布发布全新的Diffusion大模型Sora,这是一个可以生成最长60秒视频的视频生成大模型,可以生成非常逼真的电影画面版的视频。 它可以生成持续时间、宽高比和分辨率不同的视频和图像,最长可达一分钟的高清视频。 Sora模型目前还处于测试阶段,并没有开放给大众使用。 (Datalearner) —————— 尽管仍然存在不少改进空间,但与当前文生视频模型比较来看,Sora的进步是变革性的。特别是在物理模拟和前后稳定性方面。 有评论称其「可…
OpenAI Sora API 意外泄露三小时后紧急关闭

北京时间 11 月 26 日,OpenAI 旗下视频生成模型 Sora 的 API 访问权限意外泄露。该 API 原本仅提供给特定艺术家进行测试,但被部分测试者在 Hugging Face 平台上部署了公开访问的前端界面。

泄露的版本为 Sora Turbo,支持生成 1080p 分辨率、10 秒长度的视频。根据请求负载显示,完整版本包含多种模型和风格选项,但泄露版本仅开放了「自然」风格。

OpenAI 在泄露大约三小时后即关闭了相关访问权限。在此期间,众多用户已通过该接口生成了大量测试视频,这些视频均带有 OpenAI 的视觉水印。

参与测试的艺术家发布了一封措辞强烈的公开信。这些艺术家在信中表示,他们在为这家估值 1500 亿美元的公司提供无偿的错误测试和反馈。艺术家们的创作需要经过 OpenAI 团队的审批才能对外分享,这让他们感觉更像是一场公关活动,而非真正的创意合作。

公开信呼吁艺术家们转向开源工具,并列举了包括 CogVideoX、Mochi 1、LTX Video、Pyramid Flow 等替代方案。目前该公开信已获得 68 位签名者支持。

这一事件引发了对 AI 时代艺术创作者权益的讨论。艺术家们认为,新技术本身的价值不应凌驾于艺术创作的价值之上,AI 企业需要重新思考与创作者的合作方式。

(机器之心、数字生命卡兹克)
一个小站的自留地
Claude 3.5 Sonnet 现在支持使用多模态能力查看和分析 PDF 中的图像、图表和图形。 该功能支持小于 100 页的 PDF 文件。
Claude 网页版现在支持自定义回复语气,除预设回复语气外,还可根据用户描述生成自定义回复语气预设。
一个小站的自留地
微软再次出现服务中断 微软服务状态网站上的一则警报称,此次宕机影响了微软Azure、Microsoft 365、云系统Intune和Entra 等。 当地时间7月30日上午,微软公司在社交媒体平台 X 上发布的帖子中表示,该问题影响了“多项 Microsoft 365 服务和功能”。Microsoft 365 包括 Outlook、Word 和 Excel 等常用生产力应用程序。微软公司在帖子中表示:“我们目前正在调查多项 Microsoft 365 服务和功能的访问问题和性能下降。有关详细信息,请参…
Microsoft 全球多项在线服务出现大规模中断

2024 年 11 月 25 日,Microsoft 的 Outlook 和 Teams 等核心服务出现全球性中断。故障最早于当日上午 8 时(北京时间 21 时)左右开始出现,并在随后数小时内持续发酵,影响了全球范围内的企业和个人用户。

Microsoft 表示,此次事件源于一项近期的配置变更,导致用户无法访问 Exchange Online 或使用 Microsoft Teams 日历功能。公司随即着手回滚相关更改并部署修复方案,同时对部分处于异常状态的服务器进行手动重启。

到当地时间 11 时,Microsoft 表示修复方案已覆盖约 98% 的受影响环境,但恢复进度比预期要慢。直至当日晚间 11 时左右,公司宣布已恢复大部分受影响服务的功能,仅有少量用户的网页版 Outlook 仍受影响。Microsoft 预计于 11 月 26 日凌晨完成所有服务的全面恢复。

此次服务中断虽然规模较大,但与今年夏季由 CrowdStrike 软件问题引发的、被称为「史上最大 IT 中断」的事件相比仍有差距。后者曾导致航班停飞、医院系统瘫痪,并给财富 500 强企业造成超过 50 亿美元的直接损失。

(综合 NBC New York、Windows Central、CNN)
Back to Top