OpenAI 正式发布 Sora 视频生成工具OpenAI 于 12 月 10 日凌晨在其连续 12 天直播活动的第三天，正式向公众发布了期待已久的文生视频模型 Sora

一个小站的自留地

OpenAI Sora API 意外泄露三小时后紧急关闭北京时间 11 月 26 日，OpenAI 旗下视频生成模型 Sora 的 API 访问权限意外泄露。该 API 原本仅提供给特定艺术家进行测试，但被部分测试者在 Hugging Face 平台上部署了公开访问的前端界面。泄露的版本为 Sora Turbo，支持生成 1080p 分辨率、10 秒长度的视频。根据请求负载显示，完整版本包含多种模型和风格选项，但泄露版本仅开放了「自然」风格。 OpenAI 在泄露大约三小时后即关闭了相关访问权限…

OpenAI 正式发布 Sora 视频生成工具

OpenAI 于 12 月 10 日凌晨在其连续 12 天直播活动的第三天，正式向公众发布了期待已久的文生视频模型 Sora。这是自今年 2 月首次展示以来，Sora 首次面向大众开放。

本次发布的是全新的 Sora Turbo 模型，相比 2 月版本在性能和效率上都有显著提升。用户可以通过 sora.com 网站生成视频，该服务已整合进 ChatGPT 的会员体系。20 美元每月的 ChatGPT Plus 会员每月可生成最多 50 个视频，最高支持 720p 分辨率和 5 秒时长；200 美元每月的 Pro 会员则可生成最多 500 个视频，支持 1080p 分辨率和 20 秒时长，并可无水印下载。

Sora 的产品体验超出预期，不仅是简单的视频生成工具，更像是一个完整的创意工作平台。其核心功能包括：

故事板（Storyboard）：允许用户在时间轴上设计分镜，为每一帧添加不同的文本描述，实现连贯的故事叙述。
重混（Remix）：用户可通过文本提示词修改已生成视频的特定元素，且支持调节修改强度。
混合（Blend）：能将两段不同视频无缝融合，创造出独特的过渡效果。
循环（Loop）：可生成完美循环的视频片段。
风格预设：提供多种预设风格模板，包括纸版、黑白电影、怀旧录像等。

平台还设有社区功能，用户可以在 Featured 和 Recent 版块浏览他人作品，查看生成提示词，汲取创作灵感。

在技术层面，Sora 采用了扩散模型和 Transformer 架构，借鉴了大语言模型在互联网规模数据上训练的范式。OpenAI 引入了视觉块（visual patches）的概念，有效统一了视频和图像的表示方式。这种技术创新使得 Sora 能够生成具有连贯性的长视频，并保持画面中物体的一致性。

为确保安全使用，OpenAI 采取了多重防护措施。所有由 Sora 生成的视频都会嵌入 C2PA 元数据以标明其 AI 生成属性，并默认添加可见水印。系统还限制了人物照片和视频的上传，禁止生成包含未成年人、暴力和色情的内容。在技术层面，OpenAI 通过多模态审核分类器、自定义大语言模型过滤、图像输出分类器等多重机制进行内容审核。

不过，目前的 Sora 仍存在一些局限性。据早期测试者反馈，模型在物理规律模拟方面还不够完善，经常出现物体突然消失或穿透等问题。在处理包含腿部运动的对象时，也会出现前后腿位置混乱的情况。此外，由于访问量过大，目前 Sora 的新用户注册已暂时关闭。该服务目前在全球大部分地区可用，但受限于监管原因，英国和欧盟地区暂未开放。

OpenAI 表示，将继续完善安全机制，并计划在明年推出针对不同用户群体的定制定价方案。

（综合媒体报道）