Anthropic 和 xAI 分别在今日宣布开放其最新大语言模型的 API 访问。Anthropic 的 Claude 3.5 Haiku 现已可通过 Anthropic API、Amazon Bedrock 和 Google Cloud Vertex AI 使用,而 xAI 的 Grok 则开启了公测。
Claude 3.5 Haiku 在性能上接近 Sonnet,在编程和代理任务上超越了除 3.5 Sonnet 外的所有此前 Claude 模型。该模型具备更新至 2024 年 7 月的知识库。然而,其定价引发争议 —— 输入价格为每百万词元 1 美元,输出价格为每百万词元 5 美元,较前代产品涨价 4 倍。对比同类产品,如 GPT-4o Mini 和 Gemini 1.5 Flash,Haiku 在性能相近的情况下价格明显偏高。
与此同时,xAI 推出的代号「grok-beta」的新版本 Grok 支持 128,000 词元的上下文长度,并提供函数调用和系统提示词功能。值得一提的是,Grok API 完全兼容 OpenAI 和 Anthropic 的 API,开发者只需修改基础 URL 和 API 密钥即可完成迁移。xAI 还宣布将在下周推出支持图像输入的多模态版本。
在价格方面,Grok API 将提供每月 25 美元的免费额度直至 2024 年底。对于已购买预付费额度的用户,将在 11 月和 12 月获得额外的免费额度。
(新智元)
腾讯在北京举办的混元发布会上宣布开源两款人工智能模型:混元 Large (Hunyuan-Large) 和混元 3D 1.0 (Hunyuan3D-1.0)。
混元 Large 是目前业界最大规模的开源混合专家 (MoE) 大语言模型,总参数量达到 389B,实际激活参数量为 52B。该模型具备 256K 的上下文长度,通过优化的 KV 缓存压缩技术可节省 50% 的 GPU 内存使用。在 MMLU、MMLU-Pro 和 CMMLU 等多个基准测试中,混元 Large 表现优于同规模的 Llama 405B 和 Mixtral-8x22B 等模型。
混元 3D 1.0 是首个同时支持文字和图像生成的开源 3D 生成模型。该模型采用级联架构,通过多视图扩散模型和前馈重建模型两个阶段,可在约 11 秒内完成 3D 模型生成。目前该模型已在腾讯地图、元宝 APP 等多个产品中落地,支持 UGC 3D 创作、商品素材合成等应用场景。
腾讯还将推出一个专门用于评估大模型长文本处理能力的测试数据集「企鹅卷轴」。
两款模型已在 GitHub 和 Hugging Face 平台开源。其中混元 Large 将同步支持在腾讯云 TI 平台上的业务精调及部署,而混元 3D 1.0 的体验入口则开放在元宝 APP 的「3D 角色梦工厂」功能中。
混元 Large:https://github.com/Tencent/Hunyuan-Large
混元 3D:https://github.com/Tencent/Hunyuan3D-1
(综合媒体报道)
ChatGPT 推出实时网络搜索功能:无广告、支持免费用户
OpenAI 正式为 ChatGPT 推出联网搜索功能。新功能支持实时网页搜索,并可在对话中展示包括天气、股市、地图等多媒体内容。所有回答都会注明信息来源,并提供原文链接。
该功能目前已向付费用户和 SearchGPT 候补名单用户开放,未来数周内将向企业和教育用户开放,数月内将向所有免费用户开放。
与传统搜索引擎不同,OpenAI 明确表示 ChatGPT 搜索不会投放广告。
——————
谷歌 AI Studio 迎来重要更新:Flash-8B 正式发布、支持搜索导航
谷歌宣布了 AI Studio 的三项重要更新:
性能与 1.5 模型相当的 Gemini 1.5 Flash-8B 正式发布,其特点是成本降低 50%,处理速度提升一倍,适用于聊天、翻译等高频场景。
所有 Gemini 1.5 模型现已支持谷歌搜索导航功能,可通过搜索结果提供更准确的实时信息。
新增的 Compare Mode 功能支持同时测试多个 Gemini 和 Gemma 模型,方便开发者选择最适合的解决方案。
OpenAI 正式为 ChatGPT 推出联网搜索功能。新功能支持实时网页搜索,并可在对话中展示包括天气、股市、地图等多媒体内容。所有回答都会注明信息来源,并提供原文链接。
该功能目前已向付费用户和 SearchGPT 候补名单用户开放,未来数周内将向企业和教育用户开放,数月内将向所有免费用户开放。
与传统搜索引擎不同,OpenAI 明确表示 ChatGPT 搜索不会投放广告。
——————
谷歌 AI Studio 迎来重要更新:Flash-8B 正式发布、支持搜索导航
谷歌宣布了 AI Studio 的三项重要更新:
性能与 1.5 模型相当的 Gemini 1.5 Flash-8B 正式发布,其特点是成本降低 50%,处理速度提升一倍,适用于聊天、翻译等高频场景。
所有 Gemini 1.5 模型现已支持谷歌搜索导航功能,可通过搜索结果提供更准确的实时信息。
新增的 Compare Mode 功能支持同时测试多个 Gemini 和 Gemma 模型,方便开发者选择最适合的解决方案。
@fofr ,Sam Altman 在 DevDay 上表示:「不想剧透什么,但你们应该很快就能看到图像模型的重大改进。」这番话是在讨论 o1 推理技术应用于图像模型的背景下说的。
据 同日,多个号商的信源表示,用于预付费 OpenAI 额度的账号或 Azure 账号被封禁。此次封禁规模是自 GPT-4o 发布以来最大。
早些时候,ChatGPT 网页版面向会员用户推出了历史记录检索功能。
另外,根据网传图片,OpenAI 在其面向开发者的 DevDay 活动上表示,o1 模型即将推出包括流式输出、图片输入、结构化输出、工具调用等新特性。
GitHub 于近日举办的 2024 年 Universe 大会上发布了一系列重磅更新,进一步强化其作为全球最大开发者社区的地位。据 GitHub 官方博客报道,自 10 年前首次举办以来,GitHub Universe 一直致力于优化开发者体验。今年的活动标志着该平台在 AI 驱动开发方面的重要里程碑。
AI 原生体验全面升级
GitHub 为其 AI 编程助手 Copilot 引入了多种新的 AI 模型,包括 Anthropic 的 Claude 3.5 Sonnet、Google 的 Gemini 1.5 Pro 以及 OpenAI 的 o1-preview 和 o1-mini。这些模型将首先在 Copilot Chat 中推出,并在未来几周内陆续上线。无论是个人开发者还是企业团队,都可以根据具体需求选择最适合的 AI 模型。
新推出的 Copilot Workspace 整合了 Copilot Code Review、Copilot Autofix 以及第三方 Copilot Extensions 功能,旨在加速代码审查和修复流程。开发者可以更快速地完善、验证和实施 Copilot 自动生成的代码建议,显著提升合并请求的准备速度。
GitHub Spark:让创意变为现实
GitHub 发布了全新产品 GitHub Spark,这是一款以自然语言驱动的工具,专注于个人和趣味性的软件开发。Spark 旨在帮助更多人实现成为开发者的梦想,用户可以通过它快速开发小型应用程序,将创意转化为现实。
提升开发效率与安全性
GitHub 还宣布了一系列更新,旨在提高软件开发的速度和安全性。这些更新包括代码补全改进、隐式代理选择以及对 C++ 和 .NET 的更好支持,以提升各类集成开发环境(IDE)中的工作效率。
在安全方面,GitHub 推出了 Copilot Autofix 功能,可以快速修复代码中的漏洞,确保从 IDE 到生产环境的代码更为安全。
企业级体验增强
为满足企业对治理和合规性的需求,GitHub 引入了新功能,为管理员提供了更多用户管理、仓库策略和安全工作流的控制权。同时,GitHub Actions 和 API 活动中新增了基于 Arm64 的运行器和性能跟踪功能,以提升计算资源和工作流效率。
Arc 浏览器近日宣布将停止开发新功能,转而专注于一款全新浏览器产品的开发。这一决定主要源于 Arc 浏览器的复杂性导致用户上手难度过高,从而限制了其成为主流产品的可能性。
据 The Verge 报道,The Browser Company 的首席执行官 Josh Miller 表示,尽管 Arc 的用户十分喜爱其侧边栏、空间和配置文件等自定义功能,但这些功能也成为了其吸引更多用户的障碍。Miller 指出,用户更希望浏览器能够「更快、更流畅和更安全」,而不是不断添加新特性。
根据 Android Authority 的报道,The Browser Company 计划将资源投入到一个全新浏览器的开发上。这款新浏览器预计将在明年年初推出,采用水平选项卡设计,并深度集成 AI 工具,以帮助用户简化工作流程。Miller 强调,新产品将更易于普通用户接受,同时逐步揭示其高级功能。公司希望通过这种方式,缩小普通用户和高级工具之间的差距。
值得注意的是,尽管 Arc 浏览器将不再积极开发新功能,但现有用户仍可继续使用,并获得稳定性更新和错误修复。据蓝点网报道,Arc 浏览器不会被彻底抛弃,而是转向维护更新模式。
据 The Verge 报道,OpenAI 计划于今年 12 月推出其最新的前沿模型 Orion。与近期发布的 GPT-4o 和 Q* 不同,Orion 不会通过 ChatGPT 广泛发布,而是首先向与 OpenAI 密切合作的公司提供访问权限,以便它们构建自己的产品和功能。
消息人士透露,作为 OpenAI 的主要合作伙伴,微软内部工程师正准备在 11 月于 Azure 上托管 Orion。虽然 Orion 在 OpenAI 内部被视为 GPT-4 的继任者,但尚未决定是否将其外部命名为 GPT-5。对此,OpenAI 和微软均拒绝发表评论。
一位 OpenAI 高管曾调侃 Orion 可能比 GPT-4 强大多达 100 倍。OpenAI 的目标是将大语言模型(LLMs)结合,逐步创造出更强大的模型,最终可能达到人工通用智能(AGI)。据悉,OpenAI 正在使用代号为「草莓」的 Q* 模型生成合成数据来训练 Orion。
今年 9 月,OpenAI 的研究人员曾举办庆祝活动,纪念新模型训练的完成。这一时间点也与 OpenAI 首席执行官 Sam Altman 在 X 上的一条神秘帖文相吻合,他提到「期待冬季星座很快升起」,这被解读为指向「猎户座」(Orion)。
OpenAI 最近完成了一轮 66 亿美元的融资,这促使公司转型为营利实体。此外,公司还经历了显著的员工流动,包括首席技术官 Mira Murati 和首席研究官 Bob McGrew 的离职。
熟悉微软 AI 计划的消息人士透露,公司工程师正在准备托管 OpenAI 的 Orion 模型。然而,大多数参与项目的工程师尚未被告知具体细节,以保持机密性。微软对此同样拒绝发表评论。
据了解,OpenAI 已请求访问更多托管 Nvidia H100 GPU 的微软服务器。H100 芯片在 AI 推理和训练方面表现优异,是新一代模型的理想选择。然而,两家公司之间的关系因高昂的计算能力需求而出现紧张。OpenAI 抱怨微软未能提供足够的计算能力以实现其 AGI 目标,并尝试重新谈判此前达成的独家云合作协议。尽管如此,微软仍然是 OpenAI 的主要云合作伙伴,并继续支持其产品和研究工作负载。
(The Verge 1, 2)
10 月 24 日,在科大讯飞全球 1024 开发者节上,讯飞星火 4.0 Turbo 全新升级,七大能力全面超过 GPT-4 Turbo,数学能力、代码能力超过 GPT-4o,星火 4.0 Turbo 效率相对提升 50%。
在数学能力上,讯飞星火已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类 o1 的高难度数学能力显著提升。在国内外中英文 14 项主流测试集中,星火 4.0 Turbo 实现 9 项第一。
Stability AI 近日发布了全新的 SD3.5 模型系列,标志着该公司在经历一段低迷期后重返 AI 图像生成领域的竞争前沿。此次发布的 SD3.5 系列包括三个开源且可商用的模型:Large、Large Turbo 和即将于 10 月 29 日推出的 Medium。
SD3.5 系列的三个模型各具特色:
- SD 3.5 Large:拥有 80 亿参数,是该系列中最强大的基础模型,适合 1M 像素的专业应用。
- SD 3.5 Large Turbo:Large 版本的精简型,仅需 4 步即可生成高质量图像,速度更快。
- SD 3.5 Medium:采用 MMDiT-X 架构,拥有 25 亿参数,支持普通硬件,能够输出 0.25 至 2M 像素的图像。
这些模型不仅强调高适配性和硬件友好性,还支持多元化的人物形象生成和多种视觉风格。Large 版本在提示词理解力方面表现突出,更重要的是,SD3.5 支持对模型进行微调,为社区开发者提供了更大的创新空间。
在社区支持方面,ComfyUI 已经更新支持 SD3.5,用户只需更新到最新版本即可使用。此外,Liblib 也迅速上线了三个 SD3.5 的 Lora 模型供下载,分别是 Linear Red Light、Futuristic Bronze Colored 和 Chinese Line Art。
Anthropic 宣布推出升级版 Claude 3.5 Sonnet 和全新的 Claude 3.5 Haiku 模型,同时引入了实验性的「计算机使用」功能。据 Anthropic 官方介绍,Claude 3.5 Sonnet 在多个领域均有显著提升,尤其是在代码编写方面表现突出。而 Claude 3.5 Haiku 则在多项智能基准测试中超越了此前的旗舰模型 Claude 3 Opus,但成本和速度更接近上一代 Haiku。
据 VentureBeat 报道,Anthropic 新推出的「计算机使用」功能目前处于公开测试阶段。开发者可以通过 API 指导 Claude 像人类一样操作计算机,包括查看屏幕、移动光标、点击按钮和输入文本。尽管这项功能仍在实验阶段,可能偶有错误,但开发者的反馈将有助于其快速迭代改进。
在行业基准测试中,Claude 3.5 Sonnet 表现优异。在 SWE-bench Verified 测试中,其编码能力从 33.4% 提升至 49.0%,超越了所有公开可用模型。在 TAU-bench 中,其在零售和航空领域的表现也有显著提高。据 GitLab 测试,Claude 3.5 Sonnet 在 DevSecOps 任务中提升了推理能力,且未增加延迟,使其成为多步骤软件开发过程中的理想选择。
Claude 3.5 Haiku 则以高性能和经济性见长,特别适合面向用户的产品及专业子代理任务。其低延迟和改进的指令跟随能力使其能够生成个性化体验,如购买历史和库存记录等。
升级版Claude 3.5 Sonnet现已向所有用户开放。从今天起,开发者可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用测试版进行构建。新的Claude 3.5 Haiku将在本月晚些时候发布。
(Anthropic)
据第一财经报道,2024 年 10 月 21 日下午 4 点左右,中国移动系统突发故障,导致用户无法正常登录官网和微信。中国移动 10086 客服确认系统确实出现故障,目前技术人员正在紧急抢修。
客服表示,此次故障预计需要 3 至 4 小时进行修复,可能在晚上 7 点后恢复正常。如果未能如期解决,可能会影响到次日,但公司将尽力避免此情况发生。建议用户在晚上七八点再尝试登录。
据 APPSO, 近日在 X 平台陆续有不少消息称,Anthropic 即将发布超大杯模型 Claude 3.5 Opus。
坊间传闻,OpenAI 在测试名为 gpt-4.5o 的模型,并贴出网络请求截图。本频无法确认该截图的真实性。
本频信源指,OpenAI 近期很可能有一次面向大规模用户的模型更新,但不确定属于 API 还是 ChatGPT 服务。也无法判断是否为下一代模型,还是现有模型的修补增强。
赛博禅心此前预告,ChatGPT 正在测试实时读取网页的新功能。
目前 OpenAI 除 o1 外的最强模型chatgpt-4o-latest,仍未进入 gpt-4o 系列模型列表作为新版本发布。
零一万物公司正式发布了其新旗舰模型 Yi-Lightning(闪电),这款模型在大模型竞技场(Chatbot Arena)上表现优异,总榜单并列第 6,数学分榜并列第 3,代码等其他分榜也名列前茅。其总成绩几乎与马斯克最新的 xAI 大模型 Grok-2-08-13 持平,超过了 GPT-4-0613 等顶级模型。此外,智谱 AI 的 GLM-4-Plus 也进入了总榜,排名第 9。
在大模型竞技场的各类分榜中,Yi-Lightning 表现突出:
- 中文能力:与 o1-mini 一同名列前位
- 数学能力:与 Gemini-1.5-Pro-002 并列第 3
- 代码能力:排名并列第 4
- Hard Prompts 和 Longer Query 分榜:均排名第 4
Yi-Lightning 采用 MoE 混合专家模型架构,优化了混合注意力机制(Hybrid Attention)和跨层注意力(Cross-Layer Attention, CLA),有效降低推理成本并提升性能。通过动态 Top-P 路由机制,Yi-Lightning 可根据任务难度选择最合适的专家网络组合,从而在不同场景中表现出色。
零一万物创始人李开复博士在发布会上表示,公司绝不放弃预训练,并通过多阶段训练方法提升模型能力。Yi-Lightning 的训练与底层架构高度适配,使得推理时更加经济实惠。Yi-Lightning 的定价为每百万词元 0.99 元人民币,与 OpenAI 的 GPT-3.5-turbo 相比价格更具竞争力。李开复博士强调,即便如此定价也不亏损。
同时,零一万物还推出了 AI2.0 数字人方案,提升了互动效果。李开复博士表示,国产大模型与硅谷最顶尖模型的差距缩短至五个月,而「模基共建」是零一万物的独特路径。
(量子位,图:Chatbot Arena)
广东省教育厅短信平台被不法分子入侵
10月12日消息,今日有多名网友在社交平台反映,自己收到了来自广东省教育厅的非法链接短信。短信内容为「【广东省教育厅】深掖必备成電影戳 .com 拒收请回复R」。
广东省教育厅对此发布声明:“近日,发现有不法分子入侵我厅短信平台,以“广东省教育厅”名义向师生和家长发送包含非法链接的短信。我厅已第一时间向公安机关报案,并配合开展调查。请广大师生和家长提高警惕,切勿点击短信中的非法链接,避免个人信息泄露或遭受财产损失。”
10月12日消息,今日有多名网友在社交平台反映,自己收到了来自广东省教育厅的非法链接短信。短信内容为「【广东省教育厅】深掖必备成電影戳 .com 拒收请回复R」。
广东省教育厅对此发布声明:“近日,发现有不法分子入侵我厅短信平台,以“广东省教育厅”名义向师生和家长发送包含非法链接的短信。我厅已第一时间向公安机关报案,并配合开展调查。请广大师生和家长提高警惕,切勿点击短信中的非法链接,避免个人信息泄露或遭受财产损失。”
近日,互联网档案馆(Internet Archive)遭遇了一系列严重的网络攻击,包括分布式拒绝服务(DDoS)攻击和数据泄露事件。据《Forbes》 报道 ,一个自称亲巴勒斯坦的黑客组织 SN_BLACKMETA 宣称对此次攻击负责,导致 3100 万用户的信息被泄露。
根据《Forbes》报道,黑客通过利用 JavaScript 库漏洞攻陷了互联网档案馆的网站,并展示弹出消息警告用户数据泄露。Troy Hunt,Have I Been Pwned 的创始人,确认这些数据包括电子邮件地址、用户名以及经过 bcrypt 算法加密的密码。
据安全公司 Radware 指出,尽管 SN_BLACKMETA 自称为亲巴勒斯坦组织,但该组织的真实动机可能与全球政治不满有关,而非单纯的地缘政治因素。
据 Bleeping Computer 报道,此次数据泄露涉及互联网档案馆的认证数据库,其中包含详细用户信息。1Password 的产品副总裁 Jason Meller 表示 :「数据库被外泄表明后端基础设施可被访问,且攻击者对网站内容有一定控制。」
尽管 bcrypt 算法相对安全,但专家建议用户更改密码以防万一,尤其是在其他网站使用相同密码的用户。这一建议突显了定期更新密码和避免在多个平台使用相同密码的重要性。
互联网档案馆创始人 Brewster Kahle 在 X 平台(原 Twitter)上 表示 ,目前已暂时抵御住 DDoS 攻击,并正在清理系统和加强安全措施。然而,SN_BLACKMETA 在 X 上继续 宣称 计划发起更多攻击,理由是互联网档案馆「属于美国」,而美国政府被指责支持以色列。
这一说法被认为是误导性的,因为互联网档案馆是一个非营利组织,并提供大量关于巴勒斯坦的资源。
(综合媒体报道)
据 BlackForestLabs 官方宣布,其最新一代人工智能模型 FLUX1.1 [pro] 正式发布,同时推出了 beta 版 BFL API。
FLUX1.1 [pro] 模型在性能方面有显著提升。与前代相比,其生成速度提高了 6 倍,同时在图像质量、提示遵循性和输出多样性等方面均有改进。在保持原有输出质量的基础上,新模型的生成速度提高了 2 倍。根据测试,FLUX1.1 [pro] 的运行速度是当前 FLUX1.0 [pro] 的 3 倍。这种卓越的速度和效率大大降低了延迟,实现了图像质量与推理速度的最佳平衡,有助于提高工作流程效率。
代号为「blueberry」的 FLUX1.1 [pro] 已在知名文本到图像模型评测平台 Artificial Analysis 上进行了基准测试。结果显示,该模型超越了所有其他模型,获得了排行榜最高的 Elo 分数。
BlackForestLabs 表示,FLUX1.1 [pro] 即将支持超高分辨率生成功能,允许用户创建高达 2K 分辨率的图像,且不会影响提示准确性。该功能将通过 API 提供。此外,新模型还将在 together.ai、Replicate、fal.ai 和 Freepik 等热门平台上线。
随 FLUX1.1 [pro] 一同发布的还有 beta 版 BFL API。这一 API 为开发者和企业提供了 FLUX 的高级功能,使其能够无缝集成先进的图像生成技术。BFL API 的主要优势包括:
- 高级自定义:通过灵活选项调整输出,包括模型选择、图像分辨率和内容审核。
- 可扩展性:从小型项目到企业级应用都能轻松扩展。
FLUX.1 模型定价如下:
FLUX.1 [dev]:每张图片 2.5 美分
FLUX.1 [pro]:每张图片 5 美分
FLUX1.1 [pro]:每张图片 4 美分
该模型也已在 POE 平台上线。
(BlackForestLab)
腾讯宣布微信鸿蒙原生版正式开始邀请内测。此次内测对象为已升级至原生鸿蒙操作系统HarmonyOS NEXT的用户,用户在收到邀请后可抢先体验新版本。
据了解,腾讯这款「尝鲜版」的微信,已包含基础社交通讯,音视频通话、朋友圈、微信支付的二维码收/付款等功能。
(鹅厂黑板报)