起于小站,终于生活。
现实之外,一个普通人的思考。

博客地址:ygxz.in
讨论组:https://t.me/+a5Clq4jLuJc4YWQ9
115 网盘称服务器遭恶意攻击,网盘服务一度中断

2024 年 9 月 16 日,广东一一五科技股份有限公司(以下简称「115 科技」)发布紧急声明,称公司服务器遭到恶意网络攻击,导致包括 115 生活(前称「115 网盘」)在内的多项产品服务出现登录故障。

据 115 科技官方声明,公司技术团队已在第一时间展开紧急修复工作,相关问题将在修复完成后及时告知用户。针对网络上流传的「115 网盘终止服务」等不实消息,115 科技特别澄清,这些言论均为谣言。

115 科技

本频信源向 115 方面查证后表示,此次 115 网盘中断为 115 方面线上故障导致,与阿里云和台风均无关。
一个小站的自留地
据@数字生命卡兹克, ChatGPT Pro会员灰度上线,售价200刀/月,疑似为全新的模型,草莓(Strawberry)准备。 The Information 也在昨天报道,OpenAI 的新「草莓」模型可能会在两周内上线。 这一模型通过延长思考时间获得更强的推理能力,智能达到 GPT-4.5 级别,可能会成为 OpenAI 自 GPT-4 发布后的「下一代旗舰」。 主要的中文科技媒体均援引The Information 报道了本条新闻,但本频暂时无法独立对此进行验证。
OpenAI 推出新模型 o1:推理能力大幅提升

北京时间 9 月 13 日凌晨,OpenAI 发布了全新的推理模型系列——o1 系列。该系列包含两个版本:o1-preview 和 o1-mini,分别面向不同的用户群体。据 OpenAI 官方消息,o1 系列在复杂推理任务上的表现显著提升,尤其是在科学、编程和数学等领域。为了彰显这一突破性进展,OpenAI 将计数器重置为 1,并将该系列命名为 o1。

o1 系列的推理能力远超此前的 GPT-4o 模型。例如,在国际数学奥林匹克(IMO)资格考试中,GPT-4o 仅能解答 13% 的问题,而 o1-preview 模型则正确解答了 83%。此外,在 Codeforces 编程竞赛中,o1 模型达到了第 89 百分位的成绩。OpenAI 强调,o1 是其首个通过强化学习训练的大语言模型,通过「思维链」(Chain of Thought)技术,该模型能够进行更深入、更系统的推理。

ChatGPT Plus 和 Team 用户可以立即使用 o1-preview 和 o1-mini,而企业用户和教育用户将在下周获得访问权限。据 OpenAI 官方公告,对于 API 用户,消费超过 1,000 美元且自首次付款以来已超过 30 天的开发者,从即日起可以使用这两款模型,但速率限制为每分钟 20 个请求。此外,OpenAI 计划未来向所有 ChatGPT 免费用户开放 o1-mini 的使用权

与 GPT-4o 相比,o1-preview 的 API 使用成本明显提高。据 OpenAI 公布的数据,o1-preview 每百万输入词元(Token)收费为 15 美元,每百万输出词元收费则高达 60 美元,而 GPT-4o 的相应价格仅为输入 5 美元/百万词元、输出 15 美元/百万词元。尽管价格不菲,但 OpenAI 坚称其推理能力有了质的飞跃,尤其是在需要复杂逻辑分析和多步骤推理的任务中表现尤为突出

OpenAI API 产品负责人 Michelle Pokrass 在社交媒体上表示:「如果你曾经有一个产品创意,但当时的模型还不够智能,不妨再试试这些新模型。」

根据 OpenAI 总裁 Greg Brockman 的说法,o1 是第一个通过强化学习训练的模型,它能够「深入思考」后再回答问题。他进一步解释道,这一技术突破不仅显著提升了推理指标,还让 AI 的思维过程更加透明化。「通过『思维链』技术,模型从『系统 I』思考进化到『系统 II』思考,即逐步构建更复杂的问题解决方案。」

据 OpenAI 官方介绍,o1 系列依赖于强化学习技术来提升其推理能力。在生成最终答案之前,该模型会经历长链条式的逻辑分析和内部思考过程。这种方式使得它在处理复杂问题时更加可靠。例如,在 GPQA 基准测试中,该模型成功超越了人类博士生水平;而在数学和编程领域,其表现尤为亮眼。在今年举行的国际信息学奥林匹克竞赛(IOI)中,经微调后的 o1 模型在每题尝试 50 次条件下获得了 213 分,跻身参赛者前 49%。

除了旗舰版 o1-preview 外,本次发布还包括一个更快且成本更低的小型版本——o1-mini。据介绍,该版本特别适合那些需要强大推理能力但不依赖广泛世界知识的任务场景,例如编程和数据分析任务。相比于 o1-preview 的高昂定价,o1-mini 的成本降低了约 80%,但其核心推理能力依然十分强大。

(综合媒体报道)
一个小站的自留地
阿里云上海数据中心网络故障,B站等多家互联网平台服务受影响 2024 年 7 月 2 日上午,阿里云上海数据中心发生网络故障,导致多家依赖其服务的互联网平台出现不同程度的服务中断。 北京时间 10 时 04 分左右,阿里云表示,监控系统首次发现上海地域可用区 N 出现网络访问异常,工程师已开始紧急处理。 受此影响,知名视频网站哔哩哔哩遭遇大规模服务异常。用户反馈无法查看动态内容、发表或浏览评论、进行点赞操作,甚至收藏夹也显示为空白。 故障发生后,B站官方微博尚未就此次事件发布任何说明或解释。与此同…
阿里云新加坡机房 10 日发生火灾

北京时间 2024 年 9 月 10 日 10:20,阿里云监控发现新加坡地域可用区 C 出现网络访问异常,部分云产品服务因此中断。根据阿里云发布的公告,此次事故由新加坡机房内锂电池爆炸引发火灾,导致机房温度急剧升高。目前,消防人员已抵达现场进行处理,但由于火情复杂,部分云产品的恢复工作仍在进行中。

阿里云健康看板显示,目前新加坡区域仍有服务未恢复。官方最后一则故障更新来自 11 日凌晨01:46,称接当地消防要求,因消防浇水持续进行,机房开始出现积水和渗漏,电路存在短路风险,新加坡可用区C 一栋机房大楼整体紧急断电,可用区C其他大楼业务网络已陆续恢复。

本频查证后发现,阿里云在新加坡有三个数据中心,起火的为其中一个。新加坡本地媒体报道,失火的是位于罗央大道的Digital Realty数据中心,有人听到爆炸声后,见到数据中心冒起浓烟。

此次事故暂时未报告人员伤亡。阿里云新加坡地域可用区 C 部分服务截至发稿仍未恢复。

阿里云,视频:8world News)

——————

进展更新:

11 日凌晨,大部分受到网络影响的云产品已恢复正常服务。剩余断电的机房业务仍需等待物理条件的恢复。

11 日晚 20:23,消防部门仍在处理大楼现场风险中,运维工程师正在等待获准进入机房大楼。如现场评估后不具备原地恢复的物理条件,应急小组将执行服务器设备迁移恢复预案。

12日17:25,阿里云运维人员已获准进入大楼一层区域,正在现场评估安全迁移条件,并对硬件设备进行紧急保全。

13日18:30,一层硬件设备正在安全迁移进行中。运维人员已获准进入二楼,完成勘查工作,在保全工作后将启动二层机器设备的安全迁移。
一个小站的自留地
macOS 虚拟机软件Parallels Desktop 19 发布 Parallels Desktop 19 for Mac发布,提供了以下更新: ·这个版本增加了与macOS Sonoma的兼容性,重新设计了融合模式下使用Windows应用程序的方法。 ·在设计方面进行了改进,包括新的应用程序图标和产品细节。 ·支持使用Touch ID登录Windows,提供更简单和安全的登录方式。 ·改进了OpenGL支持,可以在Mac上运行更多的Windows专用CAD软件和地理信息系统软件。 ——————…
Parallels Desktop 20 for Mac 发布

据 Parallels 官方消息,Parallels Desktop 20 已为即将发布的 macOS Sequoia 做好准备。新版本在稳定性方面有显著提升,并允许用户在 macOS Sequoia 上结合使用 AI 写作工具与 Windows 应用程序(需要 macOS Sequoia 15.1)。此外,新版本减少了对不再推荐使用的 API 的依赖,转而采用苹果推荐的 API,以确保系统安全性和合规性。

在 Windows 平台方面,Parallels Desktop 20 为即将到来的 Windows 11 24H2 提供了支持。新版本修复了 NVMe 驱动问题,并改进了基于 Intel 芯片的 Mac 上快速安装 Windows 的体验。动态分辨率调整功能也得到了优化,用户可以更加流畅地调整虚拟机窗口大小。据官方测试数据,Microsoft 的 Prism 模拟器更新让 Windows 11 on Arm 的性能在某些计算工作负载下提升高达 80%。

Parallels Desktop 20 的另一大亮点是全新的 Parallels AI Package。这一功能使开发者能够快速上手 AI 开发,并且无需联网即可测试不同配置下的 AI 虚拟机。据官方介绍,该功能通过预打包的虚拟机大大缩短了 AI 开发入门时间,并且成本较低。

针对 Linux 用户,本次更新同样带来了显著改进。根据 Parallels 官方分析报告显示,有近一半的问题源自内核中的共享文件夹驱动不兼容。因此,本次更新引入了高层次 FUSE API,不仅解决了安装问题,还大幅提升了未来 Linux 内核发行版的兼容性。同时,与 Mac 主系统共享文件卷时,文件操作速度提升至原来的四倍。

(Parallels)
一个小站的自留地
疑似来自 OpenAI 的新模型 anonymous-chatbot 上线 LMSYS 大模型竞技场 一个名为 anonymous-chatbot 的神秘大语言模型出现在 LMSYS 大模型竞技场上,但根据用户反馈,其性能表现出色,在某些任务上甚至超越了当前最先进的模型。 据用户报告,anonymous-chatbot 在多项测试中表现优异,包括成功完成了「草莓测试」和「过河难题」等逻辑推理任务。该模型还能正确回答 9.9 和 9.11 大小比较等需要精确数学计算的问题。另一位用户表示,该模型能够一次…
据@数字生命卡兹克, ChatGPT Pro会员灰度上线,售价200刀/月,疑似为全新的模型,草莓(Strawberry)准备。

The Information 也在昨天报道,OpenAI 的新「草莓」模型可能会在两周内上线。

这一模型通过延长思考时间获得更强的推理能力,智能达到 GPT-4.5 级别,可能会成为 OpenAI 自 GPT-4 发布后的「下一代旗舰」。

主要的中文科技媒体均援引The Information 报道了本条新闻,但本频暂时无法独立对此进行验证。
一个小站的自留地
据华为终端消息,9月10日14:30,华为将举行见非凡品牌盛典及鸿蒙智行新品发布会。
华为发布三折叠手机 Mate XT 非凡大师,售价19999 元起

2024 年 9 月 7 日,华为正式发布了全新的三折叠手机——Mate XT 非凡大师。「一屏三折」的设计支持 1:1、1:2 和 2:1 三种比例的自由分屏操作。

- 配备全新「天工铰链系统」
- 引入内折铰链的嵌入式滑轨结构与外折铰链的一体连杆结构,核心部件 100% 使用火箭钢
- 屏幕采用超维折叠有机材料, 92% 屏占比,并且展开时最薄处仅 3.6 毫米。
- 搭载小艺 AI 助手
- 支持天通卫星通信

续航方面,Mate XT 非凡大师内置 5600mAh 的硅碳负极电池,并采用三电芯并联设计,以确保电池容量不因设备形态而受限。该设备支持 66W 有线快充和 50W 无线快充,为长时间使用提供可靠保障。

据发布会公布的信息,Mate XT 非凡大师共有三个版本:

- 16GB + 256GB 版本售价 19999 元
- 16GB + 512GB 版本售价 21999 元
- 16GB + 1TB 版本售价 23999 元


据悉,仅预订开启后的前 24 小时内,其预约量就突破 200 万台。截至目前,总预约量已超过 400 万台。

据《深网》报道,由于备货量有限,该设备在某些二级市场甚至被炒至四万元以上。分析人士指出,由于售价较高且供应量有限,这款三折手机短期内不会对苹果 iPhone 的销量构成直接威胁。但其发布无疑巩固了华为作为国内领先折叠屏厂商的重要地位。

据 IDC 数据显示,截至 2024 年上半年,通过推出包括 Mate60 系列及其他高端产品线在内的一系列新品,华为再次以 17.5% 的市场份额重回中国市场第一位。而随着此次 Mate XT 的发布,其有望进一步巩固自身在高端市场中的领导地位。据艾瑞咨询发布的数据,在万元以上价格区间内,每卖出三台万元以上智能设备,就有两台来自华为。

华为消费者业务 CEO 余承东表示:「我们不能只为今天做产品,而是要为未来去设计」。

(综合爱范儿、深网)
一个小站的自留地
Apple 2024 秋季发布会:iPhone 16 系列、Apple Watch Series 10、AirPods 4 重磅亮相

2024 年 9 月 10 日凌晨,Apple 如期举行了备受期待的秋季发布会,主题为「It's Glowtime」。本次发布会上,Apple 推出了 iPhone 16 系列、Apple Watch Series 10、AirPods 4 等多款新品。虽然硬件更新并未带来太多惊喜,但围绕 AI 的发展方向和应用引发了广泛讨论。

iPhone 16 系列:全新相机控制键与 A18 芯片加持


本次发布的 iPhone 16 系列包括 iPhone 16、iPhone 16 Plus、iPhone 16 Pro 和 iPhone 16 Pro Max 四款机型。外观设计延续了上一代的风格,但新增的相机控制按钮成为一大亮点。用户可以通过侧面的物理按键快速启动相机,并实现拍照、视频录制等操作,进一步提升了拍摄体验。

在性能方面,iPhone 16 系列搭载了全新的 A18 芯片,基于第二代 3nm 工艺打造,CPU 性能较上一代提升了 30%,GPU 性能提升 40%,同时功耗也有所降低。该芯片还集成了更强大的神经网络引擎,为 Apple Intelligence 提供强劲支持。

售价方面,iPhone 16 起售价为 5999 元,iPhone 16 Plus 起售价为 6999 元;而高端的 iPhone 16 Pro 起售价为 7999 元,Pro Max 则起售价 9999 元。所有机型将于 9 月 13 日开启预购,并于 9 月 20 日正式发售。

Apple Watch Series 10:十周年纪念款,更大更薄

作为 Apple Watch 发布十周年的纪念款,本次推出的 Apple Watch Series 10 在设计上进行了全面优化。新款手表采用了更大的显示屏,相比 Series 6 增加了 30% 的屏幕面积,同时厚度仅为 9.7 mm,成为有史以来最薄的 Apple Watch。

Series 10 首次引入了广视角 OLED 显示屏,在倾斜角度下观看时亮度最高可提升 40%。此外,新手表还具备睡眠呼吸暂停检测功能,这一功能目前正在等待 FDA 批准。起售价为 2999 元,将于 9 月 11 日开启预购,并于 9 月 20 日正式发售。

AirPods 4:更小巧、更智能

本次发布会还带来了全新的 AirPods 产品线——AirPods 4。新款耳机分为普通版和支持主动降噪的版本,两者均搭载 H2 芯片,并支持 USB-C 接口充电。相比前代产品,新款充电盒体积缩小了 10%,但续航时间依然达到了 30 小时。

AirPods 普通版售价为 999 元,而支持主动降噪功能的版本则售价 1399 元。两款耳机将于 9 月 20 日正式发售。

Apple Intelligence:AI 驱动的新体验

除了硬件更新,本次发布会还重申了 Apple 对 AI 的重视。Cook 表示,新一代 iPhone 是「专为 Apple Intelligence 打造」的设备。据悉,Apple Intelligence 将于今年十月推出测试版,并首先支持英语版本,而中文等其他语言版本预计将在明年陆续推出。

Apple Intelligence 的核心功能包括智能写作、照片与视频搜索、通知管理等,这些功能都依赖于设备端的大模型计算能力,以保证用户隐私安全。同时,该系统还能根据用户个人习惯进行个性化调整,从而提供更贴合需求的使用体验。

(综合国内媒体报道)
一个小站的自留地
Apple 特别活动发布多款产品 有几个朋友半夜问我在看发布会没, 其实没有( 刚看完媒体的总结,数字系列的iPhone纯属挤牙膏,活该股价跌。 Pro系列虽说也有点看头,但就前期试产过程中的爆料来看,苹果还是收起来了不少大招,比如充电和电池技术之类。 个人猜测,由于市场普遍预计今年是iPhone用户的换机潮,销量必会有一个小高峰,苹果就砍了几刀新功能放明年了。 Apple Watch算是一个市场表现比较正面的产品,除了苹果自吹的环保以外,也算是有不小的提升。如果你是恰好到了换机周期,完全可以考虑。…
Apple 特别活动发布多款产品

今年苹果发布会,不出意外地,网上是骂「无聊」的声音居多。我全称观看了发布会直播,在这里简单介绍一下。

Apple Watch 系列,10 代并没有大家期待的完全重新设计这样的大更新,但是变轻薄、变大屏已经让这一代 Apple Watch 拥有了足够独特的记忆点,相信有非迫切需要的用户,在明年回来买降价的 Series 10 会是一个理想的选择。

AirPods 系列,除去 Max 不思进取以外,另外两款设备的更新都姑且算得上有用。特别是将耳机作为助听器,是我曾经看到过的一个真实存在且有潜力被 AirPods 解决的用户需求。作为有帮助作用的、集听力测试和助听为一体的非处方助听器,AirPods Pro 其实称得上高性价比。当然在音质上,AirPods 系列已经难再有明显进步,此时通过挖掘新需求来创新也是无奈之举。

iPhone 系列仍然是每年秋季发布会关注度最高的产品。我从两个平台看了初步调查,Apple Watch Series 10 是观众购买欲望最强的产品,其次是 iPhone 16 Pro。iPhone 16 系列大概率是产品外观大改前的一代,其地位有点类似 iPhone 8 之于 iPhone X,对于追新的用户来说并不合算,但有潜力成为比较经典、耐用的一代。

去年我说数字系列等等党必赢,今年应该算是应验了。

今年 iPhone 16 系列的更新,有看点的不过拍照按钮和相机更新、网络方面的 WiFi-7 和(传言的)基带更新、屏幕强度和散热改进、使用 N3E 工艺的新处理器,别的就有些不好说了。Pro 作为创作工具方面的更新,以及发布会上给 AI 继续画的大饼显然相对更加可圈可点。

值得特别指出的是 Qi2 在国内的尴尬处境。由于新规规定频段的冲突,iPhone 16 系列大概率在国内会通过 Qi1 的频段进行无线充电,这也就意味着 iPhone 本就遥遥落后的无线充电速率在短期内会更加不堪。

Apple Intelligence 的部分,官方宣布了明年增加对于中文的支持,官网也更新表述为「待监管机构批准」,基本和我发布会前对Apple Intelligence 上手体验时的想法一致。苹果会根据语言进行(端侧)大模型微调,因此设备端模型进入国内市场的合规化也可以顺理成章地通过这一步骤完成。但国内大概率永远用不上完全体的Apple Intelligence ,比如视觉识别(类似 Google Lens)这类强依赖数据提供商和本地化数据的功能。你不能指望百度做 Google 的事情。

专家们嘴上说着今年 iPhone 可能不太值得买,但我认为今年的 iPhone 对于去年没买 iPhone 15 系列的用户来说,都是非常有吸引力的,特别是iPhone12和更早的用户。(13 香如果存储够用,理论上完全可以撑到明年改款)
一个小站的自留地
DeepSeek-V2.5-0905 发布,文理模型合二为一 DeepSeek 对旗下模型进行了重大更新。具体变动包括 deepseek-coder 模型正式下线,以及 deepseek-chat 模型升级至 DeepSeek-V2.5-0905 版本。 新版模型DeepSeek-V2.5-0905 在与 GPT-4 的对战中表现出色, 在写作任务、指令跟随和拒答表现等方面也得到了优化,代码生成能力已达到 DeepSeek-Coder-V2-0724 的水平。 官方表示,deepseek-chat 模型已升级为…
DeepSeek 旗下最新旗舰模型 DeepSeek-V2.5-0905 宣布开源。这一模型有望成为最强开源模型的有力竞争者。

DeepSeek-V2.5 (236B) 现已开源到了 HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V2.5

DeepSeek-V2.5 不仅保留了原有 Chat 模型的通用对话能力和 Coder 模型的强大代码处理能力,还更好地对齐了人类偏好。

此外,DeepSeek-V2.5 在写作任务、指令跟随等多个方面也实现了大幅提升。DeepSeek-V2.5 现已在网页端及 API 全面上线,API 接口向前兼容,用户通过deepseek-coder 或 deepseek-chat 均可以访问新的模型。同时,Function Calling、FIM 补全、Json Output 等功能保持不变。
一个小站的自留地
DeepSeek 启用上下文硬盘缓存技术,大模型的价格再降低一个数量级 8 月 2 日起, DeepSeek API 将默认启用上下文硬盘缓存技术,把预计未来会重复使用的内容,缓存在分布式的硬盘阵列中。如果输入存在重复,则重复的部分只需要从缓存读取,无需计算。该技术不仅降低服务的延迟,还大幅削减最终的使用成本。 缓存命中的部分,DeepSeek 费用为 0.1元 /百万 tokens。至此,大模型的价格再降低一个数量级。 硬盘缓存服务已经全面上线,用户无需修改代码,无需更换接口,硬盘缓存服务将自动运…
DeepSeek-V2.5-0905 发布,文理模型合二为一

DeepSeek 对旗下模型进行了重大更新。具体变动包括 deepseek-coder 模型正式下线,以及 deepseek-chat 模型升级至 DeepSeek-V2.5-0905 版本。

新版模型DeepSeek-V2.5-0905 在与 GPT-4 的对战中表现出色, 在写作任务、指令跟随和拒答表现等方面也得到了优化,代码生成能力已达到 DeepSeek-Coder-V2-0724 的水平。

官方表示,deepseek-chat 模型已升级为 DeepSeek-V2.5-0905,接口保持不变;而deepseek-coder 模型已下线,相关调用会转发到 deepseek-chat。

DeepSeek
一个小站的自留地
Anthropic 推出 Claude 提示缓存功能,可大幅降低成本 人工智能公司 Anthropic 于 8 月 14 日宣布,在其 API 上推出名为「提示缓存」(Prompt Caching)的新功能。该功能允许开发者在 API 调用之间缓存频繁使用的上下文信息,从而为 Claude 模型提供更丰富的背景知识和输出示例,同时显著降低成本和延迟。 提示缓存功能目前已在 Claude 3.5 Sonnet 和 Claude 3 Haiku 模型的公测版中提供。对于长提示,该功能可以将成本降低高达 90%…
Anthropic 推出 Claude Enterprise

Anthropic 于 2024 年 9 月 4 日宣布推出面向企业用户的新订阅计划 Claude Enterprise,旨在为需要更多管理控制和增强安全性的企业客户提供服务。这一举措将使 Anthropic 直接与 OpenAI 的 ChatGPT Enterprise 展开竞争。

据 TechCrunch 报道,Claude Enterprise 允许企业将专有的公司知识上传至 Anthropic 的 AI 聊天机器人 Claude。Claude 随后可以分析这些信息,回答相关问题,创建图形和简单网页,或充当公司特定的 AI 助手。Claude Enterprise 的上下文窗口扩展至 500K 个词元,使得 Anthropic 的模型能够在一次提示中处理多达 20 万行代码、数十个 100 页文档或两个小时的音频转录。

此外,Claude Enterprise 还包括 GitHub 集成功能,使工程团队能够将其 GitHub 存储库与 Claude 同步。这一集成功能可用于快速培训新工程师、创建新功能或解决错误等任务。

TechCrunch 引述 Anthropic 产品负责人 Scott White 的话称,Claude Enterprise 的具体定价尚未公开,但预计将高于 Anthropic 的 Team 计划(每位成员每月 30 美元)。White 解释道,由于企业客户可以从 Claude 中获得更多收益,因此其价格也相应更高。在早期测试阶段,包括 GitLab、Midjourney 和 IG Group 等知名企业客户已经开始使用 Claude Enterprise,并反映出显著的生产力提升。
一个小站的自留地
智谱 AI 发布三款大模型

智谱 AI 近日发布了三款新的大型语言模型及其 API,包括 GLM-4-Plus、GLM-4V-Plus 和 CogView-3-Plus。

- 语言基座模型 GLM-4-Plus:在语言理解、指令遵循及长文本处理等方面性能全面提升,保持国际领先水平。该模型已上线智谱 AI 开放平台(bigmodel.cn),并将在「清言 APP」中提供体验。

- 文生图基座模型 CogView-3-Plus:性能接近当前最优的 MJ-V6 和 FLUX 等模型。该模型已上线智谱 AI 开放平台提供 API 服务,并正式上线「清言 APP」。

- 图像/视频理解基座模型 GLM-4V-Plus:具备卓越的图像理解能力,并具有基于时间感知的视频理解能力。该模型已上线智谱 AI 开放平台,成为国内首个通用视频理解模型 API。

除此之外,KDD 2024 大会上,智谱还宣布了其他更新:

- 视频生成基座模型 CogVideoX:在发布并开源 2B 版本后,5B 版本也正式开源。其性能进一步增强,成为当前开源视频生成模型中的最佳选择。

- 「清言 APP」上线视频通话功能:这是国内首个面向 C 端用户开放的 AI 视频通话服务,具备实时推理能力。该功能将于 2024 年 8 月 30 日上线,首批面向部分用户开放,接受外部申请。

- GLM-4-Flash API:智谱 AI 宣布将 GLM-4-Flash API 全面免费开放,以支持用户快速构建专属模型和应用。同时,该服务还提供微调功能以满足不同需求。
一个小站的自留地
OpenAI 新 GPT-4o 模型重夺 LMSYS Chatbot Arena 榜首 OpenAI 近日更新了 ChatGPT 背后的 GPT-4o 模型,新版本在 LMSYS Chatbot Arena 测试中以 1314 分的成绩重新夺回第一名,超越了谷歌的 Gemini-1.5-Pro-Exp 模型。 此次更新的主要改进包括: - 编码能力显著提升,得分提高 30 分 - 指令跟随能力增强 - 处理复杂提示的能力提升 新模型在各项分类排名中均位列第一。OpenAI 已将新版本命名为 chatgpt…
谷歌发布三款 Gemini 实验 AI 模型,1.5 Pro 冲榜第二

2024 年 8 月 28 日,谷歌 AI Studio 产品总监 Logan Kilpatrick 在 X 平台宣布推出三款实验性 Gemini 模型:

- Gemini 1.5 Flash-8B:这是 Gemini 1.5 Flash 的精简版本,拥有 80 亿参数,专为多模态任务设计,包括大容量任务和长文本摘要。
- Gemini 1.5 Pro Exp-0827:该模型主要增强编程和复杂提示词功能,现已通过 Google AI Studio 和 Gemini API 免费提供。
- Gemini 1.5 Flash Exp-0827:在性能上有显著提升,排名从之前的第 23 位提升至第 6 位。


据 VentureBeat 报道,新的 Gemini 1.5 Pro Exp 0827 型号在各方面都优于 8 月初发布的实验型号,目前在 LMSYS 上的排名为第 2 位,仅次于 OpenAI 的 chatgpt-4o-latest 模型。

此外,从 9 月 3 日起,系统将自动将对 gemini-1.5-pro-exp-0801 模型的请求重定向到新的 gemini-1.5-pro-exp-0827 模型,旧型号将从 Google AI Studio 和 API 中移除。

用户可以通过 Gemini API 和 Google AI Studio 访问上述两个模型,名称分别为 gemini-1.5-pro-exp-0827 和 gemini-1.5-flash-exp-0827。

Google
一个小站的自留地
IBM 中国与思杰马克丁签署 SPSS 产品独家转售协议 2024年7月1日,IBM 中国宣布将与苏州思杰马克丁软件有限公司(简称思杰马克丁)拓展合作。根据协议,思杰马克丁将全面独家负责 IBM SPSS 系列产品在中国大陆地区的转售模式发行业务。 IBM 大中华区董事长兼总经理陈旭东表示,此次合作旨在针对性满足国内客户需求,提供更灵活高效的支持。思杰马克丁董事长金勇表示,将与 IBM 合作推出新的渠道政策和奖励计划,共建正版软件生态系统。 SPSS 是业界领先的数据科学和统计分析软件。思杰马克丁成立于2009年…
IBM 大规模裁撤中国研发部门,涉及超 1000 名员工

IBM 近日宣布将彻底关闭其在中国的研发部门,包括 IBM 中国开发中心(CDL)和 IBM 中国系统中心(CSL),涉及员工超过 1000 人。此举意味着 IBM 在国内彻底裁撤了研发部门。

据本频信源拿到的会议全文,IBM 全球企业系统开发副总裁 Jack Hergenrother 在会议中表示,为了支持全球客户和业务战略,IBM 基础设施部门决定将中国系统实验室的开发任务转移到其他海外 IBM 基础设施地点。他强调,这一决定是基于市场动态和激烈竞争的影响,近年来 IBM 在中国的基础设施业务有所下降

IBM Z 和 Linux One 总经理 Ross Moury 以及存储工程副总裁 Danny Mace 也在会议中发言,感谢员工的贡献,并表示这是一个艰难但必要的决定。

据《科创板日报》报道,CDL 和 CSL 分别成立于 1999 年和 2004 年,是 IBM 在中国的重要研发基地。IBM 方面表示,此次调整是为了聚焦混合云和人工智能等高增长领域,以适应市场变化。

据新智元报道,8 月 25 日晚间,IBM 中国区突然关闭了研发和测试岗位的访问权限。在被收回权限之前,这些员工均正常上下班,甚至有部分员工还在加班。关闭权限后,他们被移除出工作群组,无法登录公司内网,但仍可以访问邮件。

一线经理于 8 月 25 日晚上收到裁员通知,而普通员工直到 8 月 28 日早上才正式被告知。据报道,员工在一场仅持续三分钟的全员会议上被告知裁员决定,会议结束后直接切断了连接。一位员工表示:「大家听完之后很气愤,感觉受到了侮辱。」

IBM 官方以协商离职的方式处理此次裁员,并提供了分级的补偿方案:

- 若在 2024 年 9 月 13 日之前签字,将获得 N+3 的补偿;
- 在 9 月 13 日至 9 月 20 日之间签字,补偿金额为 N+1;
- 2024 年 10 月 31 日之后签字则没有补偿。

此次裁员并不涉及咨询及售后等支持团队。

近年来,IBM 在中国的经营压力加大。2023 年,IBM 全球营收为 619 亿美元,同比增长 2%,但中国市场收入却骤降 19.6%。截至 2023 年底,IBM 共拥有约 282,200 名员工,相比 2022 年减少 6100 人。一位大连的 IBM 员工提到:「很多员工已经一年多没太有项目可做,这次裁员只能说 IBM 已经很良心了,没见过哪个公司能白养员工一两年,还正常发工资。」

对于此次裁员是否与 AI 替代人工相关,许多员工表示否认。内部知情人士透露,目前 AI 替代人力的项目在 IBM 内部尚属少数,短时间内研发人员的工作仍无法被 AI 替代。此外,此次裁员的筹备工作早在三四年前就已启动
一个小站的自留地
苹果正式宣布,将于北京时间 9 月 10 日凌晨 1 点在加利福尼亚州库比蒂诺的总部举办特别活动,主题为「高光时刻(It 's Glowtime)」。

发布会上有望带来 iPhone 16 系列手机、Apple Watch Series 10 以及 AirPods 4 等新品。

苹果还计划在今年晚些时候开始将其 Mac 换用M4 处理器,但 Mac 更新通常要等到每年 iPhone 发布后约一个月才会发布。
上海电信宽带大面积断网

2024 年 8 月 26 日 17:30 左右,上海电信部分宽带业务发生异常。对此,上海电信表示正在全力抢修排障,并对用户所带来的不便深表歉意。

据 IT 之家报道,当天有大量网友在社交平台反馈上海电信宽带网络出现问题。18:00 左右,不少用户反映宽带信号消失,甚至无法拨打电信 10000 号进行报修。一些网友称,他们最初怀疑是自家网络出现问题,甚至联系了维修师傅,后来才得知是全市范围内的网络故障。

相关话题登上微博热搜第二。在「中国电信上海客服」微博下,不少用户已留言反馈。

上海电信回应称,17时30分左右,上海电信部分宽带业务发生异常,经紧急抢修,已于18时05分全面恢复正常。电信宽带受理人员对此表示,是电信数据有问题导致了断网情况。

(图源网络)
一个小站的自留地
FLUX 模型:AI 图像生成新标杆 Black Forest Labs 公司(原Stable Diffusion团队成员创立)近日发布了革命性的 FLUX 系列图像生成模型。FLUX 采用创新的混合架构,结合 Transformer 和扩散技术,拥有 120 亿参数,在图像质量、提示词响应和输出多样性方面均达到了新高度。 模型版本: - FLUX.1 [pro]:顶级商业版本,提供最高质量的图像生成能力。 - FLUX.1 [dev]:开放权重的非商业版本,适合研究和开发使用。 -…
Ideogram 2.0 发布,AI 图像生成再上新台阶

Ideogram 2.0 现已向所有用户免费开放,用户可在 ideogram.ai 平台和全新 iOS 应用上使用这一最新的文本到图像生成模型。

官方表示,Ideogram 2.0 不仅增强了创作能力,还推出了 iOS 应用、API 和视觉搜索系统。用户可以选择五种不同风格生成图像,包括一般风格、写实风格、设计风格、3D 风格和动漫风格,满足不同创作需求。其写实风格能够生成近乎真实的照片,设计风格则显著提升了文本渲染的准确性

在功能方面,用户现在可以在生成图像时选择特定的颜色调色板,以确保品牌一致性和艺术控制。此外,Ideogram 还推出了公测版 API,为开发者提供灵活的集成方案。

Ideogram 2.0 允许用户每天生成多达 40 张图像,而付费计划则提供更多优先生成的积分,帮助企业和内容创作者更高效地进行视觉内容制作。该平台还提供多种订阅选项,从每月 7 美元的基础计划到 48 美元的专业计划不等,每个计划都提供不同数量的优先生成积分和其他福利。

——————

Midjourney 宣布其网站正式向所有用户开放

在面对来自 Elon Musk 的 xAI 及其 Grok 2 模型,以及 Ideogram 2 等竞争对手的挑战下,Midjourney 选择通过开放网站来吸引更多用户。

Midjourney 近日宣布其网站正式向所有用户开放,新用户可免费生成约 25 张 AI 图像。这一举措标志着 Midjourney 摆脱了此前仅限于 Discord 平台使用的限制,为更广泛的用户群体提供了探索其 AI 图像生成功能的机会。

据 VentureBeat 报道,Midjourney 联合创始人兼首席执行官 David Holz 在 Discord 上透露了这一消息。这一变化被许多用户视为从「Discord 孤岛」中解放出来,因为过去 Discord 的注册要求限制了不少人尝试 Midjourney 服务
一个小站的自留地
Gemini API 现可调用多模态能力阅读 PDF Gemini API 和 AI Studio 现在支持通过文本和视觉识别理解 PDF。 如果 PDF 包含图形、图像,或其他可视内容,模型会使用内置的多模态功能来处理 PDF。 用户可以通过 Google AI Studio 或 Gemini API 体验这一功能。
Google AI Studio 和 Gemini API 提升 PDF 上传限制至 1000 页或 2GB

Google 近日对其 AI Studio 和 Gemini API 进行了更新,将 PDF 文件的上传限制从原先的 300 页大幅提升至 1000 页或 2GB

Google 利用 Gemini 的文本理解和多模态功能来处理这些文档,每页支持一张图片。此外,用户可以在上传后通过文件 ID 进行多次请求,文件在默认情况下会保留 48 小时
一个小站的自留地
微软发布 Phi-3.5 系列模型,性能超越同规模模型

微软近日推出了新一代人工智能模型系列 Phi-3.5,包括 Phi-3.5-MoE-instruct、Phi-3.5-mini-instruct 和 Phi-3.5-vision-instruct 三款模型。这一系列模型旨在满足从基础推理到复杂推理及多模态任务等多种 AI 应用需求。

- Phi-3.5 Mini Instruct 是一款轻量级 AI 解决方案,专为计算资源有限的场景设计。尽管参数量仅为 3.8 亿,该模型仍能处理代码生成、数学问题解决及逻辑推理等复杂任务。它支持 128k 的词元上下文长度,能有效管理长时间交互,并在多语言和多轮对话任务中表现优异。

- Phi-3.5 MoE是微软首次尝试的专家混合(Mixture of Experts)模型,将多种模型类型结合为一。该模型总计拥有 420 亿个参数,在任何给定时间内激活 66 亿个参数,确保高效性能。Phi-3.5 MoE 在代码、数学及多语言理解等领域表现出色,在一些基准测试中超过了 GPT-4 等更大模型。

- Phi-3.5 Vision Instruct 专注于需要文本与图像处理能力的任务。这款模型在通用图像理解、光学字符识别、图表与表格理解以及视频摘要等领域表现突出。与其他两款模型相同,Vision Instruct 也支持 128k 的词元上下文长度,能够处理复杂的多帧视觉任务。

微软将所有三款 Phi-3.5 模型以 MIT 许可证形式开源发布,允许开发者自由使用、修改和分发这些模型。据报道,这些模型在多个基准测试中表现出色,超越了谷歌和 Meta 的同类模型,为用户提供了更强的推理和多模态任务支持。

据 Reddit 用户讨论,Phi-3.5 是目前最「安全」的模型之一,在安全性和有效性方面表现突出。微软声称,Phi-3.5 系列能够有效防止生成冒犯性内容。
Back to Top