一个小站的自留地

起于小站，终于生活。
现实之外，一个普通人的思考。

博客地址：ygxz.in
讨论组：https://t.me/+a5Clq4jLuJc4YWQ9

11:47 · 2024年7月17日 · 周三

一个小站的自留地

Meta 将于 7 月 23 日发布 Llama 3-405B 模型据 The Information 报道，Meta 计划于 2024 年 7 月 23 日发布其最大规模的 Llama 3 模型。这一版本拥有 4050 亿个参数，不仅能处理文本，还具备理解和生成图像的多模态能力。（The Information）此前（7 月 1 日）本频曾提到 Meta 正在 WhatsApp 上进行测试 Llama 3-405B 模型，并可能于近期向公众开放。社区普遍认为，根据 Meta 此前提供的模…

07:59 · 2024年7月17日 · 周三

一个小站的自留地

Anthropic 推出 Claude Projects 功能 Anthropic 刚刚宣布为其 AI 助手 Claude 推出 Projects（项目）功能，旨在提升用户的协作体验和工作效率。该功能现已面向所有 Claude Pro 和 Team 订阅用户开放。 Projects 功能的主要特点如下： 1. 协作空间：为团队成员提供一个共享精选对话和知识的平台。 2. 大容量上下文：每个项目拥有 200K 词元（Token）的上下文窗口。用户可以在其中存储文档、代码和其他数据，以改善 Claude…

Anthropic公司宣布Claude 3.5 Sonnet模型最大输出翻倍

Anthropic公司近日宣布,将旗下Claude 3.5 Sonnet大语言模型的最大输出token数从4096提高到8192。这一更新目前仅面向API用户开放,开发者需要在API调用中添加"anthropic-beta": "max-tokens-3-5-sonnet-2024-07-15"这一header才能启用新功能。

据Anthropic公司开发者关系负责人Alex Albert介绍,这一更新暂时还未在Claude.ai网页版中生效,但公司希望能尽快将其推广到网页版。多位开发者表示,这一更新将对代码生成等需要长文本输出的任务产生重大影响。

另外，Claude 正式上线 Android 客户端，首个版本面向 Android 14 进行开发。

17:03 · 2024年7月16日 · 周二

一个小站的自留地

创作者平台「爱发电」域名被锁定,疑似违规乱纪

2024年7月15日,知名内容创作者与粉丝互动平台「爱发电」(afdian.net)突然无法访问,引发用户广泛关注。

经查,爱发电的ICP备案(琼ICP备18001024号-1)已被注销,域名被注册商设置为暂停解析(clientHold)和禁止转移(clientTransferProhibited)。部分用户因DNS缓存仍可访问网站,但大多数用户已无法正常打开。

7月16日凌晨,爱发电官方在微博评论区回应称传闻为「假的」,但未提供进一步解释。同日,官方发布公告承认域名备案确实被注销,称「没有收到任何通知或公示」,并表示正在重新申请备案和准备临时站点。公告强调提现功能正常,用户资金安全。

值得注意的是,爱发电已启用早在2021年注册的备用域名ifdian.net继续运营。这一举动被一些观察者解读为平台「早有准备」。

据网友向新网客服询问，爱发电当前确实处于[clientHold]状态，具体原因为违规乱纪。

据新网客服，「根据海南省公安厅来函要求，网站 afdian.net存在违规行为。经我局调查，该域名在北京新网数码信息技术有限公司注册。根据《互联网信息服务管理办法》和《互联网站管理工作细则》的有关规定，现请北京市通信管理局配合对相关网站进行停止解析禁止转移。」

作为众多个人创作者的重要收入来源,爱发电的稳定运营关乎国内创作生态。本频长期使用爱发电作为打赏渠道，每月提现流程均十分顺利，因此本频猜测爱发电本次事件并非自身资金问题导致。

爱发电投资人之一 @何饭团发文称，「（爱发电）提现没有任何问题，现在的域名在正常提现中。之后的方案，也都能让大家正常提现，请不用担心；域名备案注销的具体原因确实不明，没有事先的通知或公示，注销后也没有任何人联系过我们。网上有一些推测、截图，还请大家不信谣不传谣」。

——————

类似事件此前也曾发生在另一家知名创作者平台面包多身上。2022年10月22日,面包多主域名mianbaoduo.com突然无法访问。官方随后发布声明称,其DNS被暂停解析,原因是网站存在有害内容。

面包多当时表示,他们接到有关部门电话,被告知网站存在有害内容需要删除。虽然面包多照做并提交了整改报告,但最终被告知主域名和子域名均无法解封。为保证服务继续运营,面包多启用了备用域名mbd.pub。

作为一个连接创作者与粉丝的付费平台,爱发电允许多样化的内容形式,包括文字、图片、音频和视频等。这种开放性虽然有利于创作者发挥,但也增加了内容管控的难度。可能有部分创作者在平台上发布了被认定为「有害」的内容,如擦边球内容、敏感话题讨论或未经授权的版权作品等。此前面包多被封禁时，曾经称自己面对的违法内容「鉴别难度是很高的，它不会被任何机器审核接口识别」，因此耗费了平台大量精力进行人工审核，「要求和敏感度需要进行极大的提高」。

面包多创始人事后发文称，「今后的面包多，会从一个敞开双臂欢迎所有创作者的「热」平台，变成一个更加谨慎，以安全和稳定为第一要务的「冷」平台，我们必须做这样的转变」。

15:59 · 2024年7月13日 · 周六

一个小站的自留地

Llama 3-405B 模型或即将将面向用户开放据知名 WhatsApp 功能追踪网站 WABetaInfo 报道,在 WhatsApp Android 测试版 2.24.14.7 中发现了一个新的设置选项,允许用户为内置的 Meta AI 聊天机器人选择不同的模型。用户可以在 Llama 3-70B 和 Llama 3-405B 两种模型之间进行选择。特别值得注意的是,界面中将 405B 模型描述为「更适合复杂提示」,但每周使用次数有限。这表明 Meta 可能正在通过 WhatsApp 平台对其最新、最强大的…

Meta 将于 7 月 23 日发布 Llama 3-405B 模型

据 The Information 报道，Meta 计划于 2024 年 7 月 23 日发布其最大规模的 Llama 3 模型。这一版本拥有 4050 亿个参数，不仅能处理文本，还具备理解和生成图像的多模态能力。

（The Information）

此前（7 月 1 日）本频曾提到 Meta 正在 WhatsApp 上进行测试 Llama 3-405B 模型，并可能于近期向公众开放。

社区普遍认为，根据 Meta 此前提供的模型基准测试，该模型如果确实拥有多模态能力，且拥有如此庞大的参数量，性能将有望位于 GPT-4-Turbo 和 GPT-4o 之间，成为「改变开源模型游戏规则」的存在。

——————

与此同时，有小道消息称，Google 计划在今年内公布Gemini 1.5 Ultra 模型，以应对Claude 3.5 Sonnet 的挑战。Gemini 更新日志页面代码显示，7 月 15 和 18 日将分别有一次更新。

至于 OpenAI, 据路透社报道，OpenAI 正在秘密开发一项代号为「Strawberry」的新 AI 技术，旨在显著提升 AI 模型的推理能力。

该项目被认为是去年引发关注的 Q* 项目的延续。「Strawberry」的目标是让 AI 不仅能生成答案，还能提前计划并自主可靠地浏览互联网进行「深度研究」。这一能力目前尚未被任何 AI 模型实现。

消息人士透露，「Strawberry」采用了一种特殊的「后训练」方法，在大规模预训练后对模型进行进一步优化。这种方法类似于斯坦福大学 2022 年开发的「自我教导推理者」(STaR) 技术。

OpenAI 希望通过「Strawberry」实现长时间任务处理，并计划测试其在软件和机器学习工程领域的应用能力。

对于「Strawberry」的相关问询，OpenAI 发言人表示:「我们希望 AI 模型能像人类一样理解世界。持续研究新的 AI 能力是行业常态，我们相信这些系统的推理能力会随时间改善。」

目前「Strawberry」的具体工作原理仍处于保密状态，其公开发布时间也未确定。但业内普遍认为，这一项目可能代表了 AI 推理能力的重要突破。

15:25 · 2024年7月13日 · 周六

一个小站的自留地

中国 IPv6 活跃用户数占比达 73% IPv6 是全球公认的下一代互联网发展方向，近年来取得了显著增长。截至 2024 年 5 月，全球 IPv6 支持率约为 39%。在此背景下，中国 IPv6 规模部署也取得了显著进展。截至 2024 年 4 月，中国 IPv6 地址拥有量为 67459 块/32，位居全球第二，占全球 IPv6 地址的 15.05%。截至 2024 年 4 月，中国 IPv6 活跃用户数达 7.878 亿，占网民总数的 73.01%，相比 2019 年的 24.35% 大幅提升。此外，中国移动网…

中国「网络去NAT」专项工作启动

7月7日，第三届中国IPv6创新发展大会在北京召开。为进一步推动IPv6发展，工业和信息化部办公厅、中央网信办秘书局近日联合印发通知，组织开展「网络去NAT」专项工作，通知提出，到2025年7月底前，试点区域基础电信企业NAT44设备总容量将停止增长，主要移动互联网应用（APP）固网侧IPv6流量占比不低于70%。

通知还制定了分阶段的发展目标：

近期目标（2024年底前）：
- 基础电信企业自有环境固定宽带用户IPv6连通率不低于80%。
- 新增互联网专线默认开通IPv6功能。
- 加快实施家庭网关IPv6地址前缀二次分发功能升级。

中期目标（2025年7月底前）：
- 实现试点区域基础电信企业NAT44设备总容量停止增长。
- 主要移动互联网应用（APP）固网侧IPv6流量占比不低于70%。

为实现这些目标，通知还要求：
- 基础电信企业制定详细的「网络去NAT」工作方案和时间表。
- 互联网企业深化应用服务IPv6升级改造，优化流量迁移策略。
- 内容分发网络（CDN）和云服务企业全面支持并默认启用IPv6。
- 各地方政府部门推动终端设备制造企业加快存量家庭无线路由器IPv6功能升级。

中央网信办副主任王崧在大会上指出，要坚持系统观念，体系化推进IPv6规模部署和应用；坚持创新驱动，加快建设IPv6技术产业生态；坚持示范引领，打造IPv6高质量发展样板；坚持安全发展，牢牢守住IPv6网络安全底线。

中国工程院院士邬贺铨指出，IPv6尚未真正打动互联网内容提供商（ICP），家庭用户对IPv6价值也缺乏认识。他强调，IPv6+的开发在路由建立和QoS服务方面已有良好进展，但IPv6的价值还未充分体现，推进IPv6+发展以赋能新质互联网势在必行。

（综合自中国教育网络、C114通信网、中国政府网）

18:19 · 2024年7月10日 · 周三

一个小站的自留地

消息称有山西联通IP地址段发起大规模下载刷量本频信源从腾讯云 Edgeone 用户群获悉,来自山西联通的221.204.0.0/15和221.205.0.0/15 IP地址段疑似正发起大规模无差别 CDN 刷量，攻击目标为多家国内 CDN厂商托管的众多网站。据报道,此次攻击主要针对使用国内 CDN服务的网站,包括腾讯云CDN、EdgeOne、多吉云、又拍云等多家CDN厂商的用户。攻击者疑似通过IP反查域名的方式进行无差别攻击,导致部分用户流量异常暴增。其中使用这类 CDN 的个人用户可能因此遭受难以承担的损失。…

近日,更多CDN用户报告遭遇来自山西联通IP的异常流量请求。除个人用户外，有企业用户报告被刷流量高达 300T。

经本频汇总,攻击主要来自以下 IP段:

221.204.0.0/15和221.205.0.0/15(整体范围)
221.205.168.0/23(主要活跃段)
211.90.146.0/24
60.221.231.0/24
122.195.22.0/24

下方补充列表由单一信源提供，可能有误伤：
112.229.8.0/24
39.71.180.0/24
119.188.69.0/24, 119.188.197.0/24, 119.188.60.0/24, 119.188.63.0/24
27.221.70.0/24
120.132.82.0/24
36.155.119.0/24, 36.155.88.0/24
112.48.189.0/24
140.249.121.0/24
119.118.60.0/24, 119.118.88.0/24, 119.118.197.0/24, 119.118.69.0/24, 119.118.63.0/24, 119.118.65.0/24
112.159.22.0/24

攻击呈现出明显规律,即通常在每晚20:00至23:00进行,部分用户报告19:45左右开始。主要针对体积较大的静态文件,如视频、安装包、大型图片等。单日攻击流量从数十GB到数百GB不等,部分站长报告单个IP(如221.205.169.183)持续定向攻击特定资源。值得注意的是,攻击者似乎不以瘫痪网站为目的,而是稳定持续地消耗流量。

请求特征:
- Referer头设置为请求文件的URL本身
- User-Agent随机或为空
- 即使文件删除或返回404,请求仍持续

V2EX上有站长发现，攻击前153.101.64.39(江苏联通)IP使用"Java/1.8.0_91" User-Agent爬取网站资源。

目前有效的应对措施包括但不限于封禁相关IP段；设置流量阈值和访问频率限制；通过边缘脚本进行请求限速；将静态资源迁移至海外CDN或采用P2P分发等。

CDN服务商多吉云近日发布了关于此事件的详细说明。根据其说明，异常流量早在2024年3月就已开始,影响范围包括阿里、腾讯、七牛等多家CDN服务商的用户。
攻击IP不仅来自山西联通,还包括江苏联通、安徽联通等地。

关于攻击动机,业内人士提出了与近期实施的省间结算政策相关的推测。这一政策要求运营商对跨省数据传输进行费用结算。有观点认为,这些异常流量可能是某些地方运营商为了平衡省间带宽差异或内部账单而进行的操作。另一种可能是PCDN(点对点内容分发网络)从业者为规避运营商对高上传流量的管控,通过刷取下载流量来平衡上传与下载比例。

16:28 · 2024年7月10日 · 周三

一个小站的自留地

根据 @非法加冯引述知情人士透露，本次故障是由于机房专线光纤被人为剪断所致。阿里云不得不进行临时性的网络切流。由于是单可用区故障，部分云数据库服务得以通过主备切换将流量转移到其他可用区。另一位疑似内部人士分享了更多细节：事发当天早上 9 点多，两处光缆被剪断，每处涉及两根主干光缆。被剪断的包括三根 96 芯光缆和一根 48 芯光缆，共影响四根光缆。经过紧急抢修，工作人员临时恢复了通往苏州方向的 96 芯业务。该内部人士补充，由于当天早晨相关部门刚刚实施「封网」措施，且被剪短光缆恰好是重要互联…

本频多个信源注意到，7 月 9 日中午开始，阿里云北京区域有服务出现不稳定现象。具体表现为云数据库（RDS）无法连接和控制台实例无法加载。

阿里云方面回应查询时称，北京时间 2024 年 07 月 09 日 13:33 ，阿里云监控发现北京地域多可用区网络互访出现丢包现象，阿里云工程师初步确认与网络设备异常有关，于 13:37 网络丢包现象开始恢复，13:45 网络丢包现象完全恢复。同日 13:33 ，阿里云监控发现杭州、上海、北京、深圳等地域云数据库控制台访问及 API 调用出现异常（不影响业务运行），经过处理异常已于当日 13:50 开始恢复。

本频暂时未见大客户受影响导致服务中断。

18:37 · 2024年7月9日 · 周二

一个小站的自留地

商汤「日日新5.0」中文基准测评出炉，总分80.03刷新最好成绩，文科能力领跑在SuperCLUE综合基准上，SenseChat V5表现不俗，以总分80.03分的优异成绩刷新国内最好成绩（通义千问2.5取得总分74.93分，GPT-4o得分为81.73），并且在中文综合成绩上超过GPT-4-Turbo-0125有0.9分。在本次测评中，理科任务上SenseChat V5取得国内最好成绩，较GPT-4-Turbo-0125低4.35分，还有一定提升空间；文科任务上SenseChat V5表现十分…

SuperCLUE团队发布「中文大模型基准测评2024上半年报告」

SuperCLUE团队刚刚发布了《中文大模型基准测评2024年上半年报告》，对33个国内外主流大语言模型在中文场景下的表现进行了全面评测。该报告涵盖了通用能力、多模态能力以及多个行业垂直领域的测评结果。主要亮点如下：

- 国内外大模型差距显著缩小。OpenAI的GPT-4o以81分领跑SuperCLUE基准测试，但国内顶尖模型如Qwen2-72B-Instruct、国外的Claude-3.5-Sonnet-200k等已将差距缩小至5%以内，均获得77分。报告显示，国内外模型的差距从2023年5月的30.12%逐步缩小到2024年3月的4.94%。

- 国内开源模型实力大增。阿里云开源的Qwen2-72B-Instruct模型登顶SuperCLUE榜单，超越多个国内外闭源模型。在开源模型中，Qwen2-72B、Yi-1.5-34B和qwen2-7b表现尤为出色。

- 各任务表现各有特色。报告通过雷达图展示了国际最优模型与国内最优模型在11个能力维度上的对比。在文科任务中，国内模型如Qwen2-72B达到76分，与GPT-4o并列第一。在理科任务中，GPT-4o领先优势更为明显。在Hard任务（如精确指令遵循）中，Claude-3.5表现突出。

- 端侧小模型表现惊艳。如qwen2-7b（70亿参数）的表现超过了上一代qwen1.5-32b（320亿参数），qwen2-1.5b（15亿参数）甚至超越了Llama-2-13B-Instruct（130亿参数）。这一趋势极大提升了大模型在端侧设备上的落地可能性。

- 行业垂直领域测评显示国内模型竞争力。报告针对金融、汽车、工业等多个垂直领域进行了专门测评。如在金融领域，Baichuan3、GLM-4和MoonShot-v1-128K均获得A级评价，仅次于GPT-4 Turbo的A+评级。在汽车行业测评中，多个国产模型表现不俗，显示出在特定领域的应用潜力。

- 多模态能力测评结果发布。在AIGVBench文生视频测评中，字节跳动的Dreamina即梦以72.99分位列榜首。在SuperCLUE-Image文生图测评中，百度文心一格和vivo的BlueLM-Art表现优异。（编注：此小项海外模型不参与排名）

- 模型能力矩阵分析。报告通过应用能力与基础能力矩阵，将模型分为四个象限：实用主义者、卓越领导者、潜力探索者和技术领跑者。其中，GPT-4o、Claude-3.5、Qwen2-72B等模型位于"卓越领导者"象限，显示出在基础能力和应用能力上的全面优势。

此外，报告还发布了「琅琊榜」匿名对战平台的最新结果。在该平台上，MiniMax的abab6.5-chat、智谱AI的GLM-4和零一万物的yi-large-preview等模型表现出色。报告还分析了这些模型的性价比，为用户选择提供了参考。（编注：此单项不包含开源模型和海外模型）

（SuperCLUE）

——————

以下是本频的一家之言：

「国内外模型的差距从2023年5月的30.12%逐步缩小到2024年3月的4.94%」这个数据，哪怕可能带有那么一点点水分，但至少趋势是有目共睹的。国内外在大模型方面的差距真的在肉眼可见地缩小。

这份榜单里的国产大模型之光，通义千问的开源模型Qwen2-72B绝对是当之无愧。作为已经发布了一段时间（首秀于 6 月 4 日，开源于 6 月 7 日）的开源模型，能够无限趋近Claude-3.5-Sonnet（发布于 6 月 21 日），真的是一件很值得称赞的事情。反观传统的以「人工智能」标榜自己的互联网大厂百度和科大讯飞，在大模型领域的话语权真的是越来越弱了。如果不是靠媒体通稿轰炸，想必世界上没有几家公司会选用他们两家的大模型。且不说别的，文心一言4.0，一个在官网上需要付费才能用的，自带「联网」功能的大模型，在知识百科领域居然比不过离线的GPT-4o（SuperCLUE 使用 API 进行测试），真不知道是百度的在线搜索太差了，还是这个大模型的基础能力实在拉跨。

多模态模型方面，国内的大厂们，特别是手握大量视频资源的大厂们，做出的成绩令人称奇。但可惜不管是字节还是快手，手握的长视频资源都不够多，我认为要做到所谓「Sora」宣传的效果还需要一段时间的努力。（当然，从种种迹象来看，Sora 目前还不能和行业龙头Runway Gen-3 拉开过多差距）

国外模型方面，GPT-4o 不出所料拿下几乎全部第一，唯一的弱点是「传统安全」，这一点何其唏嘘。奥特曼如果再继续带领 OpenAI 一味奔着搞钱而去，忽视模型的传统安全问题，我相信再有科学家出走也是迟早的事。在这一背景下，GPT-5 的发布我认为就更加急不得了。

前一段时间我们总说大模型的训练缺数据，但现如今看起来，各家似乎都找到了各自的解决方案。一个是互联网公开的数据集本就不少，难点应在与数据的清洗和选择；再一个是国内众多下场做大模型的厂商背靠大厂，自己手里没点语料是不可能的，毕竟那些隐私政策早就为现在的行为铺好了路。

国内大语言模型，咱先不说多模态，当前最需要追赶的细分项目我认为是「精确指令遵循」。都说当下 AI 产品的 Bug，随着基础模型的升级可能就慢慢消失了，这其中非常依赖模型指令遵循能力的提升。能够在长文本输出状态下精确遵循复杂指令，可比单纯的大海捞针难多了，但也有用得多。GPT-4o 用 API 调用时长文本能力是没问题的，问题就在于网页版给的上下文窗口是阉割后的结果，因此实际使用体验完全不如竞品，而使用 API 调用长文本对于个人来说无论是学习还是金钱成本都太高了。

13:33 · 2024年7月9日 · 周二

一个小站的自留地

公众号文章支持修改标题

据微信派，公众号文章标题将支持 3 个字以内的修改，包括删除和替换。修改成功后，文首将标记「标题已修改」。

已修改的标题只会在文章里、公众号主页、用户新收到的文章分享链接卡片上看到。已推送的订阅号信息流中的标题并不会发生变化。

00:21 · 2024年7月8日 · 周一

消息称有山西联通IP地址段发起大规模下载刷量

本频信源从腾讯云 Edgeone 用户群获悉,来自山西联通的221.204.0.0/15和221.205.0.0/15 IP地址段疑似正发起大规模无差别 CDN 刷量，攻击目标为多家国内 CDN厂商托管的众多网站。

据报道,此次攻击主要针对使用国内 CDN服务的网站,包括腾讯云CDN、EdgeOne、多吉云、又拍云等多家CDN厂商的用户。攻击者疑似通过IP反查域名的方式进行无差别攻击,导致部分用户流量异常暴增。其中使用这类 CDN 的个人用户可能因此遭受难以承担的损失。

目前已知的攻击 IP包括221.205.168.128、221.205.169.145等。

据蓝点网报道，近期注意到多个使用 CDN 的网站遭到恶意刷量，这些恶意刷量背后的人可能和 PCDN 相关的产业有关，即故意拉取和消耗某些网站托管的 CDN 文件来平衡自己的上传和下载。

PCDN 需要伪造数据不停地发起请求并下载就可以产生大量的下载流量，以此来平衡与上传的流量，避免被运营商判定为 PCDN。

本次恶意刷量的 IP 来源地集中为山西联通，网段包括 60.221.231.*、221.205.*.*、221.90.*.*，经过查询这些网段分布在山西省不同的地市，但运营商均为中国联通。

——————

本频此前表述为「DDoS 攻击」并不准确，在此向读者致歉。

10:59 · 2024年7月7日 · 周日

一个小站的自留地

Stability AI更新许可条款，放宽商业使用限制

Stability AI近日宣布更新其许可条款，推出新的社区许可证（Community License）。这一变化大幅放宽了其AI模型的使用限制，包括最新发布的SD3 Medium模型在内的多个模型现可免费用于研究、非商业及商业用途。

根据新的许可条款，只有年收入超过100万美元（或等值当地货币）且在商业产品或服务中使用Stability AI模型的企业才需要购买付费的企业许可证。这意味着绝大多数个人用户和小型企业都可以免费使用这些模型，无论是用于非商业还是商业目的。

新的社区许可证包含以下几个要点：

- 非商业用途完全免费，包括研究人员、开源开发者、学生、教师和爱好者等。

- 对于个人和小型企业的商业用途，只要年收入不超过100万美元，使用仍然免费。

- 取消了创建媒体文件数量的限制。

- 只有商业用户需要自行报告使用情况，年收入低于100万美元的用户无需向Stability AI支付费用。

此外，Stability AI还承认了SD3 Medium模型在发布后出现的一些问题，特别是在人体姿势和罕见词汇方面的表现不佳。公司表示正在积极改进模型，预计将在未来几周内发布质量大幅提升的新版本。

Stability AI表示，此次许可更新旨在重申公司对开源原则的承诺，同时平衡商业利益。新的许可条款既支持创作者自由，又保持对研究的开放态度，并致力于与用户保持透明和频繁的沟通。

（Stability AI）

19:19 · 2024年7月5日 · 周五

WAIC 2024 综合资讯汇总

2024 年 7 月 4 日至 7 日,世界人工智能大会(WAIC)暨人工智能全球治理高级别会议在上海世博中心和世博展览馆举行。本届大会以"以共商促共享以善治促善智"为主题,汇聚了全球 AI 领域的顶尖专家和企业。大会展览面积超过 5.2 万平方米,吸引了 500 多家企业参展,展示了 1500 多项创新产品。大会重点围绕核心技术、智能终端、应用赋能三大板块,聚焦大模型、算力、机器人、自动驾驶等领域。

1. 大会亮点

- 《人工智能全球治理上海宣言》在开幕式上正式发布。该宣言旨在推动全球 AI 治理体系的构建,呼吁各国加强交流和对话,共同应对 AI 发展带来的机遇与挑战。

- 上海人工智能实验室主任、清华大学教授周伯文在开幕式上提出"AI45 度平衡律"概念。他呼吁在 AI 发展中寻求性能与安全的平衡,强调目前 AI 安全投入仅占 1%,远远落后于性能投入。周伯文表示,未来需要在安全与性能之间找到平衡点,避免出现"跛脚 AI"。

- 图灵奖得主、中国科学院院士姚期智在大会上指出 AI 风险主要来源于三个方面:网络风险的放大、未预见的社会风险和生存风险。他强调,解决 AI 治理问题需要跨学科合作,呼吁计算机科学家、社会学家、哲学家等共同努力。

2. 企业新品与技术进展

- 阶跃星辰在大会上发布了 Step 系列大模型的升级版。其中,Step-2 是一个万亿参数的语言模型,采用 MoE 混合专家模型架构,性能接近 GPT-4。Step-1.5V 是一个多模态大模型,在图像感知和理解能力上全面提升。Step-1X 则是一个图像生成模型,具备更强的语义对齐和指令跟随能力。

- 商汤科技推出"日日新 5o"大模型,支持实时多模态交互,能力对标 GPT-4。该模型采用混合端云协同架构,可在同一模型中处理多种任务。同时,商汤还推出"大模型 0 元 Go"计划,为企业用户提供免费服务,以加速 AI 应用落地。

- 阿里云展示了通义千问系列的最新进展。通义千问开源模型下载量已突破 2000 万次,新版 Qwen2-72B 模型在多项基准测试中取得优异成绩。阿里云 CTO 周靖人表示,通义千问已实现全尺寸、全模态开源,拉平了开源和闭源模型的差距。此外,阿里巴巴还推出了"通义十二时辰"活动,展示 AI 在日常生活中的应用,包括 AI 创作绘本、AI 搜索等功能。

- 蚂蚁密算发布隐语 Cloud 大模型密算平台。该平台通过软硬件结合的可信隐私计算技术,在大模型托管和推理环节实现数据密态流转,保护模型资产、数据安全和用户隐私。平台支持 GPU 在可信执行环境下进行计算,使得大模型推理在密态形式下的响应时间和使用效率与明文大模型接近。

- 腾讯展示了混元大模型以及"腾讯元宝"和"腾讯元器"等 AI 应用产品,涵盖工作提效、生活娱乐等场景。腾讯副总裁蒋杰表示,混元大模型正在部署从多模态到全模态的技术。

- 百度 CEO 李彦宏在大会上透露,文心大模型的日均调用量已超过 5 亿次。这一数据比两个多月前公布的 2 亿次有了显著增长,反映出大模型应用的快速普及。

- 快手在大会期间宣布,其首部 AIGC 原创奇幻短剧《山海奇镜之劈波斩浪》即将上线。该剧由快手大模型团队提供深度技术支持,全程由 AI 生成,无真人演员参与。这一尝试展示了 AI 在视频内容创作领域的巨大潜力。

3. AI 芯片与算力

- 摩尔线程首次亮相 WAIC,展示了全栈 AI 产品和万卡集群解决方案。其 AI 旗舰产品夸娥(KUAE)智算集群解决方案已升级至万卡规模。摩尔线程创始人兼 CEO 张建中表示,万卡已成为智算中心的最低标配。

- 爱芯元智在大会上发布了"爱芯通元 AI 处理器"。这款处理器旨在为 AI 应用提供更高效的算力支持,但具体性能参数尚未公开。

- 燧原科技与人工智能系统软件商清程极智签署战略合作协议,双方将联合开发面向超万亿参数大模型和超大规模集群的高性能系统软件方案。这一合作旨在满足基础大模型的预训练、行业大模型的微调和大模型推理部署等不同的应用场景和多元的算力需求。

- 无问芯穹发布全球首个千卡规模异构芯片混训平台。该平台支持 30 多个主流模型和 10 余种计算卡,最高算力利用率达 97.6%。这一突破有望大幅提高大模型训练和推理的效率。

- 壁仞科技 AI 软件首席架构师丁云帆在大会论坛上表示,即使国产 AI 芯片单个算力不够强,也能通过综合手段提升集群算力。他认为,解决算力瓶颈问题需要从硬件集群算力、软件有效算力、异构聚合算力三个维度考虑。

4. 应用落地

- 特斯拉二代人形机器人 Optimus 在大会上亮相。相比第一代,新版 Optimus 在行走速度、手指灵活度等方面都有显著提升。特斯拉 CEO 埃隆·马斯克此前表示,计划从 2025 年开始在特斯拉工厂限量使用 Optimus。

- 国内首款搭载鸿蒙系统的全尺寸人形机器人"Kvavo"(夸父)亮相。该机器人由乐聚公司开发,搭载盘古具身智能大模型,具备全方位视觉感知和多地形行走能力。据介绍,Kvavo 已进入量产阶段,预估售价在 60-80 万元人民币。

- 上海市经信委、市公安局、市交通委联合发布首批无人驾驶装备识别标牌。这标志着无人驾驶装备正逐步走向规范化、规模化应用的新阶段。

- 上汽赛可智能获准在上海向公众提供主驾无人的自动驾驶出行服务(Robotaxi)。这是继广州、深圳之后,第三个开放 Robotaxi 商业化运营的一线城市。

- 学而思展示了基于九章大模型的数学搜索答疑工具"九章随时问"。该工具能够通过启发引导方式帮助学生解决数学难题,培养解题思维。目前"九章随时问"小程序可从微信进入使用,APP 端也已陆续开放下载。

- 网易展示了 AI 技术在游戏中的创新应用。例如,《逆水寒》手游中的"大宋头条"玩法利用 AIGC 技术,将玩家和 NPC 的行为转化为报纸头条,增强游戏沉浸感。网易灵动还展示了基于自研工业大模型的智能挖掘机和装载机器人,这些产品已在工程机械领域实现应用。

- 中信银行展示了信用卡中心的"中信碳账户"和"基于全域 AI 技术的智能风控"等项目,展现了 AI 在金融科技领域的应用成果。

5. 行业观点与趋势

- 百度 CEO 李彦宏强调 AI 应用的重要性,他表示:"没有应用,光有基础模型,不管是开源还是闭源都一文不值。"李彦宏认为,大模型对现有业态的改造作用比从 0 到 1 的颠覆作用更早到来。

- 蚂蚁集团董事长兼 CEO 井贤栋提出,专业智能体能够破解通用大模型在严谨产业应用的关键难题。他表示,蚂蚁集团正在携手产业合作伙伴构建专业智能体生态。

- 中国工程院院士高文强调,要严格控制人工智能的底层价值取向,实现技术的标准化。他指出,应对强人工智能,必须加强国际合作。

- 英伟达开发与技术部门亚太区总监李曦鹏表示,公司正在关注推理性能的提升,预计推理成本会很快再次降低。这一趋势将有利于 AI 应用的进一步普及。

- BV 百度风投执行董事温永腾在大会论坛上表示,不是要找超级应用,而是要找有用的应用。这一观点反映了 AI 产业正在从概念走向实用的趋势。

- 阶跃星辰 CEO 姜大昕认为,Scaling Law 在中短期内依然处于陡峭曲线,模型能力和参数量相关。他预测,多模态大模型将走向理解和生成的统一。

- 奇安信集团董事长齐向东预测,未来网络安全行业可能成为少数让机器人离不开人的专业之一。他建议学生考虑选择网络安全作为未来的职业方向。

- 汇付天下董事长兼 CEO 周晔预测,智能体将快速替代软件,实现"超级自动化"。他认为,未来的世界将是由一个个智能体连接而成的。

6. 产业合作

- 中国移动在大会期间启动了五个"100"人工智能生态计划。该计划包括开放百大 AI+场景、集结百大合作伙伴、设立百亿权益扶持、开放百大技术要素、打造百万级智能体等内容,旨在推动 AI 产业生态的发展。

- 中国移动与印尼金光集团成立人工智能联合实验室,推动中国 AI 技术走向世界。这一合作展示了中国 AI 企业积极开拓国际市场的趋势。

- 中科创达展示了车路云一体化解决方案,以及与英特尔合作开发的多模态大模型目标检索系统。这一系统可以通过自然语言和开放词汇描述,快速实现对行人、车辆以及各类交通事件的精准快速检索,为智能交通领域提供了新的解决方案。

（综合 APPSO、各厂商新闻稿及其他媒体报道）

11:18 · 2024年7月4日 · 周四

一个小站的自留地

polyfill.io 供应链攻击影响超 10 万网站,波及多个行业 polyfill.io 是一个广受欢迎的 JavaScript 库,用于提升旧版浏览器的兼容性。近期安全研究人员发现,该服务已被恶意利用来注入恶意代码,影响超过 10 万个网站,包括 JSTOR、Intuit 和世界经济论坛等知名机构。今年 2 月,polyfill.io 的域名和 GitHub 账号被一家名为 Funnull 的公司收购。此后,该服务开始在特定条件下向用户提供被植入恶意代码的脚本。攻击者通过 cdn.polyfill.io…

安全研究人员发现,除 polyfill.io 外,此次攻击还波及了 bootcdn.net、bootcss.com、staticfile.net 和 staticfile.org 等多个 CDN 服务。

针对这一大规模攻击,多方已采取应对措施:

- uBlock 的「Badware risks」过滤器已阻断了这些受影响站点的访问。
- 域名注册商 Namecheap 已关停 polyfill.io 和 polyfill.com 域名。
- Google 开始停止向使用 polyfill.io 的网站投放广告。
- Cloudflare 推出了自动替换服务,将 polyfill.io 链接替换为其安全镜像。该服务对免费计划用户默认启用,付费计划用户可手动开启。

值得注意的是,一位安全研究者在 GitHub 上发现了一个名为 data.polyfill.com 的公开仓库,其中意外泄露了 Cloudflare API 密钥。利用这些仍然有效的 API 密钥,研究人员发现同一个 Cloudflare 账户控制着所有涉事域名,这一发现将多个受影响的 CDN 服务与同一运营商联系起来。

安全专家警告,鉴于攻击者可能预先注册了多个域名,这种供应链攻击可能会演变成一场「打地鼠」式的持久战。他们建议开发者立即移除对这些受影响 CDN 的引用,并转向安全的替代方案。

Ref:
https://t.me/outvivid/4557

09:38 · 2024年7月3日 · 周三

一个小站的自留地

阿里云上海数据中心网络故障，B站等多家互联网平台服务受影响 2024 年 7 月 2 日上午，阿里云上海数据中心发生网络故障，导致多家依赖其服务的互联网平台出现不同程度的服务中断。北京时间 10 时 04 分左右，阿里云表示，监控系统首次发现上海地域可用区 N 出现网络访问异常，工程师已开始紧急处理。受此影响，知名视频网站哔哩哔哩遭遇大规模服务异常。用户反馈无法查看动态内容、发表或浏览评论、进行点赞操作，甚至收藏夹也显示为空白。故障发生后，B站官方微博尚未就此次事件发布任何说明或解释。与此同…

根据 @非法加冯引述知情人士透露，本次故障是由于机房专线光纤被人为剪断所致。阿里云不得不进行临时性的网络切流。由于是单可用区故障，部分云数据库服务得以通过主备切换将流量转移到其他可用区。

另一位疑似内部人士分享了更多细节：

事发当天早上 9 点多，两处光缆被剪断，每处涉及两根主干光缆。被剪断的包括三根 96 芯光缆和一根 48 芯光缆，共影响四根光缆。经过紧急抢修，工作人员临时恢复了通往苏州方向的 96 芯业务。

该内部人士补充，由于当天早晨相关部门刚刚实施「封网」措施，且被剪短光缆恰好是重要互联网平台业务光缆，因此认为此次事件既非黑客攻击，也非系统宕机，而是被「别有用心的通信行业人士」蓄意破坏。

据称，事发后，多家受影响公司的高管亲赴现场取证，并已将证据移交相关部门。据悉，警方已调取周边监控录像，并传唤多人协助调查。本频暂时未见警方通报，无法确认事件真实性。

#小道消息

小道消息

23:04 · 2024年7月2日 · 周二

IBM 中国与思杰马克丁签署 SPSS 产品独家转售协议

2024年7月1日,IBM 中国宣布将与苏州思杰马克丁软件有限公司(简称思杰马克丁)拓展合作。根据协议,思杰马克丁将全面独家负责 IBM SPSS 系列产品在中国大陆地区的转售模式发行业务。

IBM 大中华区董事长兼总经理陈旭东表示,此次合作旨在针对性满足国内客户需求,提供更灵活高效的支持。思杰马克丁董事长金勇表示,将与 IBM 合作推出新的渠道政策和奖励计划,共建正版软件生态系统。

SPSS 是业界领先的数据科学和统计分析软件。思杰马克丁成立于2009年,是一家专注正版软件发行和知识产权维护的高新技术企业。目前该公司代理多款知名软件,在中国市场影响力较大。

思杰马克丁在软件代理和售后服务方面曾引发争议。有用户和合作伙伴指出该公司存在篡改软件、垄断渠道等问题。此前已有部分软件厂商终止与其合作。

(IBM 中国)

11:26 · 2024年7月2日 · 周二

一个小站的自留地

纽约证券交易所技术故障导致多只股票停牌 2024 年 6 月 3 日，纽约证券交易所（NYSE）发生技术故障，导致包括伯克希尔哈撒韦（Berkshire Hathaway）在内的多只股票停牌。 NYSE 在当地时间上午 10:11 发布更新声明称，正在调查与涨跌幅限制（LULD）带相关的技术问题。据悉，伯克希尔哈撒韦的 A 类股票价格错误地显示为 185.10 美元，跌幅达 99.97%。此外，数只美股疑似出现行情异常，蒙特利尔银行、巴里克黄金等股票跌幅在 98% 以上，且行情静止不动。NYSE …

阿里云上海数据中心网络故障，B站等多家互联网平台服务受影响

2024 年 7 月 2 日上午，阿里云上海数据中心发生网络故障，导致多家依赖其服务的互联网平台出现不同程度的服务中断。

北京时间 10 时 04 分左右，阿里云表示，监控系统首次发现上海地域可用区 N 出现网络访问异常，工程师已开始紧急处理。

受此影响，知名视频网站哔哩哔哩遭遇大规模服务异常。用户反馈无法查看动态内容、发表或浏览评论、进行点赞操作，甚至收藏夹也显示为空白。

故障发生后，B站官方微博尚未就此次事件发布任何说明或解释。与此同时，有报道称小红书、酷安等其他互联网平台也出现了不同程度的服务问题，表明此次故障影响范围较广。

10 时 35 分，阿里云工程师完成网络切流调度，上海可用区 N 的网络访问开始恢复。
10 时 42 分，阿里云官方通报称受影响的产品服务已经恢复。

（阿里云、蓝点网）

17:13 · 2024年7月1日 · 周一

一个小站的自留地

OpenAI 推迟 ChatGPT 高级语音模式发布 OpenAI 官方在 Discord 群组通知了 ChatGPT 高级语音模式的最新进展。他们表示，「需要再多一个月的时间来达到发布标准」。该公司在今年春季更新中曾演示这一功能，原计划于 6 月底向部分 ChatGPT Plus 用户推出 alpha 版本。 OpenAI表示，延迟的主要原因包括提升模型检测和拒绝某些内容的能力、改进用户体验，以及为大规模用户使用做好基础设施准备，以保证实时响应。 OpenAI 计划采用灰度发布，即先向一小部分…

据蓝点网消息，名为「GPT-4o (S2S)」的新模型出现在 ChatGPT 的 Alpha Models 选项中。

但社区猜测，「S2S」可能代表「Speech to Speech」（语音到语音），意味着这可能是高级实时语音功能的免费版本，或是 GPT-4o 的滚动测试版本。

考虑到 OpenAI 此前宣布将在 7 月推出高级语音功能的 alpha 测试，GPT-4o (S2S) 的出现或许标志着该功能即将面向更广泛的用户群体开放。

（蓝点网、Reddit）

——————

本频信源验证了这一模型曾经推出过，但似乎 OpenAI 现在已经撤回了这一模型或缩小了测试范围。截至发稿，并无证据显示这一模型仍然存在。

据消息，OpenAI 最早在 6 月 26 日即向部分公众用户推出了 S2S 模型，该模型仅在桌面版/网页版 ChatGPT 中短暂出现，移动端用户无法访问。同一天，OpenAI 宣布推迟 ChatGPT 高级语音模式发布一个月至七月底。

6 月 26 日，在 OpenAI Discord，有用户报告称该模型「AI 的语音输出速度更快，听起来更接近人类。然而，该模型似乎无法执行图像生成等其他功能，知识库也比较旧，似乎不知道 2023 年 4 月以后的事情。」（编注：与 gpt-4-vision-preview模型的知识截止时间相同）

大约在 6 月 27 日前后，网络上再无相关模型的更新消息。

有网友猜测，这可能是内部邀请测试名单出现错误导致的意外。

14:46 · 2024年7月1日 · 周一

Llama 3-405B 模型或即将将面向用户开放

据知名 WhatsApp 功能追踪网站 WABetaInfo 报道,在 WhatsApp Android 测试版 2.24.14.7 中发现了一个新的设置选项,允许用户为内置的 Meta AI 聊天机器人选择不同的模型。用户可以在 Llama 3-70B 和 Llama 3-405B 两种模型之间进行选择。

特别值得注意的是,界面中将 405B 模型描述为「更适合复杂提示」,但每周使用次数有限。这表明 Meta 可能正在通过 WhatsApp 平台对其最新、最强大的 AI 模型进行有限度的公开测试。

Meta 曾在今年 4 月表示正在训练这个拥有约 4000 亿参数的大模型。如今在 WhatsApp 测试版中出现,可能意味着该模型已接近完成,并即将进入实际应用阶段。

有传言称这一模型将在未来几天在WhatsApp 上面向用户开放，但很遗憾，本频并未找到可以交叉印证该信息的信源。 据 The Information 7 月 12 日报道,Meta 计划于 2024 年 7 月 23 日发布其最大规模的 Llama 3 模型。

（WABetaInfo）

14:59 · 2024年6月30日 · 周日

一个小站的自留地

电影级视频生成模型 Dream Machine：号称「比 Sora 更真实流畅」 Luma 推出了名为 Dream Machine 的AI视频生成模型，号称比 OpenAI 的 Sora 更真实、更流畅。Dream Machine 可以通过文本、图片快速生成高质量视频，生成速度极快，每120秒可以生成120帧画面，动作逼真、连贯，角色一致性强，能够模拟物理世界。 Dream Machine 的核心优势在于其对物理世界中人类、动物和物体互动方式的深刻理解，使得其生成的视频内容角色表现一致且物理效果精确，…

据@数字生命卡兹克，Runway Gen-3 Alpha近日面向部分超级合作者开放。

@数字生命卡兹克认为，Gen-3 Alpha在模型质量上确实超越了Luma和可灵等竞品，特别是在审美方面。虽然与真实世界相比仍有差距，但已经是当前AI视频生成领域的佼佼者。

在写实风格测试中，人物特写和风景表现最为稳定，但涉及人物与物体交互时仍存在一些问题。动画风格整体表现较弱，显示出数据集的不足。科幻风格则是Gen-3 Alpha的强项，表现出色。玄幻风格虽不及科幻，但在西方题材上仍有不错发挥。抽象风格的表现令人惊艳，甚至可能对AE（After Effects）包装等领域产生冲击。

据媒体报道，2024年6月17日，人工智能创意工具公司Runway正式发布其新一代视频生成模型Gen-3 Alpha。作为Gen-3系列的首个模型，Gen-3 Alpha在视频质量、一致性和动态表现方面较前代产品有显著提升，被视为通向「通用世界模型」的重要一步。

Gen-3 Alpha基于新的大规模多模态训练基础设施开发，能够生成高度逼真的10秒视频片段。其主要特性包括：更精细的时间控制、更真实的人物角色表现，以及对多种艺术风格的理解。该模型支持文本到视频、图像到视频等多种生成模式，还提供运动笔刷、高级相机控制等工具，赋予创作者更大的控制权。

Runway还与多家娱乐媒体机构合作，为Gen-3开发定制版本，以满足特定的艺术和商业需求。公司同时推出了新的安全措施，包括视觉审核系统和C2PA（Content Authenticity Initiative，内容真实性倡议）溯源标准，以应对AI生成内容可能带来的风险。

（数字生命卡兹克）

Before

After