此前 Claude 和 DeepSeek 都相继在 API 上测试 8K 输出,而 GPT-4o-mini 则在 API 提供 16K 长度的输出。
Apple 于 7 月 30 日向开发者推送了 iOS 18.1、iPadOS 18.1 和 macOS Sequoia 15.1 的首个测试版,正式启动 Apple Intelligence 功能的首轮测试。
这些测试版仅面向支持 Apple Intelligence 的设备推送,包括非中国大陆和欧盟销售的 iPhone 15 Pro 和 iPhone 15 Pro Max, 以及搭载 M1 及更高版本芯片的 iPad 和 Mac 设备。目前开放的功能包括:全新 Siri 界面、通话录音、智能改写、邮件摘要和智能回复等。值得注意的是,ChatGPT 集成等部分功能尚未开放。
通话录音功能可在通话界面左上角点击录音按钮启用,系统会用 AI 语音提示「正在录音」。录音完成后将保存在「备忘录」应用中,并可生成摘要。
此次更新还新增了「减少打扰」专注模式,利用 Apple Intelligence 过滤不重要的通知。然而,由于中国大陆设备暂不支持 Apple Intelligence, 该功能也无法使用。
除通话录音外,Apple Intelligence 目前对中国大陆和欧盟销售的设备不可用,这是一种硬件级锁定,无论设备位于何处都无法启用。但香港、澳门和英国用户不受此限制。
开发者需要在设备的「设置」应用中加入 Apple Intelligence 候补名单,可能还需要将系统地区设置为美国。Apple 表示,正式版 Apple Intelligence 功能预计将于今年秋季推出,但初期仍将处于测试阶段。值得注意的是,Apple Intelligence 不会包含在今年 9 月发布的 iOS 18 正式版中,而是计划在之后的 iOS 18.1 更新中推出。
同时,Apple 发布了一份详细的 技术报告 ,首次披露了 Apple Intelligence 背后的基础模型架构和训练过程。
根据技术报告,Apple Intelligence 由两个主要模型组成:一个约 30 亿参数的设备端模型(AFM-on-device, Apple Foundation Models on device)和一个更大的服务器端模型(AFM-server)。这些模型采用了创新的架构设计,包括共享输入/输出嵌入矩阵、预归一化、查询/键归一化等技术,以提高模型效率和稳定性。
Apple 强调了其在负责任 AI 开发方面的努力。公司制定了全面的安全分类法,涵盖 12 个主要类别和 51 个子类别,用于评估潜在风险。在训练数据方面,Apple 严格筛选,不使用用户私人数据,并采取措施排除潜在有害内容。
为了提高模型性能和效率,Apple 采用了 LoRA (Low-Rank Adaptation) 适配器技术和创新的量化方法。这些技术使得 AFM-on-device 模型能够在保持高性能的同时,将参数压缩到平均每权重不到 4 位。
在人类评估中,AFM 模型在多项任务上表现出色。例如,AFM-on-device 在指令遵循能力上优于 Phi-3-mini、Gemma-7B 等模型,而 AFM-server 在功能调用基准测试中超越了 Gemini-1.5-Pro 和 GPT-4。
(MacRumors、9to5Mac、CNBeta、蓝点网)
有网友发现广受欢迎的开源 CDN 系统 GoEdge 可能遭遇供应链攻击。研究显示,从 v1.3.9 到 v1.4.1 版本的 GoEdge 中包含可疑 JavaScript 代码。本次被投毒的资源是https://cdn.jsdelivr[.]vip/jquery.min-3.7.0.js, 使用了与polyfill[.]io 事件相同的方能 CDN(也即 51.la 相关事件),因此该事件或与近期备受关注的 polyfill[.]io 供应链攻击案例存在关联。
据悉,GoEdge 原开发者于今年 4 月基本消失,5 月 20 日在 QQ 群发布最后一条消息。5 月 24 日,可疑代码首次出现在发布包中。7 月,该问题被公开披露。
对可疑代码进行分析后发现,该代码会检测用户环境、访问时间,并进行关键词匹配。符合条件时,代码会将用户重定向至域名为 wweeza[.]com 的博彩网站。
早前,GoEdge 的域名所有权已经发生变更。 goedge.cn 域名被转出,备案信息从刘**变更为莫**,并重定向至 goedge.cloud。销售渠道也从淘宝转为 Telegram。
对此,现 GoEdge 官方在 Telegram 群组中先是否认问题存在,随后又重新编译并发布了无恶意代码的 v1.4.1 版本。
7月26日,DeepSeek宣布其API进行重大更新,新增多项功能以增强模型能力:
1. 更新 /chat/completions 接口:
- 新增 JSON Output 功能,可强制模型输出 JSON 格式字符串,方便后续处理
- 增加 Function Calling 功能,支持调用外部工具,增强模型与现实世界交互能力
- 新增对话前缀续写功能(Beta),允许用户指定 assistant 消息前缀进行补全
- 将最长输出提升至 8K tokens(Beta)
2. 新增 /completions 接口:
- 增加 FIM 补全功能(Beta),支持用户提供自定义前缀/后缀进行内容补全
所有新功能均可用于 deepseek-chat 和 deepseek-coder 模型。Beta 功能需将 base_url 设为 https://api.deepseek.com/beta 开启。
DeepSeek 表示,这些更新旨在释放模型更多潜力,提升自动化能力和与现实世界的交互。Beta 功能开放给所有用户使用,相关模型版本稳定后将发布到开源社区。
用户可访问 DeepSeek API 官方文档(https://platform.deepseek.com/api-docs/zh-cn/)获取详细使用说明。
(深度求索 DeepSeek)
7月26日,智谱AI宣布推出新一代视频生成模型CogVideoX,并在其AI助手「智谱清言」的各平台上线名为「清影」(Ying)的视频生成功能。所有用户均可免费体验AI文本生成视频和图像生成视频的服务。
CogVideoX在内容连贯性、可控性和模态融合方面有显著创新:
- 采用自研的三维变分自编码器(3D VAE)结构,将视频压缩至原始大小的2%,显著提升内容连贯性。
- 开发端到端视频理解模型,增强对文本的理解和指令遵循能力。
- 创新性地设计将文本、时间、空间三维融合的transformer架构,优化模态间交互。
「清影」可在30秒内生成6秒视频,具备高效的指令遵循能力、良好的内容连贯性和灵活的画面调度能力。
在生态合作方面,B站参与了清影的技术研发过程,华策影视也参与了模型共建。清影的训练依托北京亦庄高性能算力集群,未来将应用于亦庄的高精尖产业集群。
用户可通过智谱清言的PC端、移动应用端、小程序端或访问https://chatglm.cn/video 使用该服务。企业和开发者也可通过智谱大模型开放平台bigmodel.cn的API调用该功能。
智谱AI CEO张鹏表示,公司已验证Scaling Law在视频生成领域的有效性,未来将继续扩大数据和模型规模,并探索更具突破性的新型模型架构。
(GLM大模型)
src:
https://mp.weixin.qq.com/s/Xua54oISZGB6lPCI3pWoTQ
OpenAI CEO Sam Altman 在社交平台 X 上宣布,OpenAI 将于下周正式向 Plus 用户推出 ChatGPT 高级语音模式的 Alpha 版本。
Mistral AI 发布 Mistral Large 2,123B 大小,128k 上下文,支持包括法语、德语、西班牙语、意大利语、葡萄牙语、阿拉伯语、印地语、俄语、中文、日语和韩语在内的数十种语言。
性能方面,官方宣称表现远超之前的 Mistral Large,与 GPT-4o、Claude 3 Opus 和 Llama 3.1 405B 相媲美。
开源地址: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
性能方面,官方宣称表现远超之前的 Mistral Large,与 GPT-4o、Claude 3 Opus 和 Llama 3.1 405B 相媲美。
开源地址: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407
Meta于7月23日发布Meta Llama 3.1 405B,并认为这是世界上最大、功能最强大的开源基础模型。顶级开源模型Llama 3.1 405B的上下文长度扩展到了 128K、支持八种语言,在常识、可操纵性、数学、工具使用和多语言翻译等方面可与 GPT-4、GPT-4o、Claude 3.5 Sonnet 等领先的闭源模型相媲美。
SuperCLUE选取了中文推理相关的核心任务进行了深入测评:
- 在完成SuperCLUE推理任务时,Llama 3.1 405B的整体得分为88.44,超过GPT-4 Turbo,仅次于GPT-4o,暂据排行榜第二。
- Llama 3.1 405B在SC-Math6数学基准上得分91.19分,判定为推理等级5,与GPT-4o相比仅有0.58分的差距,领先其他模型。
- Llama 3.1 405B在SC-Code3代码基准上得分69.68分,接近70分,较GPT-4 Turbo略高(0.11分),与GPT-4o有一定差距(2分)。
(SuperCLUE)
网友整理的模型下载地址:
https://x.com/kimmonismus/status/1815314833236984274
从泄露的基准测试成绩来看,Llama 3-405B 模型在大多数方面优于 GPT-4o,这一结果或侧面表面 GPT-4o 模型蒸馏后的模型参数小于这一量级。
据新智元报道,除了最大的405B,Meta这次还升级了5月初发布的8B和70B模型,并将上下文长度全部提升到了128K。
至此,模型版本也正式从Llama 3迭代到了Llama 3.1。
2024 年 7 月 19 日,CrowdStrike 发布的一次配置更新引发了全球性故障,导致大量 Windows 设备出现蓝屏。
故障源于 CrowdStrike Falcon 安全软件中的一个名为「通道文件」(Channel File)的配置组件。这些文件位于 Windows 系统的
C:\Windows\System32\drivers\CrowdStrike\
目录下,文件名以「C-00000291-」开头,以「.sys」结尾。在 7 月 19 日 04:09 UTC 发布的更新中,编号为 291 的通道文件包含了一个逻辑错误,导致运行 CrowdStrike Falcon 软件的 Windows 系统崩溃并出现蓝屏。CrowdStrike 表示,这次更新原本旨在针对新观察到的恶意命名管道(named pipes)提供保护,这些管道常被用于网络攻击中的命令与控制(C2)框架。然而,配置更新触发了逻辑错误,导致操作系统崩溃。公司强调,这个问题并非由网络攻击引起,而是一个软件缺陷。
受影响的系统主要是运行 CrowdStrike Falcon 7.11 及以上版本的 Windows 设备,且在 7 月 19 日 04:09 UTC 至 05:27 UTC 期间在线并下载了更新配置。CrowdStrike 在发现问题后迅速发布了修复,并在其支持门户和博客上提供了最新的修复建议和信息。
Microsoft 在其博客中补充说明,这个故障影响了约 850 万台 Windows 设备,占全球 Windows 设备总数的不到 1%。尽管比例较小,但由于 CrowdStrike 的客户多为运营关键服务的企业,故障造成了广泛的经济和社会影响。
为了加速修复进程,CrowdStrike 承诺进行彻底的根本原因分析,以确定逻辑错误的发生原因,并改进其流程以防止类似问题再次发生。公司首席执行官 George Kurtz 也在博客中向受影响的客户致歉,并强调将继续改进流程,以增强系统的稳定性和安全性。
(CrowdStrike 官方博客、Microsoft 博客、SC Magazine)
2024年7月19日,全球多地Windows用户遭遇大规模蓝屏故障,导致银行、航空、媒体等行业业务中断。事件始于日本时间13:30左右,随后迅速蔓延至澳大利亚、欧洲和美国。故障源于网络安全公司CrowdStrike的软件更新问题。受影响的Windows设备启动时会显示蓝屏,并进入恢复模式或重启循环。
澳大利亚国家广播公司、联邦银行、澳新银行、Qantas航空等多家企业系统受到影响。英国Sky News一度被迫中断直播。美国多家航空公司,包括Frontier、United、Delta和American Airlines被迫取消或延误航班。德国两家医院取消了非紧急手术,以色列有15家大型医院受到影响。阿拉斯加州的多个911紧急呼叫中心也遭受冲击。
CrowdStrike于当日确认问题与"内容部署"有关,并提供了临时解决方案。澳大利亚国家网络安全协调员Michelle McGuinness称,这是第三方软件平台的技术问题,非网络安全事件。澳大利亚政府召开紧急会议应对此次事件,总理安东尼·阿尔巴尼斯表示政府正与国家网络安全协调机关密切合作。
目前,IT专家建议通过安全模式启动并删除
C:\Windows\System32\drivers\CrowdStrike
目录中的"C-00000291*.sys
"文件作为临时解决方案。CrowdStrike首席执行官George Kurtz在接受NBC采访时承认,"有些系统可能需要一段时间才能自动恢复"。据报道,全球超过1000班航班被取消,某些公司有高达70%的笔记本电脑无法启动。此次事件还影响了克罗地亚的中央健康信息系统和空管系统,以及马来西亚的重要部门,包括电视台、机场和银行。英国杂货店Waitrose短暂停止了非接触式支付。
(综合The Guardian、Windows Latest、BBC News、CNBC、NBC News报道)
——————
Microsoft 365全球服务中断
2024年7月18日21:56(UTC),微软Azure云服务在美国中部地区开始出现故障,随后于7月19日05:56(中国时间)扩展至Microsoft 365应用程序和服务,导致全球范围内的大规模服务中断,影响众多企业用户,其中航空业受创最为严重。
美国多家航空公司受到严重影响。Frontier Airlines一度暂停所有航班,美国联合航空、美国航空和达美航空发布全面停飞指令。欧洲大型航空公司Ryanair报告IT问题影响航班起飞。德国柏林机场、英国爱丁堡机场、荷兰史基浦机场等多个国际机场的登机系统也出现故障。在亚洲,日本春秋航空、韩国济州航空、菲律宾宿雅太平洋航空和亚洲航空均报告系统问题。
此外,伦敦证券交易所报告全球性技术问题,导致新闻无法发布。澳大利亚国民银行、澳新银行、联邦银行、本迪戈银行和新科银行的移动银行应用受到影响。零售业方面,澳大利亚Woolworths和Coles超市的自助结账和在线订单系统无法使用。英国杂货店Waitrose也短暂停止了非接触式支付。
微软表示正在调查原因并采取措施恢复服务。美国联邦航空管理局(FAA)发言人Jeannie Shiffer表示正在密切监控影响美国航空公司IT系统的技术问题。美国交通部长布蒂吉格称,正在监控航班取消和延误情况,要求航空公司履行对乘客的责任。
截至7月19日,微软表示其Azure云服务已恢复正常,但Microsoft 365服务仍有残余影响。
CrowdStrike拥有约24,000名客户,主要为大型企业,此次事件影响的个人电脑数量难以估计,显示了现代社会对云服务和技术平台的高度依赖。
(综合路透社、cnBeta、The Verge、IT之家报道)
据深度求索,美国时间 2024年7月16日,LMSYS 组织的大模型竞技场(Chatbot Arena)更新结果发布,DeepSeek-V2-0628 超越 Llama3-70B、Qwen2-72B、Nemotron-4-340B、Gemma2-27B 等开源模型,荣登全球开源模型榜首。(编注:分数位于 Claude 3 Opus 和 GPT-4-1106-Preview 之间)
在Chatbot Arena 的国内参与者中,DeepSeek-V2-0628 同样名列前茅,排名国内所有模型第二位。(编注:国内第一是闭源的零一万物旗舰模型 yi-large) 与备受好评的 Qwen2-72B 开源模型相比,DeepSeek-V2-0628展现了更强的竞争力,排名高出 10 名。
据官方介绍, DeepSeek-V2-0628 相较于 0507 开源 Chat 版本,在代码数学推理、指令跟随、角色扮演、JSON Output 等方面能力全面提升。
DeepSeek-V2-0628 模型开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat-0628
近日,LMSYS Chatbot Arena 大模型竞技场上相继出现多个神秘模型,引发 AI 社区广泛关注和讨论。这些模型目前仅在竞技场的「对战」环节随机出现,包括「upcoming-gpt-mini」、「column-u」、「column-r」、「eureka-chatbot」、「gemini-test」和「im-a-little-birdie」。
据多位用户反馈,「upcoming-gpt-mini」模型自称为 ChatGPT,并表示其创建者为 OpenAI。而「column-u」和「column-r」则拒绝透露任何身份信息。有分析认为,「upcoming-gpt-mini」可能是一个轻量级模型,旨在替代 GPT-3.5 或作为一个设备端模型使用。也有观点认为,该模型是 OpenAI 的下一代开源大模型。(编注:OpenAI 上一次开源大语言模型是 2020 年的 GPT-3)
对于「column-u」和「column-r」,社区观点分歧较大。一些用户认为这两个模型可能来自 Anthropic,是 Claude 3.5 Haiku 和 Opus 的新版本。也有人推测它们可能是 Meta 即将发布的 Llama 3 系列模型,其中「column-r」可能是传闻已久的 405B 参数版本。
然而,更多的证据似乎指向这两个模型可能来自 Cohere 公司。有用户发现,「column-u」和「column-r」对某些越狱提示词(jailbreak prompts)的反应与 Cohere 的 Command 模型相似。此外,这两个模型的命名方式也与 Cohere 的风格相符。
值得注意的是,一位疑似内部人士在社交媒体上透露,「column-u」和「column-r」实际上是 DeepSeek 公司的新模型。但截至发稿时,这一说法尚未得到官方确认。
据用户反馈,「eureka-chatbot」模型的表现与 Llama 3 8b 相似,其输出格式类似于 Gemini 和 Gemma。有趣的是,谷歌员工 Logan Kilpatrick 在社交媒体上暗示有「eureka 时刻」,这一巧合进一步增强了该模型可能来自谷歌的推测。
「gemini-test」的名称则直接暗示了它可能是谷歌 Gemini 系列的测试版本。有报道称,该模型实际上包含两个不同的版本,可能是 Gemini 2.0 的 Flash 和 Pro 版本,或者 Pro 和 Ultra 版本。在竞技场中,该模型会随机分配给用户,这使得准确评估单个模型的性能变得困难。
而「im-a-little-birdie」这个有趣的名称则引发了多种猜测。一些用户认为它可能是 OpenAI 的新模型,因为该公司此前曾使用类似的命名方式。也有人推测它可能是谷歌的另一个测试模型,名称中的「birdie(意为“小鸟”)」暗指 Twitter(现为 X)的标志,又可能与社交媒体 AI 应用相关。
与此同时,关于谷歌可能发布 Gemini 2 的消息也引起了广泛关注。近期,多个搜索引擎(除谷歌外)显示了一条描述:「Gemini 是一系列可以对文本、代码、图像、音频和视频进行推理的 AI 模型。了解 Gemini 1.0、1.5 和 2.0 的最新更新、基准和应用。」这一描述强烈暗示 Gemini 2.0 可能即将发布。
然而,谷歌 AI 团队的一位成员在社交媒体上表示,新的 Gemini 功能可能还需要几个月的时间。这似乎与搜索引擎显示的信息相矛盾。有网友指出,搜索引擎的 SEO 内容并不可信,此前 OpenAI 就出现过内部测试内容错误被搜索引擎抓取导致 GPT-4.5 被报道的乌龙。
以上内容仅为网友讨论摘要,本频无法对上述任何消息进行独立验证。
(综合自 Reddit、Twitter 相关讨论,因来源众多恕不一一标出,敬请读者自行甄别)
一名博主发文揭露Staticfile、BootCDN和Polyfill等多家知名CDN服务背后可能由同一批关联企业操控。该研究者通过梳理域名备案信息和企业关系,发现这些CDN域名的备案公司可以通过股东或实际控制人关联起来,其中包括运营51[.]La站点统计平台的郑州紫田网络科技有限公司,以及一家名为Funnull的公司。
7月17日,该研究者在技术社区V2EX上发帖称,自从发布相关调查结果后,收到了据称来自相关公司的威胁邮件,要求删除文章。邮件声称「已经联系公安网监部门」。巧合的是,V2EX论坛当天出现无法访问的情况,引发猜测可能与CDN投毒事件曝光有关。
Staticfile是由七牛云原创的开源项目,提供免费CDN加速服务;BootCDN是Bootstrap中文网支持并维护的开源项目,提供前端开源库的CDN服务;Polyfill.io可根据浏览器User-Agent自动生成最小化的polyfill;51[.]La是国内知名的网站统计服务平台。Funnull即为博彩网站提供国内优化CDN服务的方能CDN。
本次事件导致V2EX 被攻击而宕机近 3 小时。据传,发布该文的博主个人博客和V2EX 的源站都收到了相当严重的 DDoS 攻击。
Src: https://t.me/c/1546153250/55215
阿里云Qwen团队近日官宣了最新的大规模音频语言模型Qwen2-Audio。该模型在音频理解和交互能力方面取得显著进展,为语音助手、音频内容分析等应用领域开辟了新的可能性。
Qwen2-Audio的主要特点和创新如下:
1. 双模式交互:支持语音聊天和音频分析两种模式。在语音聊天模式下,用户可以直接与模型进行语音对话;在音频分析模式下,用户可以上传音频文件进行转录和分析。模型能够智能识别用户意图,在两种模式间无缝切换,无需用户手动操作。
2. 多样化音频处理能力:
- 语音识别与翻译
- 情感识别:能够识别语音中的愤怒、快乐、悲伤等情绪
- 声音分类
- 音乐分析:可分析音乐的节奏、节拍、类型和流派等特征
3. 复杂场景理解:在包含背景声音、多人对话和语音指令的复杂音频中,模型能准确理解指令并做出恰当响应。
4. 创新的训练方法:
- 预训练阶段使用自然语言提示替代复杂的层次标签,简化流程并扩大数据量
- 采用三阶段训练:预训练、有监督微调和直接偏好优化(DPO)
5. 先进的模型架构:融合了基于Whisper-large-v3的音频编码器和基于Qwen-7B的语言模型,总参数量达8.2B。
在性能评估方面,研究团队在13个数据集上对Qwen2-Audio进行了全面测试,涵盖自动语音识别(ASR)、语音翻译(S2TT)、语音情感识别(SER)和声音分类(VSC)等任务。结果显示,Qwen2-Audio在多项任务上达到了业界领先水平,特别是在AIR-Bench指令跟随能力测试中超越了包括Gemini-1.5-pro在内的其他模型。
值得注意的是,Qwen2-Audio无需针对特定任务进行微调,即可在多种音频理解任务中表现出色。这种通用性使其在实际应用中具有巨大潜力。
阿里云称 Qwen2-Audio 即将开源发布。
(Github 仓库) (技术报告)