一个小站的自留地
Llama 3-405B 模型或即将将面向用户开放 据知名 WhatsApp 功能追踪网站 WABetaInfo 报道,在 WhatsApp Android 测试版 2.24.14.7 中发现了一个新的设置选项,允许用户为内置的 Meta AI 聊天机器人选择不同的模型。用户可以在 Llama 3-70B 和 Llama 3-405B 两种模型之间进行选择。 特别值得注意的是,界面中将 405B 模型描述为「更适合复杂提示」,但每周使用次数有限。这表明 Meta 可能正在通过 WhatsApp 平台对其最新、最强大的…
Meta 将于 7 月 23 日发布 Llama 3-405B 模型

据 The Information 报道,Meta 计划于 2024 年 7 月 23 日发布其最大规模的 Llama 3 模型。这一版本拥有 4050 亿个参数,不仅能处理文本,还具备理解和生成图像的多模态能力。

The Information

此前(7 月 1 日)本频曾提到 Meta 正在 WhatsApp 上进行测试 Llama 3-405B 模型,并可能于近期向公众开放。

社区普遍认为,根据 Meta 此前提供的模型基准测试,该模型如果确实拥有多模态能力,且拥有如此庞大的参数量,性能将有望位于 GPT-4-Turbo 和 GPT-4o 之间,成为「改变开源模型游戏规则」的存在。

——————

与此同时,有小道消息称,Google 计划在今年内公布Gemini 1.5 Ultra 模型,以应对Claude 3.5 Sonnet 的挑战。Gemini 更新日志页面代码 显示,7 月 15 和 18 日将分别有一次更新。

至于 OpenAI, 据路透社报道,OpenAI 正在秘密开发一项代号为「Strawberry」的新 AI 技术,旨在显著提升 AI 模型的推理能力。

该项目被认为是去年引发关注的 Q* 项目的延续。「Strawberry」的目标是让 AI 不仅能生成答案,还能提前计划并自主可靠地浏览互联网进行「深度研究」。这一能力目前尚未被任何 AI 模型实现。

消息人士透露,「Strawberry」采用了一种特殊的「后训练」方法,在大规模预训练后对模型进行进一步优化。这种方法类似于斯坦福大学 2022 年开发的「自我教导推理者」(STaR) 技术。

OpenAI 希望通过「Strawberry」实现长时间任务处理,并计划测试其在软件和机器学习工程领域的应用能力。

对于「Strawberry」的相关问询,OpenAI 发言人表示:「我们希望 AI 模型能像人类一样理解世界。持续研究新的 AI 能力是行业常态,我们相信这些系统的推理能力会随时间改善。」

目前「Strawberry」的具体工作原理仍处于保密状态,其公开发布时间也未确定。但业内普遍认为,这一项目可能代表了 AI 推理能力的重要突破。
 
 
Back to Top