一个小站的自留地
Meta 将于 7 月 23 日发布 Llama 3-405B 模型 据 The Information 报道,Meta 计划于 2024 年 7 月 23 日发布其最大规模的 Llama 3 模型。这一版本拥有 4050 亿个参数,不仅能处理文本,还具备理解和生成图像的多模态能力。 (The Information) 此前(7 月 1 日)本频曾提到 Meta 正在 WhatsApp 上进行测试 Llama 3-405B 模型,并可能于近期向公众开放。 社区普遍认为,根据 Meta 此前提供的模…
据信是 Llama 3-405B 的模型以及基准测试成绩已经被泄露。

网友整理的模型下载地址:
https://x.com/kimmonismus/status/1815314833236984274

从泄露的基准测试成绩来看,Llama 3-405B 模型在大多数方面优于 GPT-4o,这一结果或侧面表面 GPT-4o 模型蒸馏后的模型参数小于这一量级。

据新智元报道,除了最大的405B,Meta这次还升级了5月初发布的8B和70B模型,并将上下文长度全部提升到了128K。
至此,模型版本也正式从Llama 3迭代到了Llama 3.1。
 
 
Back to Top