一个小站的自留地 谷歌发布新一代开源大语言模型 Gemma 2 谷歌 DeepMind 团队于 6 月 27 日正式发布了新一代开源大语言模型 Gemma 2。这个轻量级但性能强大的模型系列提供了 90 亿(9B)和 270 亿(27B)参数两个版本,每个版本都有基础(预训练)和指令微调两种变体。 Gemma 2 的主要特点包括: - 卓越性能:27B 版本在同类模型中表现最佳,甚至可与规模大两倍的模型媲美。9B 版本也优于同规模的其他开源模型,如 Llama 3 8B。 - 高效架构:采用交替使用局部滑动窗口和全局注意力的创新设计…