一个小站的自留地
DeepSeek-V2.5 领跑国内大模型:刷新多项国产记录 DeepSeek-AI 团队于 9 月初发布并开源了全新模型 DeepSeek-V2.5,近日在 LMSYS 组织的全球大模型竞技场(ChatBotArena)中表现出色,刷新了国产模型的多项历史纪录。 在最新公布的 ChatBotArena 排名中,DeepSeek-V2.5 位列国内大模型第一,成功超越 Yi-Large-Preview、Qwen-Plus-0828 和 GLM-4-0520 等国内最强闭源模型,并在 8 个单项能力上均领跑国内模型。这一成绩标志着…
DeepSeek-R1-Lite 预览版上线

DeepSeek 发布了R1系列推理模型,使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。

该系列模型在数学、代码以及各种复杂逻辑推理任务上,取得了媲美 o1-preview 的推理效果,并为用户展现了 o1 没有公开的完整思考过程。

该模型目前可以仅在网页版使用,DeepSeek 方面表示,之后,正式版 DeepSeek-R1 模型将完全开源,DeepSeek 也将公开技术报告,并部署 API 服务

DeepSeek
 
 
Back to Top