Anthropic 发布新一代 AI 大模型系列 —— Claude 3
据机器之心,该系列包含三个模型,按能力由弱到强排列分别是 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。其中,能力最强的 Opus 在多项基准测试中得分都超过了 GPT-4 和 Gemini 1.0 Ultra,在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准。
Claude 首次带来了对多模态能力的支持(Opus 版本的 MMMU 得分为 59.4%,超过 GPT-4V,与 Gemini 1.0 Ultra 持平),且三者全部是多模态模型。用户现在可以上传照片、图表、文档和其他类型的非结构化数据,让 AI 进行分析和解答。且 Claude 3 对文本的 OCR 能力较 GPT-4 相比更为强大,可以准确识别日语等亚洲系语种。
Anthropic 表示,Claude 3 Opus 拥有人类本科生水平的知识,且在长上下文测试中具有「近乎完美的召回能力」。
据 DataLearner,Claude3-Opus模型的结果「令人满意」,但模型幻觉比较严重。
虽然目前 Claude 3 系列模型不支持联网,但据 APPSO,Anthropic 即将在 Claude 3 模型中启用引用功能,使其能够引用参考材料中的具体句子,以此来验证其答案的正确性。
价格方面,Claude 3 Opus 定价较 gpt-4-turbo-preview 高近一倍,而 Claude 3 Sonnet 的输入价格也比 gpt-3.5-turbo-0125 贵,Claude3-Haiku的价格则是gpt-3.5-tubo的1/6。
据Founder Park,Opus 和 Sonnet 现在已经可以在 Claude.ai 官网和现在 159 个国家的 Claude API 中使用。Haiku 很快也将上线。
Sonnet 也已在 Amazon Bedrock 上线,同时在 Google Cloud 的 Vertex AI Model Garden 中开始私密预览(private preview)——不久的将来,Opus 和 Haiku 也将在这两个平台上推出。
——————
——————
根据网友的初步测试,Claude 3 Opus 和 GPT-4 的实力不相上下,这点是毋庸置疑的。
目前为止,ChatGPT 方面仍有 Voice、Code Interpreter、DALL·E、GPTs 等功能和生态作为护城河,但随着竞争对手的模型基础能力不断追赶,相信优势只会越来越小。
据机器之心,该系列包含三个模型,按能力由弱到强排列分别是 Claude 3 Haiku、Claude 3 Sonnet 和 Claude 3 Opus。其中,能力最强的 Opus 在多项基准测试中得分都超过了 GPT-4 和 Gemini 1.0 Ultra,在数学、编程、多语言理解、视觉等多个维度树立了新的行业基准。
Claude 首次带来了对多模态能力的支持(Opus 版本的 MMMU 得分为 59.4%,超过 GPT-4V,与 Gemini 1.0 Ultra 持平),且三者全部是多模态模型。用户现在可以上传照片、图表、文档和其他类型的非结构化数据,让 AI 进行分析和解答。且 Claude 3 对文本的 OCR 能力较 GPT-4 相比更为强大,可以准确识别日语等亚洲系语种。
Anthropic 表示,Claude 3 Opus 拥有人类本科生水平的知识,且在长上下文测试中具有「近乎完美的召回能力」。
据 DataLearner,Claude3-Opus模型的结果「令人满意」,但模型幻觉比较严重。
虽然目前 Claude 3 系列模型不支持联网,但据 APPSO,Anthropic 即将在 Claude 3 模型中启用引用功能,使其能够引用参考材料中的具体句子,以此来验证其答案的正确性。
价格方面,Claude 3 Opus 定价较 gpt-4-turbo-preview 高近一倍,而 Claude 3 Sonnet 的输入价格也比 gpt-3.5-turbo-0125 贵,Claude3-Haiku的价格则是gpt-3.5-tubo的1/6。
据Founder Park,Opus 和 Sonnet 现在已经可以在 Claude.ai 官网和现在 159 个国家的 Claude API 中使用。Haiku 很快也将上线。
Sonnet 也已在 Amazon Bedrock 上线,同时在 Google Cloud 的 Vertex AI Model Garden 中开始私密预览(private preview)——不久的将来,Opus 和 Haiku 也将在这两个平台上推出。
——————
可信度:A
——————
根据网友的初步测试,Claude 3 Opus 和 GPT-4 的实力不相上下,这点是毋庸置疑的。
目前为止,ChatGPT 方面仍有 Voice、Code Interpreter、DALL·E、GPTs 等功能和生态作为护城河,但随着竞争对手的模型基础能力不断追赶,相信优势只会越来越小。