Qwen1.5-110B模型是截止目前为止国内开源模型中参数规模最大的模型。Qwen1.5-110B模型与其它Qwen1.5系列模型架构一致。采用了分组查询注意力机制,因此推理效率很高。该模型最高支持32K上下文,并且支持多语言。
根据官方公布的评测结果,Qwen1.5-110B模型的评测结果略超过Llama-3-70B和Mixtral-8×22B,是除了Llama3-70B-Instruct模型外最强的开源模型。
国内此前开源领域最大的参数模型是720亿参数规模的Qwen1.5-72B规模和650亿参数的深圳元象科技开源的XVERSE-65B。
(DataLearner)
——————
可信度:A