一个小站的自留地
百川智能发布Baichuan2-192K大模型,上下文窗口长度约 35 万个汉字 10 月 30 日,百川智能发布 Baichuan2-192K 大模型,目前已经正式开启内测。 据新闻稿,其上下文窗口长度高达 192K,文本长度相当于约 35 万个汉字,是目前全球最长的上下文窗口。 —————— src:Founder Park
阿里云发布通义千问 2.0

阿里云刚刚在 2023 年云栖大会上正式发布了通义千问 2.0 ,官方表示,「目前通义千问的综合性能已经超过 GPT-3.5,正加速追赶GPT-4」。

该模型目前已在阿里云上可用,无需等候。另外,通义千问 APP 现已经开放体验,新增语音对话功能。

阿里云 CTO 周靖人宣布将在 11 月开源通义千问 720 亿参数模型。周靖人表示,通义千问 72B 将成为参数规模最大的中国开源大模型,继续支持全球开发者开展模型和应用创新。此外,未来阿里云将持续发布更大规模的开源模型。

此前,昆仑万维宣布 开源 百亿级大语言模型「天工」Skywork-13B 系列,并配套开源了600GB、150B Tokens 开源中文数据集。

——————
src: https://mp.weixin.qq.com/s/TeDJIxdPni6SzHsEf9iGnw

——————
近期是国产大模型们爆发迭代的一段时间,不少厂商都宣布对标 OpenAI 或开源自己的模型。
让我们拭目以待。
 
 
Back to Top