据百灵大模型消息,蚂蚁集团今日发布并开源首个混合线性架构的万亿参数思考模型Ring-2.5-1T。相比此前发布的Ring-1T,Ring-2.5-1T在生成效率、思考深度、长程执行上均有大幅提升。在超过32K生成长度下,访存规模降低10倍以上,生成吞吐提升3倍以上,尤其适合深度思考和长程执行的任务。
(本文来自第一财经)
上一篇:轮到中国卡脖子了?印媒:中国若停止出口芯片,买的S400就是废铁
下一篇:“最AI”的春节再令世界惊艳