Artificial Analysis发布全新基准:GLM-5.1取得全球开源SOTA
创始人
2026-05-13 11:44:02
0

5月12日,澎湃新闻记者获悉,全球权威评测机构Artificial Analysis发布全新Coding Agent基准Artificial Analysis Coding Agent Index,用于衡量Agent harnesses与模型的组合在SWE-Bench-Pro-Hard-AA、Terminal-Benchv2和SWE-Atlas-QnA主流基准上的表现。其中,闭源模型Opus4.7(在CursorCLI中运行)全球第一,GLM-5.1(在ClaudeCode运行)取得开源第一。从评测结果上来看,GLM-5.1代表了国产大模型在实际编程Agent场景下的SOTA级别能力。(澎湃新闻记者 范佳来)

相关内容

最新资讯

黄仁勋“中途登机”空军一号:A... 美国总统特朗普将于5月13日至15日对中国进行国事访问。这是中美两国元首继去年10月釜山之后再次面对...
高校通识课,迎来新一轮“扩张潮... 近年来,中国高校的通识课程体系正在迎来新一轮“扩张”。 2026年3月发布的《关于进一步加强高等学校...
柳岩被曝疑似怀孕!曾被拍到腹部... 搜狐娱乐讯 5月13日,知名博主“会拍摄的百晓生 ”透露柳岩疑似怀孕。称其在2025年1月时被拍到现...
市场监管总局:推动价格法等多部... 来源:证券时报e公司 人民财讯5月13日电,5月13日上午,市场监管总局召开“破除妨碍统一市场和公平...
原创 英... 随着美国总统特朗普在5月13日至15日访华,全球目光再度聚焦中美两国的互动。这一次的会晤不仅是两国元...
中国民航局低空安全司正式亮相,... 澎湃新闻记者从中国民航局官网获悉,中国民航局低空安全司已正式亮相,机构职责包括:起草低空民航发展规划...
世卫:加沙已有超4.3万人致残... 中新网5月13日电 据俄罗斯卫星通讯社12日援引世界卫生组织的消息,自2023年10月以来,加沙地带...
2025年广西专升本各院校录取... 2026年广西专升本考试成绩即将公布,预计5月中下旬出来。 成绩公布后,广西即将进入志愿填报阶段,很...
【外交部:世界上一切爱好和平的... 【外交部:世界上一切爱好和平的国家和日本人民都应共同遏制日本“新型军国主义”成势为患】据央视,外交部...
台护团代表控诉民进党:叫网民攻... 据凤凰卫视报道,台湾立法机构三读通过了医疗法修正案,将三班护病比正式入法。而卫福部门起初规划缓冲两年...