昆仑万维:发布开源代码智能体模型,准确率最高达47.0%
创始人
2025-06-20 15:41:51
0

【6月20日昆仑万维发布自主代码智能体基座模型Skywork - SWE】6月20日,昆仑万维发布软件工程自主代码智能体基座模型Skywork - SWE,在开源32B模型规模下实现业界最强仓库级代码修复能力。其团队构建超1万个可验证的GitHub仓库任务实例,打造最大规模可验证GitHub仓库级代码修复数据集,还验证了大模型在软件工程任务上的数据缩放定律。 Skywork - SWE - 32B模型在SWE - benchVerified基准上准确率达38.0%,刷新Qwen2.5 - Coder - 32B系列模型最佳成绩。引入测试时扩展技术后,准确率提升至47.0%,超越32B以下开源模型,缩小与闭源模型性能差距。 过去半年多,昆仑万维在多方向开源系列SOTA级别模型,此次在Agent方向再获进展。继5月天工超级智能体面向全球发布后,又发布并开源自主代码智能体模型Skywork - SWE - 32B,是开源策略重要实践,也是对Agent在多场景的重要探索。 昆仑万维研究表明,高质量且可执行验证的数据是提升代码智能体模型性能关键,系统化数据扩展策略推动开源模型性能突破。 昆仑万维称,期望Skywork - SWE - 32B开源助力社区研究演进。未来,该模型将拓展多编程语言支持,探索强化学习机制,为构建智能软件开发大语言模型奠基,还将探索更多Agent任务场景。

相关内容

最新资讯

台媒体人:不满赖清德已是岛内共... “赖清德最近的言行实在荒腔走板,蓝白两党联合弹劾他,一点都不让人意外。”正在参加两岸新媒体人云南行交...
西部十二省区市共同拓展“AI+... 人民网南宁12月19日电 (记者覃心)12月19日,“购在中国(广西站)暨广西丝路电商嘉年华”活动在...
可口可乐、麦当劳AI圣诞广告翻... 据虎嗅,随着圣诞季临近,可口可乐、麦当劳等国际品牌推出采用AI全程制作的圣诞广告,却引发广泛质疑与群...
原创 监... 01、严管恶性价格战 在汽车行业“反对内卷,回归理性”的呼声之下,监管部门终于出手了。 12月12...
政企携手惠民生 2025年湘西... 12月19日上午,以“乐享消费·惠购湘西”为主题的2025湘西冬季汽车促销活动在湘西职院文体会展中心...
原创 三... 当地时间12月15日,美国激光雷达圈的“明星公司”Luminar正式向法院申请破产保护了。可能有人不...
越拉越觉得长城魏建军是个干事的... 文/肥猪满圈 现在国产车口碑越来越好的,我认为只有一个,那就长城。 长城还不错,说白了那是验证过的...
从魏建军的质疑到理想的反驳:一... 一体压铸向来以低成本、高强度的优点被广大车企奉为至宝,但长城汽车董事长魏建军在欧拉5发布会上的一番直...
全新宝马iX1谍照曝光 202... 一组全新宝马iX1的谍照近日曝光,引发了汽车爱好者的广泛关注。这款新车采用了宝马最新的Neue Kl...
市场竞争的“终极战场”在于用户... 来源:滚动播报 (来源:上观新闻) 12月18日至19日, 以“夯实品质安全基座 助推产业向上发展...