【6月20日昆仑万维发布自主代码智能体基座模型Skywork - SWE】6月20日,昆仑万维发布软件工程自主代码智能体基座模型Skywork - SWE,在开源32B模型规模下实现业界最强仓库级代码修复能力。其团队构建超1万个可验证的GitHub仓库任务实例,打造最大规模可验证GitHub仓库级代码修复数据集,还验证了大模型在软件工程任务上的数据缩放定律。 Skywork - SWE - 32B模型在SWE - benchVerified基准上准确率达38.0%,刷新Qwen2.5 - Coder - 32B系列模型最佳成绩。引入测试时扩展技术后,准确率提升至47.0%,超越32B以下开源模型,缩小与闭源模型性能差距。 过去半年多,昆仑万维在多方向开源系列SOTA级别模型,此次在Agent方向再获进展。继5月天工超级智能体面向全球发布后,又发布并开源自主代码智能体模型Skywork - SWE - 32B,是开源策略重要实践,也是对Agent在多场景的重要探索。 昆仑万维研究表明,高质量且可执行验证的数据是提升代码智能体模型性能关键,系统化数据扩展策略推动开源模型性能突破。 昆仑万维称,期望Skywork - SWE - 32B开源助力社区研究演进。未来,该模型将拓展多编程语言支持,探索强化学习机制,为构建智能软件开发大语言模型奠基,还将探索更多Agent任务场景。