昆仑万维:发布开源代码智能体模型,准确率最高达47.0%
创始人
2025-06-20 15:41:51
0

【6月20日昆仑万维发布自主代码智能体基座模型Skywork - SWE】6月20日,昆仑万维发布软件工程自主代码智能体基座模型Skywork - SWE,在开源32B模型规模下实现业界最强仓库级代码修复能力。其团队构建超1万个可验证的GitHub仓库任务实例,打造最大规模可验证GitHub仓库级代码修复数据集,还验证了大模型在软件工程任务上的数据缩放定律。 Skywork - SWE - 32B模型在SWE - benchVerified基准上准确率达38.0%,刷新Qwen2.5 - Coder - 32B系列模型最佳成绩。引入测试时扩展技术后,准确率提升至47.0%,超越32B以下开源模型,缩小与闭源模型性能差距。 过去半年多,昆仑万维在多方向开源系列SOTA级别模型,此次在Agent方向再获进展。继5月天工超级智能体面向全球发布后,又发布并开源自主代码智能体模型Skywork - SWE - 32B,是开源策略重要实践,也是对Agent在多场景的重要探索。 昆仑万维研究表明,高质量且可执行验证的数据是提升代码智能体模型性能关键,系统化数据扩展策略推动开源模型性能突破。 昆仑万维称,期望Skywork - SWE - 32B开源助力社区研究演进。未来,该模型将拓展多编程语言支持,探索强化学习机制,为构建智能软件开发大语言模型奠基,还将探索更多Agent任务场景。

相关内容

最新资讯

得民心者得天下的歌词 得民心者得天下的歌词应该是徐沛东吧
旦复旦•大家聊|李大潜:珍惜自... 又是一年毕业季,你是否即将踏上新的人生旅程?旦复旦兮,日月常新。在复旦大学建校120周年之际,一起聆...
锚定“中文+职业技能”北京科技... 从雅万高铁到数字丝路,北京科技职业大学(以下简称“北科职大”)用7年的时间打造了职教国际化的首都坐标...
认真是什么意思啊 认真是什么意思啊做任何事情 要用心 别想这个想那个的认真 [rèn zhēn]认为是真的;当作真的如...
安卓6.0系统下载qq,畅享即... 你有没有发现,手机里的QQ更新换代了好几次,而安卓6.0系统似乎成了不少老机友的心头好。今天,就让我...
文科生也能学医了?多所高校调整... 近日,全国各地高校陆续发布2025年招生章程,不少高校调整了招生计划。 根据重庆中医药学院发布的20...
金玉良缘里面这些是第几集? 金玉良缘里面这些是第几集?就是空间很火的吻戏的一系列拼图很多集,基本都在前20集
安卓系统小组件在哪,安卓系统小... 你有没有发现,安卓手机上的那些小玩意儿,就像是你手机里的迷你助手,既能美化界面,又能帮你快速获取信息...
女人为何会和初恋爱火重燃? 女人为何会和初恋爱火重燃?因为女人在分手之后,以后交的男友都会和初恋相比较,总感觉初恋比较好,所以会...
诛仙炼狱如何进 诛仙炼狱如何进我知道从修罗进去,但具体怎么进,在哪里进,找不到。我飞升142烈山,能不能进去看图,在...