SWE-agent：利用大语言模型修复GitHub仓库问题

admin

145350
文章

119
评论

2025年4月23日21:03:32评论17 views字数 711阅读2分22秒阅读模式

SWE-agent：利用大语言模型修复GitHub仓库问题

这款名为SWE-agent的开源工具通过将GPT-4o和Claude Sonnet 3.5等强大语言模型与现实世界工具连接，使其能够自主执行复杂任务：从修复GitHub实时仓库中的错误、解决网络安全挑战，到浏览网页或执行自定义工作流。

SWE-agent：利用大语言模型修复GitHub仓库问题

普林斯顿大学研究软件工程师、SWE-agent联合开发者Kilian Lieret向Help Net Security表示："SWE-agent是首个在SWE-bench基准测试中展现出显著成效的开源代理工具，也是首个在解决GitHub问题方面表现出良好效果的软件工程代理工具。其独特之处在于追求简洁性。代理流程几乎完全不受约束：在初始提示后，语言模型可以发出任何操作指令，直到最终调用'submit'命令或达到成本限制。这使得代理工具能够非常容易地进行适配。"

网络安全专用模式EnIGMA

SWE-agent包含名为EnIGMA的专用模式，专为解决攻防型网络安全任务（如夺旗挑战赛）而设计。在多项基准测试中，EnIGMA的表现均位居前列。

目前EnIGMA的许多功能已整合至完整版SWE-agent工具中，包括调试器、远程服务器连接工具，以及帮助AI处理冗长或混乱输出的摘要生成器。这些工具使语言模型能够更轻松地自主解决复杂问题。

未来发展计划

Lieret表示："我们希望延续当前的发展方向：打造一个简单、可配置且可修改的代理工具，使研究人员（及其他任何用户）能够将其适配到任何任务中，特别是那些需要沙盒执行环境的任务（这也是工程挑战之一）。"

目前SWE-agent已在GitHub上免费提供。

原文始发于微信公众号（FreeBuf）：SWE-agent：利用大语言模型修复GitHub仓库问题

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

SWE-agent：利用大语言模型修复GitHub仓库问题

工具分享 | BP插件 SMS Bomb Fuzzer更新 V3.1

一款轻量级Java源代码审计工具

工具 | cloudsword

【工具分享】IP域名反查工具-v3.0

Web压力测试工具 Ab上手指南

Kubernetes 安全攻防演练平台

工具集：CTF-OS【CTF专用系统】

VulnCrawler v2.0- 漏洞情报拉取工具一键抓取最新漏洞|漏洞探测

网络安全信息收集与分析工具 Gathery（6月22日更新）

工具推荐 | ARL添加指纹:ARL-Finger-ADD-Go

发表评论

在线咨询

微信