SWE-agent:利用大语言模型修复GitHub仓库问题

admin 2025年4月23日21:03:32评论0 views字数 711阅读2分22秒阅读模式

SWE-agent:利用大语言模型修复GitHub仓库问题

这款名为SWE-agent的开源工具通过将GPT-4o和Claude Sonnet 3.5等强大语言模型与现实世界工具连接,使其能够自主执行复杂任务:从修复GitHub实时仓库中的错误、解决网络安全挑战,到浏览网页或执行自定义工作流。

SWE-agent:利用大语言模型修复GitHub仓库问题

普林斯顿大学研究软件工程师、SWE-agent联合开发者Kilian Lieret向Help Net Security表示:"SWE-agent是首个在SWE-bench基准测试中展现出显著成效的开源代理工具,也是首个在解决GitHub问题方面表现出良好效果的软件工程代理工具。其独特之处在于追求简洁性。代理流程几乎完全不受约束:在初始提示后,语言模型可以发出任何操作指令,直到最终调用'submit'命令或达到成本限制。这使得代理工具能够非常容易地进行适配。"
01

网络安全专用模式EnIGMA

SWE-agent包含名为EnIGMA的专用模式,专为解决攻防型网络安全任务(如夺旗挑战赛)而设计。在多项基准测试中,EnIGMA的表现均位居前列。
目前EnIGMA的许多功能已整合至完整版SWE-agent工具中,包括调试器、远程服务器连接工具,以及帮助AI处理冗长或混乱输出的摘要生成器。这些工具使语言模型能够更轻松地自主解决复杂问题。
02

未来发展计划

Lieret表示:"我们希望延续当前的发展方向:打造一个简单、可配置且可修改的代理工具,使研究人员(及其他任何用户)能够将其适配到任何任务中,特别是那些需要沙盒执行环境的任务(这也是工程挑战之一)。"

目前SWE-agent已在GitHub上免费提供。

 

原文始发于微信公众号(FreeBuf):SWE-agent:利用大语言模型修复GitHub仓库问题

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年4月23日21:03:32
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   SWE-agent:利用大语言模型修复GitHub仓库问题http://cn-sec.com/archives/3991891.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息