DeepSeek(R1) vs Gpt-o3-mini(-high)

admin 2025年2月5日00:48:57评论101 views字数 2465阅读8分13秒阅读模式
昨儿看到 gpt 放出了 o3-mini 和 o3-mini-high 模型,用两年前问 gpt4 的漏洞 demo 丢给 dsr1 和 o3 测了下。
问题:下面是一个 web 程序,其中可能存在一些漏洞,找出所有的漏洞,和触发漏洞的路径,给出 poc
from flask import Flaskfrom flask import requestfrom jinja2.sandbox import SandboxedEnvironmentfrom jinja2 import Environmentfrom jinja2 import Templateimport uuidapp = Flask(__name__)classMyTemplate(Template):defxiaoc(self):        print("xiaoc called of MyTemplate")classMyEnvironment(Environment):defxiaoc(self):        print("xiaoc called of MyEnvironment")classMySandboxedEnvironment(SandboxedEnvironment):defxiaoc(self):        print("xiaoc called of SandboxedEnvironment")@app.route('/test1', methods=['GET'])deftest1():    tpl = request.args.get("tpl")    template = Template(tpl)return template.render()@app.route('/test11', methods=['GET'])deftest11():    tpl = request.args.get("tpl")returnTemplate(tpl).render()@app.route('/test2', methods=['GET'])deftest2():    tpl = request.args.get("tpl")    env = Environment()    template = env.from_string(tpl)return template.render()@app.route('/test21', methods=['GET'])deftest21():    tpl = request.args.get("tpl")    template = Environment().from_string(tpl)return template.render()@app.route('/test22', methods=['GET'])deftest22():    tpl = request.args.get("tpl")    env = Environment()return env.from_string(tpl).render()@app.route('/test23', methods=['GET'])deftest23():    tpl = request.args.get("tpl")returnEnvironment().from_string(tpl).render()@app.route('/test3', methods=['GET'])deftest3():    tpl = request.args.get("tpl")    env = SandboxedEnvironment()    template = env.from_string(tpl)return template.render()@app.route('/test4', methods=['GET'])deftest4():    tpl = request.args.get("tpl")    kwargs = {}    kwargs.update({"uuid": uuid})    env = SandboxedEnvironment()    template = env.from_string(tpl)return template.render(kwargs)@app.route('/test5', methods=['GET'])deftest5():    tpl = request.args.get("tpl")returnMyTemplate(tpl).render()@app.route('/test6', methods=['GET'])deftest6():    tpl = request.args.get("tpl")returnMyEnvironment().from_string(tpl).render()@app.route('/test7', methods=['GET'])deftest7():    tpl = request.args.get("tpl")    kwargs = {}    kwargs.update({"uuid": uuid})returnMySandboxedEnvironment().from_string(tpl).render(kwargs)if __name__ == '__main__':    app.run()
o3-mini-high 的表现
能根据是否用沙箱分类 1*、2*、5、6 和 3、4、7
DeepSeek(R1) vs Gpt-o3-mini(-high)
在沙箱场景中,能识别出 uuid 变量的关键作用,但是在怎么利用 uuid 这个点,依然会陷入混乱,甚至觉得 test3 也能 bypass
DeepSeek(R1) vs Gpt-o3-mini(-high)
DeepSeek(R1) 的表现
很惊艳,直接上截图。
准确分类,无沙箱场景表现正常
DeepSeek(R1) vs Gpt-o3-mini(-high)
精确识别 uuid 变量的作用,甚至给了有无回显两种方式
DeepSeek(R1) vs Gpt-o3-mini(-high)
最后的总结,排除了唯一无漏洞路由 test3
DeepSeek(R1) vs Gpt-o3-mini(-high)
结论
只从这个测试结果看,dsr1 秒了 gpt 当前公开的最强模型 o3-mini*。因此至少,dsr1 不弱于 gpt 当前的公开模型,可以停止给 gpt 续费了 xdm。

原文始发于微信公众号(MBHC):DeepSeek(R1) vs Gpt-o3-mini(-high)

免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2025年2月5日00:48:57
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   DeepSeek(R1) vs Gpt-o3-mini(-high)https://cn-sec.com/archives/3694881.html
                  免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉.

发表评论

匿名网友 填写信息