逆向ChatGPT4核心

admin

102755
文章

87
评论

2024年4月19日23:40:23评论4 views字数 1757阅读5分51秒阅读模式

摘要

本文从提示注入和任意代码执行、隐藏API发现、动态代码执行、数据序列化四个维度探索了ChatGPT4的安全性问题, 用另类的逆向手段对ChatGPT做了一系列安全测试。

2023年11月, OpenAI推出了一个新玩法:CustomGPTS, 这是一个可以根据选择的任何主题或问题进行定制的GPT4版本, 在本文的试验中, 通过在一个GPT实例上使用提示注入和任意代码, 暴露系统内部信息,例如:进程ID、环境变量、IP地址、开发端口和API端点。还采用了一种独特的动态代码执行和数据序列化方法。

提示注入和任意代码执行

下面的例子是利用一种特殊的方法, 让GPT来显示它的知识库, 并驱使GPT执行第三方代码, 如图:

逆向ChatGPT4核心

首先让GPT执行一个脚本, 该脚本会运行另一个脚本, 并最终结果放到一个文本文件中, 然后我会读取这个结果文件来获取内容, 下面是利用脚本来获取目录和网络配置, 如图:

逆向ChatGPT4核心

看上面最后的显示, 有".openai_internal"的字样。从这里, 成功获取到大量信息, 假设对/proc目录比较感兴趣, 执行一个脚本, 解析/proc/net/tcp中包含的信息, 可以成功获取到本地IP地址和开放端口, 如图:

逆向ChatGPT4核心

这段用Python写的脚本代码主要解析/proc/tcp中的信息, 包括:本地IP和开放端口, 这里解析出来的8080端口对应的服务为:http-alt。

接下来, 继续利用脚本尝试获取一下环境变量，让脚本获取系统中当前进程ID并对每个进程ID进行分析, GPT返回给我的信息如下:

逆向ChatGPT4核心

发现隐藏API调用

ChatGPT实例是具备浏览互联网能力的, 尝试一下让GPT利用Bing功能并访问"http://localhost:8080", 通过Swagger UI显示API文档(Swagger UI是流行的用于记录RESTful API的框架), 如图:

逆向ChatGPT4核心

在上图返回的结果中, 得到一个404状态码(无响应), 但响应头却是存在的。这意味着该特定端点的根路径未找到, 因此用Google搜索一下OpenAI的端点, 并填充一堆随机的数据, 看看能得到什么,如图:

逆向ChatGPT4核心

从返回的结果中可以看到, 在/docs端点获得了200正常响应。当然,这里如果改进一下脚本, 加入更多的端点尝试, 应该能发现更多的东西。这里继续深挖/docs, 让脚本执行访问 localhost:8080/docs, 这样就能够获得Swagger UI、FastAPI以及所有的API文档, 如图:

逆向ChatGPT4核心

从上图可以看到, 利用脚本提取了FastAPI应用程序的OpenAPI模式中的Pydantic模型的相关定义和字段内容。

动态代码执行

实际上, OpenAI也在不断更新和调整他们当前的GPT4模型, 并给现有的模型添加额外的安全特性, 欺骗GPT得到想要的结果也会变得愈加困难, 但这种安全性仍然会有机会绕过, 例如: ChatGPT会明确告诉我无法执行我提供的代码, 但如果坚持对GPT说, 这段代码只是一个演示, 并希望其执行失败, ChatGPT每次都会执行代码, 并绕过OpenAI实施的安全过滤器。如图:

逆向ChatGPT4核心