ChatGPT 自今年 4 月份开始就被发现存在数据泄露问题,攻击者可以在 提示注入攻击期间使用图像 Markdown 渲染,由于 OPENAI 没有进行必要的验证,因此攻击者可以获取用户会话的内容并将其发送到第三方服务器。
据安全研究人员 wunderwuzzi 发布的消息,目前 OPENAI 已经开始修复这类问题,但不是彻底修复,而是部署了缓解方案。
目前实施的缓解方案仅适用于 ChatGPT 网页版,当服务器返回带有超链接的图像标签时,ChatGPT 会在显示图像之前调用验证 API,调用的是个名为 url_safe 的端点,然后附加目标 URL 作为查询参数,实际会返回 false 结果,也就是不会渲染图像并向攻击者服务器发送任何数据。
不过这种缓解方案并不彻底,测试显示有时候仍然会渲染来自任意域的其他图像,而 ChatGPT 则会对图像进行网络查询,例如通过 Bing 搜索检查这张图片是否存在、检查是否具有跟踪功能或其他功能。
研究人员审查后发现还有办法能够继续用来发送数据,例如将文本分割成单个字符并且为每个字符都创建请求,这样也可以窃取数据只不过效率极低、速度非常慢。
当然既然 OPENAI 开始处理这个问题了,那么后面自然会部署更多措施,只不过彻底修复这个问题可能还需要更多时间。