用于训练多个人工智能模型的 Common Crawl https://commoncrawl.org/ 数据集中发现了近 12,000 个包含 API 密钥和密码的有效机密。Common Crawl非...
差分隐私防护技术的介绍与实践一
01序 言 这几年人工智能、大数据技术的快速发展创造了很多机会和应用,但也使得人们的隐私数据正在不断的被各种技术平台、厂商收集。这些平台、厂商为了追求商业利益或提升技术水平,总是会主动或被动的将用户的...
大模型隐私泄露攻击技巧分析与复现
前言大型语言模型,尤其是像ChatGPT这样的模型,尽管在自然语言处理领域展现了强大的能力,但也伴随着隐私泄露的潜在风险。在模型的训练过程中,可能会接触到大量的用户数据,其中包括敏感的个人信息,进而带...
震惊!12 亿人数据泄露!
一个不知名的参与者正在构建一个针对CN的 COMB(许多违规行为的汇编),并且已经拥有超过 12 亿条记录。每一个都至少包含一个电话号码,但通常还包含其他敏感数据,例如地址或身份证号码,并且这...
TLS指纹分析研究(下)
一、概述在TLS指纹分析研究(上)一文中提到,TLS协议已经成为互联网上最流行的协议,恶意工具可以使用TLS协议将其流量隐藏在大量web浏览器和其他TLS的合法覆盖流量中以逃避检测。然而,恶意工具在模...
【技术分享】差分隐私实战-以保护新冠数据隐私为例
前 言 技术的发展是为人类创造更美好的世界。随着AI技术的进步,攻击AI的技术也越来越多,包括对抗样本、后门攻击等,这些是针对模型安全而言的,在数据层面,攻击者甚至可...