根据Netskope最新研究,企业向生成式AI(GenAI)应用共享的数据量呈现爆炸式增长,一年内激增30倍。目前平均每家企业每月向AI工具传输的数据量已达7.7GB,较一年前的250MB实现跨越式增...
通过公众号注入获取百万级多要素敏感信息
0x01 文章背景 一次攻防记录,通过公众号注入拿下数据库,获取百万级别敏感数据。不过没有顶尖操作,一点关于Sqlmap使用的小技巧。 0x02 记录开始 对某目标的公众号进行测试,哎,单...
阿里二面:为什么要分库分表?
来自公众号:苏三说技术大家好,我是苏三,又跟大家见面了。前言在高并发系统当中,分库分表是必不可少的技术手段之一,同时也是BAT等大厂面试时,经常考的热门考题。你知道我们为什么要做分库分表吗?这个问题要...
千亿文本单机bloom去重实战
前言消除重复数据是我们在实际业务中经常遇到的一类问题。在大数据领域,重复数据的删除有助于减少存储所需要的存储容量、避免重复的任务。例如,对爬虫库的海量url进行去重,对rapid7的dns数据集进行去...
近期暗网信息泄漏及勒索 【情报梳理】
我们不生产新闻、我们只是新闻的搬运工、降低大家信息差第一次尝试发布国内的一些新闻,被删就么办法喽1. 暗网出售中国香港某登股民数据,数据量为15万条2024年8月21日,暗网出售中国香港高登股民数据,...
一个绕WAF的burp插件【附一些绕waf资料】
免责声明 传播、利用本公众号所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,公众号及作者不为此承担任何责任,一旦造成后果请自行承担!如有侵权烦请告知,我们会立即删除并致歉。谢谢!...
哥伦比亚政府机构海量数据遭泄露,其数据库及访问权限于暗网出售
哥伦比亚政府机构的数据库及其访问权限在暗网论坛上出售,超过 400万条数据量遭泄露。据知道创宇暗网雷达监测显示,哥伦比亚政府机构的数据库正在暗网论坛上出售,超过 400万条数据量遭泄露。哥伦比亚政府机...
自己动手搭建大数据查询平台的入门级做法
知识案例随笔声音其他编者按做数据分析这些年,有一条颠簸不破的规律,即所谓智能算法不过是过眼云烟,最根本的还是数据查询检索……。作者利用课余时间,自己动手搭建大数据查询平台,总结了一套入门级的做法,大家...
浅谈AI大模型的数据特点和应用问题
【摘要】AI大模型的训练、推理及应用落地都需要大量的数据,其数据具有参数和数据量大、质量要求高、行业垂直属性强、资源消耗大等特点,由此带来的个人隐私泄露、数据中毒、数据篡改等数据安全风险已成为业界必须...
一文带你了解:软件性能测试指标有哪些?如何开展性能测试?
什么是性能测试?性能测试是通过自动化的测试工具模拟多种正常、峰值以及异常负载条件来对系统的各项性能指标进行测试。负载测试和压力测试都属于性能测试,两者可以结合进行。通过负载测试,确定在各种工作负载下系...
是不是该考虑轻量级大语言模型LLLM了?
长文本时代到了?随着人工智能领域的迅速发展,大型语言模型正在不断推动更大的数据量和更长的文本处理能力。过去一年里,超长上下文窗口的大模型发展趋势表现出显著的进步和创新。研究人员提出了多种方法来扩展大模...
记一次某学院的未授权渗透过程
本文由掌控安全学院 - 会唱会跳会敲键盘 投稿文章现写的,部分内容有些着急。 0x01 测试过程 开局登录框,没有测试SQL注入与XSS. 有system用户,尝试弱口令,无果! 直接namp来一下子...