bloom | CN-SEC 中文网

安全闲碎

千亿文本单机bloom去重实战

前言消除重复数据是我们在实际业务中经常遇到的一类问题。在大数据领域，重复数据的删除有助于减少存储所需要的存储容量、避免重复的任务。例如，对爬虫库的海量url进行去重，对rapid7的dns数据集进行去...

09月09日19 views评论

程序逆向

在Linux系统中，ELF（Executable and Linkable Format）文件是一种广泛使用的二进制文件格式，用于可执行文件、目标代码、共享库等。ELF文件中的动态链接信息通过动态节（...

07月20日160 views评论

安全新闻

导读：分布式链路追踪作为解决分布式应用可观测问题的重要技术，得物全链路追踪(简称Trace2.0)基于OpenTelemetry提供的可观测标准方案实现新一代的一站式全链路观测诊断平台，并通过全量采集...

01月22日29 views评论

安全闲碎

By: Flush导语对于任何希望了解 Web3 领域的人来说，浏览链上数据是一项基本技能。了解构成区块链的数据结构有助于我们思考创造性的方法来解析这些数据。同时，这些链上数据构成了可用数据的很大一部...

05月21日31 views评论

安全闲碎

作者：pishi，腾讯 PCG 后台开发工程师布隆过滤器是一种具有空间优势的概率数据结构，用于回答一个元素是否存在于一个集合中这样的问题，但是可能会出现误判——即一个元素不在集合但被认为在集合中。相信...

03月17日29 views评论

安全闲碎

来自公众号：码哥字节在Redis 缓存击穿（失效）、缓存穿透、缓存雪崩怎么解决？中我们说到可以使用布隆过滤器避免「缓存穿透」。码哥，布隆过滤器还能在哪些场景使用呀？比如我们使用「码哥跳动」开发的「明日...

05月13日52 views评论