前言消除重复数据是我们在实际业务中经常遇到的一类问题。在大数据领域,重复数据的删除有助于减少存储所需要的存储容量、避免重复的任务。例如,对爬虫库的海量url进行去重,对rapid7的dns数据集进行去...
深入理解ELF文件中的哈希表:DT_HASH与DT_GNU_HASH
在Linux系统中,ELF(Executable and Linkable Format)文件是一种广泛使用的二进制文件格式,用于可执行文件、目标代码、共享库等。ELF文件中的动态链接信息通过动态节(...
云原生全链路追踪Trace2.0架构实践
导读:分布式链路追踪作为解决分布式应用可观测问题的重要技术,得物全链路追踪(简称Trace2.0)基于OpenTelemetry提供的可观测标准方案实现新一代的一站式全链路观测诊断平台,并通过全量采集...
引介|EVM 深入探讨 Part 6
By: Flush导语对于任何希望了解 Web3 领域的人来说,浏览链上数据是一项基本技能。了解构成区块链的数据结构有助于我们思考创造性的方法来解析这些数据。同时,这些链上数据构成了可用数据的很大一部...
经典论文解读——布隆过滤器
作者:pishi,腾讯 PCG 后台开发工程师布隆过滤器是一种具有空间优势的概率数据结构,用于回答一个元素是否存在于一个集合中这样的问题,但是可能会出现误判——即一个元素不在集合但被认为在集合中。相信...
硬核 | Redis 布隆(Bloom Filter)过滤器原理与实战
来自公众号:码哥字节在Redis 缓存击穿(失效)、缓存穿透、缓存雪崩怎么解决?中我们说到可以使用布隆过滤器避免「缓存穿透」。码哥,布隆过滤器还能在哪些场景使用呀?比如我们使用「码哥跳动」开发的「明日...