摘要:为数据治理构建业务案例的关键步骤是:识别和构建价值驱动力了解痛点 构建解决方案并进行成本效益分析 没有“一刀切”的数据治理模式, 也没有标准化的启动过程。每个组织都...
互联网场景下基于拉链表的全量表极限存储优化方案
本期作者董子平哔哩哔哩资深开发工程师负责B站主站数仓团队社区、数据安全运营,专注于数据仓库、数据安全的落地、应用和推广。01 背景2020年以来,半导体生产不足,这个问题困扰着全世界。互联网企业高度依...
2022年数据仓库安全最佳实践
数据仓库(data warehouse)的安全性对于在一个位置收集所有关键数据的企业来说至关重要。未经授权进入数据仓库可能会导致重大和毁灭性的业务后果,包括泄露客户信息、暴露高级商业机密或知识产权等。...
SparkSQL 在企业级数仓建设的优势
动手点关注 干货不迷路 👆前言Apache Hive 经过多年的发展,目前基本已经成为业界构建超大规模数据仓库的事实标准和数据处理工具,Hive 已经不单单是一个技术组件,而是一种...
数据仓库技术基本概念
在了解数据仓库的概念之前,我们需要先来理解一些相关基础概念。(1)ETL(Extract/Transformation/Load,清洗/转换/加载):用户从数据源抽取出所需的数据,经过数据清洗、转换,...
3