全文共1320字,阅读大约需3分钟。
在《数据安全法》《个人信息保护法》《个人信息安全规范》为代表的众多法律规范指引下,数据分类分级成为各行各业数据管理和数据安全的热门话题。过去数据梳理和分类分级多由服务团队纯人工来实现,随着科学技术的发展,近年来自动化产品步入舞台,承担起智能的数据分类分级的工作,降低了人员投入成本,也提高了对数据精细化管理的效果。在自动化数据分类分级中,关键在于内置的数据分类分级模板和模板内关联的众多检测规则,本文将进一步解析数据分类分级模板的种类和所包含的规则内容。
数据分类分级模板种类
数据分类分级模板基本上依据法律规范做行业区分,个人信息属于全行业,当前最权威的为GB/T 35273—2020《信息安全技术 个人信息安全规范》,其他均以各行业标准为主要参考依据,如电信、移动、金融、工业已有发布的标准,政务、教育、医疗、能源、交通,以及众多细分行业也在数据分类分级的标准制作推进中。模板应该是贴合实际情况,涵盖大多数数据的属性,从根本上解决数据管理员对数据分类分级的诉求。
数据分类分级规则解析
模板中会存在众多规则,旨在让数据识别、数据分类、数据分级、数据打标更加全面、准确。规则要细化到字段名、字段内容、字段备注等内容,规则的编写以关键字、正则表达式为落脚点,配合机器学习和神经网络等先进的算法,产生出定义准确、识别率高且准确的规则内容,此规则一旦应用到自动化产品中,将为数据分类分级工作带来本质上的变化,降本增效自然达成。
下面以个人信息为例做自动化分类分级效果展示:
★ 分类
以一级二级三级来进行细分到最小子类,用来做精细的标签化管理。
★ 分级
数据敏感级别,如个人信息和个人隐私,就属于两个高低不同的级别。
★ 敏感数据
利用扫描到的结果进行展示,证明识别的准确度,主要展示的内容一定是脱敏后且能体现出数据特征的数据。
★ 列
数据所在位置列
★ 字段中文名
体现出字段的中文名称
★ 字段类型
数据字段所属类型
★ 表名
数据所在的位置表名称
★ 库名
数据所在的位置库名称
通过扫描结果,数据管理员可以对数据内容一目了然,分类和分级可做数据资产统计的依据,位置信息做为资产地图的标记,组合的数据又可发现数据所在位置的敏感度风险,这一切的结果都是取决于前面提到的数据分类分级模板规则的定义,所以说,规则写的越全面细致,扫描数据识别越全面准确,至于机器学习的技术能力就是来动态调整规则与数据的匹配度,让数据识别更精准。
绿盟科技自主研发的敏感数据发现与风险评估系统IDR,已经帮助客户梳理数据超过百亿条,剖析各类数据分类分级标准,制作各行业数据分类分级模板规则总计约10000余条,可满足不同客户的使用需求,还可以通过自定义规则增加实际业务数据的类型,增加更多业务粘性,让数据管理和数据安全更快一步。
IDR产品对结构化数据、半结构化数据、非结构化数据都可识别,扫描方式更是多种多样,全表扫描让未知数据瞬间浮出水面,指定表扫描精准有效,增量扫描及时发现数据变化,断点续扫拒绝资源浪费,定期周期扫描让数据扫描更轻松,内置机器学习和神经网络算法,让数据识别方式更灵活、数据识别效率更优质、数据识别准确率更高效。
数据管理的好帮手
数据分类分级的必备武器
NSFOCUS RSAS-IDR
原文始发于微信公众号(绿盟科技):数据分类分级模板解析
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论