一款好的静态数据脱敏产品应具备哪些能力?
作者:安华金和 发布时间:2019-09-27

静态数据脱敏技术因实施部署相对简单的特点,在数据测试、分析等场景中,逐渐普及应用。可静态数据脱敏看似简单,需求却不一而足。对金融行业而言,数据库储存着大量与“钱和钱的主人”有关的敏感数据,一旦发生泄露或被篡改、损坏,势必导致无法估量的经济损失和严重的信誉损害。因此,下文将以对数据安全要求极其严格的金融行业为例,分析能满足差异化需求的静态数据脱敏产品应具备哪些能力:


1 副本.jpg

一、保险业务需求示例

敏感数据自动发现

保险公司在进行数据脱敏时,业务部门通常会提供给DBA部门一份由其梳理的敏感字段和类型的Excel文档,但后者不会将其视作唯一依据来核实敏感数据。DBA部门需要借助脱敏产品的“敏感数据发现”功能进行检索;然后,利用“敏感字段梳理”的导入导出功能,将“发现结果”与业务部门提供的Excel文档进行综合比对。如此,既可发现系统抽样数据判断类型不准确的字段,同时也能找到业务部门漏掉的敏感数据字段。

XML保单文件脱敏

保险公司每天要接收来自全国分支机构上传的保单,保单文件以XML文件格式上传至由当天系统时间命名的目录中,亟需做全量脱敏且后续会定期做增量脱敏。

为此,数据脱敏产品需要具备XML文件脱敏功能,从而在经过分析XML文件中敏感信息的位置和类型后进行脱敏;此外,如果产品能够将XML文件脱敏功能与自动脱敏任务及定时任务功能相结合,便可定期从远程文件服务器获取原始XML文件,完成脱敏后再发送到指定的文件服务器,从而实现对XML文件增量定期远程脱敏的目的。

2 副本.jpg

二、银行业务需求示例

高效脱敏

银行脱敏场景的数据量很大,包括表数量多,单表数据多,每日增量数据多等等。为了能够尽可能节省人工劳动成本,银行对脱敏产品的性能提出了很高的要求——针对Oracle、DB2等银行业主流数据库进行脱敏性能优化,并支持增量数据定期自动执行脱敏。

高质量仿真数据

受行业属性影响,脱敏产品要能够满足如:要求脱敏后的银行卡号依然符合银行业对卡号的合法性校验规则;对金额的脱敏要保持原值相对应的某个区间范围等行业特定需求。

DMP文件脱敏

证券基金数据库普遍通过Oracle导出DMP文件的方式实现数据传输,因此需要脱敏产品支持DMP文件脱敏。

3 副本.jpg

三、证券业务需求示例

脱敏后数据一致性

为确保脱敏后数据的有效性和可用性,证券行业需要数据脱敏产品能够制定专门的脱敏策略,用以保持证券代码、名称、板块等数据在脱敏后的一致性:

举个栗子1:如是在香港上市的股票,那么脱敏后还是港股股票

脱敏前数据:06198 青岛港

脱敏后数据:00788 中国铁塔

举个栗子2:如是在香港和A股同时上市的股票,则分别保持在各版块内脱敏

脱敏前数据:01336  新华保险 / 601336  新华保险

脱敏后数据:01810  小米集团 / 600000  浦发银行

举个栗子3:如是在A股不同版块上市的股票,则分别保持在各版块内脱敏

脱敏前数据:300010  立思辰 / 002024  苏宁电器

脱敏后数据:300002  神州泰岳 / 002251  步步高

由此可见,一款好用的静态数据脱敏产品不仅要具备高性能、高扩展性,还应深入用户现场、满足其在不同场景下的差异化需求,保证脱敏后数据的高度可用。安华金和深耕数据安全领域,根植用户需求,致力提供高效、灵活、易用的静态数据脱敏产品,服务金融及其他各行业用户,让数据使用自由而安全。