敏感数据的“用”、“护”之道(上)——静态脱敏
作者:孙峥 发布时间:2017-12-31

 引子

“资本只有在流动中才带来价值,单纯存放起来只会贬值”,这已经成了放之四海皆准的共识。在信息化大潮愈演愈烈的当下,数据和信息不啻为一种“新型资本”,和传统资本具有的特性相似,数据资产的价值在流转、共享、整合利用中逐渐显现并越发放大。

举例来说:银行数据部门掌握的用户储蓄和消费信息,对内共享可以完善业务部门的信息化系统开发;对外则可为政府部门、征信机构等提供有效参考;甚至可以成为零售或制造业制定战略目标的有效参考依据。

然而数据的共享和流转带来的红利,远远无法冲散遮盖在数据保管者和拥有者心头的乌云。这种担忧来自对敏感信息在共享环节可能发生的泄密风险,更是来自敏感数据“合理使用”并且“安全防护”两者之间的矛盾。

于是,数据脱敏技术和专业脱敏产品应需而生,这类专业产品可以按照不同数据使用场合,对敏感数据进行变形处理,在脱敏处理的同时,不改变数据的类型、格式、含义、分布等使用特征,让用户不再因为深陷对安全的顾虑,而不得不割舍掉数据分享和流转带来的价值。

数据脱敏技术分为静态脱敏和动态脱敏,今天我们重点先和大家分享一下数据脱敏技术中的静态脱敏技术。

典型、新型脱敏应用场景举例

场景

高敏感度的社保数据如何安全使用

某省社保数据中心,业务系统的开发和测试全部交由外包人员完成。对于敏感数据,决策者陷入“给”还是“不给”的两难选择。假如不使用生产数据,而是由开发测试人员杜撰测试数据来进行上线前的模拟和程序功能设计,会导致测试用例不全面、功能覆盖不完整,可能造成系统上线后的风险和隐患。但是,如果直接将生产数据交给开发测试人员使用,又面临敏感数据泄露的风险。这种场景下,对敏感数据进行脱敏是唯一可行的办法。可以直接在生产环境下应用静态脱敏技术,对社保数据中参保人的姓名、联系方式、金额、年限等敏感信息进行脱敏处理,生成新的数据库,提供给开发测试方,不仅兼顾用户数据的可用性,又满足了用户数据使用的安全性需求。

静态脱敏——融入安管流程

静态脱敏技术的应用,其价值在于打造一份全新的、“高度仿真”的数据库,供非安全环境下使用。凭借着低门槛、易部署等特性,静态脱敏技术率先被用户所接受。在过去的一年中,这种数据处理方式先后被银行、证券、保险、社保、央企等行业所采纳,成为数据共享中的重要工具。

成熟的静态脱敏产品,应当能够自动甄别目标库中的敏感数据,如用户信息、联系方式、消费信息等,并将其保存成敏感数据字典。基于字典中梳理出的数据分布及数据关系,按照不同场景配置不同脱敏算法,为不同身份的访问者发放数据。

这种数据处理机制,可以解决外包、测试、开发以及数据分析场景中,满足数据使用需求的同时,保证数据的安全性。然而,要想将静态脱敏应用切实有效地落地,需要考虑的重点是,如何与现有的安全管理流程有效融合。可以接触生产数据的人员,通常存在三类不同的身份。

首先是安全部门负责人,这类人关注的重点是数据的安全合规,那么在静态脱敏流程中,让其参与敏感数据的梳理无疑是最佳选择。同时,脱敏系统可以根据数据特征自动发现敏感数据和数据间的关联关系,辅助安全负责人对梳理结果进行核实确认,最终形成针对特定数据库的敏感数据字典,为后续数据脱敏与数据发放奠定坚实的基础。

第二类人员是脱敏数据的实际使用者,包含测试、开发及分析人员,他们更关心的是,脱敏后的数据质量能否满足工作需求。这类人群可以参与制定脱敏策略,确保同一份敏感数据能够满足不同使用需求,并按照他们的详细要求进行掩码处理。

第三类人员为数据运维部门,他们承担着日常数据维护、数据迁移等工作,发放敏感数据通常也由这类人员完成。引入静态脱敏产品进行数据流程管理后,运维人员可以根据不同需求场景,将源库中的敏感信息,按照已指定的脱敏策略进行数据变形,并发放至目标库。 

将敏感数据静态脱敏应用于数据管理制度,可以对上述三类人员的工作内容进行有效整合,并为各环节工作提供相应的技术保障,将数据的安全管理落到实处。

在数据安全领域,“禁止”和“防护”固然重要,但是如果背离了数据共享和合理使用的前提,那么数据的价值将大幅度下降。数据脱敏技术,正是兼顾数据“用”、“护”之道的有效手段。无论动态脱敏还是静态脱敏,在数据安全领域,将越发不可替代,真正为用户铸造安全、可靠、高效的数据使用环境。