科普|数据脱敏的主要方式
作者:安华金和 发布时间:2019-12-20

数据泄露事件层出不穷,各国对隐私数据保护要求越来越严,促使各类组织对于隐私数据保护重视程度大幅提高。数据脱敏是保障数据共享、分发、使用场景中隐私数据安全的有效手段。

在数据脱敏过程中,需要根据数据的使用场景,选择相应的数据脱敏方式:

遮蔽脱敏

遮蔽脱敏方式是对数据的全部或者一部分用符号替换,例如原手机号为:18688888888,经过脱敏后改为:186****8888。应用比较广泛的场景有:金融,医疗,政务等行业的排队叫号系统、呼叫中心系统;互联网的电子商务、外卖订单系统等。

保格式脱敏

保格式脱敏方式是保留数据的主要格式,例如:对于身份证只需保证为18位数字,手机号为11号数字。应用比较广泛的场景有:各行业的系统研发、功能测试等。

保留数据特征脱敏

保留数据特征脱敏方式是保证数据脱敏的情况下依然能保留数据原始特征并能通过业务校验,不影响数据分析。例如:身份证号在进行脱敏之后,依然是正确的身份证号,系统校验方式也能正常通过。地址脱敏后也是真实存在的地址。应用比较广泛的场景有:数据分析场景等。

泛化脱敏

泛化脱敏方式是保留原始数据的局部特征的前提下使用其他方式替代原始数据的方式。例如:只需要知道人群的年龄阶段:11-20、21-30、31-40……不需要知道具体年龄的场景。应用比较广泛的场景有:数据统计场景等。

数据一致性脱敏

数据一致性脱敏方式是原始数据的关联关系在进行数据脱敏后也能保持关联关系。这种关联关系不只是对数据表的主外建的关联,对非主外建的关联关系也能保证关联的一致性。

表内数据之间一致性,我们可以保证原始数据与脱敏后数据关联关系保持一致性,如脱敏后数据的身份证号、性别、生日、籍贯数据保持一致性。

表间数据的一致性为不同表实用相同类型数据时,脱敏后数据相同,如姓名在不同的表里存储时,脱敏前不同表中的相同名字脱敏后也相同。

应用比较广泛的场景有:系统二次开发、修改场景等。

可逆性脱敏

可逆性脱敏方式是脱敏后数据可以使用对应表,对数据进行恢复操作,从脱敏数据可以获取原始数据。此类方式会保存脱敏数据对应表,根据业务需求,这些脱敏算法可以结合使用。而且对每一种脱敏方式,也可以使用不同的脱敏规则来进行脱敏。应用比较广泛的场景有:数据分析后需要真实结果的场景等。

安华金和静态数据脱敏产品动态脱敏产品,支持以上各种脱敏方式,并且在金融、医疗、教育、政府、互联网等行业已经拥有众多成熟客户案例。欢迎广大用户咨询、测试:4000 258 365。