金融行业数据脱敏的类型、难点和办法
作者:安华金和 发布时间:2020-05-27

微信图片_20200527090915 副本.jpg

金融机构的数据库中储存着大量重要信息——身份证号码、手机号码、账户信息、资金信息、交易记录...这些敏感数据可能在银行、保险、证券等金融机构的众多业务场景中被加以使用,例如业务分析、开发测试、审计监管以及各类外包业务等。一旦敏感数据以“真实状态”泄露,或遭到恶意破坏,不仅有损相关金融机构的品牌声誉,还会为其客户带来一系列潜在安全威胁,最终将严重影响金融机构自身的正常经营发展。

银行

微信图片_20200527090938 副本.jpg

银行业这个大家族的成员很多,除了国有、股份制商业银行外,还有民营、城商、农商、政策性以及外资银行业...虽然这些银行的类型和规模各不相同,但对数据在使用过程中的“安全防护”却是一致的高标准、严要求。银行一方面要充分利用数据价值推动自身经营发展,另一方面也要面对在开发、测试、数据分析、技术外包等场景中的敏感数据泄露风险,想要兼顾数据的“使用和安全”并不容易。

1、敏感数据类型

· 姓名、地址、手机号、身份证号、军官证号...

· 企业组织机构名称、统一社会信用代码、纳税人识别号、组织机构代码号、工商注册号...

· 银行卡号、cvv2码、数字金额...

2、常见脱敏难点

· 不仅数据量大,每日增量数据也很大;

· 数据库对象类型非常多;

· 脏数据较多,数据格式不统一;

· 网络安全防护严格,生产环境与开发测试环境互相隔离;

· 非常见操作系统种类较多,如:AS400、Z/OS、SUSE;

· 考验对国产数据库的支持能力。

3、数据脱敏办法

· 更高的脱敏性能:银行业是信息化进程最早、管理意识最先进的行业,因此历史的存量数据较大,因此客户往往对数据脱敏系统的性能极为关注;

· 采用增量脱敏:由于银行的日新增数据量较大,无法定期对全量数据进行脱敏,因此客户往往要求数据脱敏系统具备增量脱敏能力;

· 更灵活的子集过滤功能:当明确要脱敏某一固定数据范围时,系统可通过where条件筛选、表达式配置、支持白名单/黑名单过滤等方式进行脱敏,效率更高;

· 对脏数据进行处理:一些银行的早期数据不太规范,这就需要脱敏系统具备异常数据的处理能力,包括丢弃、置空、随机等;

· 采用DMP文件脱敏:在无中间数据库的情况下,可直接对DMP文件进行脱敏;

· 支持国产数据库及非常见操作系统:数据脱敏系统应支持对GaussA、GaussT、GBase8A、GBase8T、达梦等国产数据库的脱敏;同时,支持AS400、Z/OS、SUSE等非常见操作系统。

保险

微信图片_20200527090942 副本.jpg

寿险、财险、外资保险...因其行业属性,保险公司掌握着大量涉及客户个人隐私的敏感数据。这些数据一旦发生泄露,很可能被不法分子用于针对保险客户的精准营销、短信骚扰甚至电话诈骗,从而对保险公司的品牌声誉和经济利益造成损害,并直接影响其业务的正常开展。

1、敏感数据类型

· 姓名、地址、手机号、身份证号、军官证号...

· 企业组织机构名称、统一社会信用代码、组织机构代码号、企业座机号...

· 银行卡号、数字金额...

2、常见脱敏难点

· 不仅数据量大,每日增量数据也很大;

· 不仅要对数据库脱敏,还要对文件脱敏;

· 需要对定时脱敏任务实现准实时数据脱敏。

3、数据脱敏办法

基于分钟级的定时脱敏任务实现准实时数据脱敏:

· 数据库中实时写入保单信息,包括个人敏感信息以及预收、承保、查勘、理赔等敏感数据;

· 数据脱敏系统每分钟读取一次数据库中的增量数据,并将其中的敏感数据脱敏;

· 数据脱敏系统将脱敏后数据发送给数据分析系统,并保证数据的有效性;

· 实时分析展示系统将经过分析后的数据及图表进行动态展示。

证券

微信图片_20200527090946 副本.jpg

证券公司是国家金融监管的重要对象,股票、期货、基金等的运作直接关系大大小小投资者的切身利益。与投资者相关的个人身份信息、交易记录、财务状况等敏感数据本身就具有很高的价值,也因此成为黑客、内鬼等不法分子觊觎的“肥羊”;而证券投资咨询公司、证券资信评级机构等掌握的重要数据,更关乎整个证券交易市场乃至国民经济和社会的健康、稳定运行,其数据安全防护不容有失。

1、敏感数据类型

· 姓名、地址、手机号、身份证号、军官证号...

· 企业组织机构名称、统一社会信用代码、组织机构代码号...

· 证券交易号、银行卡号、数字金额...

· 证券代码、证券名称...

2、常见脱敏难点

· 脱敏后数据的证券代码、证券名称的值要保持一致;

· 脱敏后的证券代码、证券名称,与脱敏前的证券板块要保持一致;

· 不同数据库中对同一股票代码表述不一致;

· 个人投资者与机构投资者脱敏规则不一致。

3、数据脱敏办法

为确保脱敏后数据的有效性和可用性,证券行业需要数据脱敏产品能够制定专门的脱敏策略,用以保持证券代码、名称、板块等数据在脱敏后的一致性。

· 如是在香港上市的股票,那么脱敏后还是港股股票。

例如:

脱敏前数据:06198 青岛港

脱敏后数据:00788 中国铁塔

· 如是在香港和A股同时上市的股票,则分别保持在各版块内脱敏。

例如:

脱敏前数据:01336  新华保险 / 601336  新华保险

脱敏后数据:01810  小米集团 / 600000  浦发银行

· 如是在A股不同版块上市的股票,则分别保持在各版块内脱敏。

例如:

脱敏前数据:300010  立思辰 / 002024  苏宁电器

脱敏后数据:300002  神州泰岳 / 002251  步步高

... ...