4000 258 365
用户名:
密码:
忘记密码? 尚未注册?
邮箱地址:
密码:
确认密码:
手机:
单位:
注册

数据分析人员的盛宴 “HIBP”14亿条记录网上公布

作者:安全牛 发布时间:2016-12-08

“Have I Been Pwned”网站成立三周年了,安全研究人员 Troy Hunt 想为全世界的安全人员带来点福利,于是决定把网站的绝大部分数据共享出来。

Hunt表示,分享这些数据是为了研究人员做分析,不想给任何人带来风险。由于担心有人受到伤害,Hunt去掉了数据集中的三项敏感信息:

1. 所有的个人身份信息;
2. 所有账户的域名;
3. 所有敏感的数据泄露信息

所有的账户信息本来是以下面的形式存储在 Azure Table Storage 中:

{“Partition”:”hotmail.com”,”Key”:”troyhunt”,”Websites”:”000webhost;Adobe;Dropbox;GeekedIn;LinkedIn;Patreon;Plex;Tumblr”,”Timestamp”:”2016-11-16T08:36:51.1806398Z”}

删掉敏感信息后就成了下面这个样子:

000webhost;Adobe;Dropbox;GeekedIn;LinkedIn;Patreon;Plex;Tumblr

上面的数据共有1,431,112,732行(有冗余),文件约15.3G大小。

一些数字:

1,989,141,353 –
“HIBP”当前的账户数量,包括用户名。如Snapchat的460万条记录,但没有邮件地址。

1,574,694,164 –
电子邮件地址数量,但不包括用户名。

1,431,112,732 –
包括更多账户的电子邮件地址,但去除了敏感信息。

2,399,307 –
网站账户组合数量。

分析人员可以把数据整合成下面的标准形式:


torrent下载链接:

https://haveibeenpwned.com/HIBP%20Consolidated%20and%20Anonymised%20Data.torrent


分享到:
北京安华金和科技有限公司 ©2015 版权所有 ICP备10053980号 京公网安备11010802010569号