我不知道将去何方,但我已在路上。 收藏本站
登陆 / 注册 搜索

阅读: 6K   回复: 2

[# 生活] 我们的社交数据是怎么泄漏的?

手摘星辰 「龙战于野」 2019-3-1 16:13 |显示全部楼层

人生若只如初见,何事秋风悲画扇。

前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!: F, l; @2 J6 X3 z( k6 |
我们的社交数据是怎么泄漏的? 20180926180814-GettyImages-667585627-crop2.jpeg
一时各种猜测。: |$ M' M- g& B* i! K4 d

! ?5 A  u: O( t/ Z7 k4 f( R6 x; q那么,首先,微信是不会透露任何关系链给第三方的。3 ~  T2 r) g1 T6 {1 m! l
3 P( N3 b5 Y# x  ?! z' u
分几种情况吧。
+ H3 k" v2 S8 _( V6 v' b& ?; N) F- w; P
第一,通过直接关系的通讯录获取
9 z+ {% b4 A  ~- N* T5 y
9 E6 z$ W; M4 |7 `你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。
' W8 ?: [' O4 _& _- C9 q% Z$ j; L2 K! v, C& U' b0 S
所以系统标记为,你们很可能认识。这个最容易理解。
) ?* S) q- _, ~! ^  I: ]3 x) Q
  a) ]0 b2 e, c+ m& U" {. [第二,通过间接关系的通讯录获取! b$ _% p$ ?  T; m' l$ ?: ?% y! ?  I

9 y, m- L. t. x你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。( u9 X7 ?3 k. G7 L, {

. s1 x: Y+ r" c! r9 ~3 f比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。$ C8 Y& a% C" f" U
0 c/ |. r. g% n! ^* V3 A# R) b
那这个是不是很扯啊,很可能八杆子打不着的关系对不对。
+ J- \: u1 D4 b! H) J4 J
8 T: h/ i* N  X0 w/ u可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。
" X' L( ?: [* M. U7 [+ q7 {0 |9 S! {$ p" P
现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?
( B9 ^" q; q& X2 K* y' ^. k# ?" d* H  ]. r  T- @. U. y
再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。* g7 ~! k/ v4 M% O( k

: o+ P  [" I) U第三,通过转发和访问行为获取
2 L; c# m8 Y3 Y0 @. D+ h6 a/ p# R8 h; W4 S' X
这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。
) M0 P7 W7 o$ }- i( e
- k* O  C# W0 Z  I5 {你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。& n% I2 i5 b; J+ C

: p7 N$ F" x+ B. D9 h9 r$ d  O  t% }通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。
; F" ?0 ~$ r: j, n& B
$ i( T# P" l5 P! l第四,抓取公开数据3 s7 I$ Y- g+ i" H5 L
; h! ^" O. T. Z$ B5 d! E
比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?3 h! \1 a: O: W5 _" u3 O1 S

' ]. q0 U! P/ r8 z0 ^5 {! j而互相关注的数据是可以通过爬虫抓下来的。# ^, p  T$ d% k7 |! I' t8 |' d
! Y9 o8 y/ E+ [% o/ I8 x) o1 l
类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。
7 ~$ `8 ^6 p, ]: y, ?; \  a* q! k' G% K  j9 B7 X& v; k2 k5 A
还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。
* ~+ o5 {% m! T# r: p6 M' H$ J) l+ ^( V; p* P8 o3 F
很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。
$ E/ r* N0 D- l" c. g6 v% X$ @1 X* f4 k# j
我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。
. P9 c0 R3 @8 o  X6 O7 Y8 Z/ S0 S& V( I
第五,购买地下数据
" F1 s' r  m+ J  U' w0 v( U
" t% v3 Y$ w8 b: |  q8 [) p6 O' y应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?
+ `2 q( W& X' P% X. U3 S) L' e$ P6 f' E2 g5 {; i* p  g* j0 q
除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?
# T* w% c! J6 w. e7 j% @  Y3 _5 }  F/ ]% Q  g
开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。( `: b1 l4 k' P4 N6 A- n3 U

7 P4 N) M, V  X; h7 w其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。5 X$ @# ^9 A) `7 {8 L! V. }
. d) m0 F5 Q9 I+ I; ^, \& F
大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?
0 e8 B( a7 R- q2 g, n) s
  Z8 T3 ]1 l3 D5 A3 }, x$ `另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。5 E. }1 y0 t( O. K& Y+ V) k3 S
" g% s5 P& j4 G; k
总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。2 I1 M0 _* ?  I5 w$ o8 C

. @1 i+ q$ H- _: F* P7 A

上一篇:  21世纪20条讽刺语录

下一篇:  终于升级了


左岸云烟 「出类拔萃」 2019-3-1 16:28 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

尔等果如其母戏寡人欤?
眼泪早已泛滥 「出类拔萃」 2019-3-1 20:39 来自手机 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

对于这种刚发的帖子,) p! o. y9 a) p1 a& K4 U4 X
我总是毫不犹豫的回了。
, ]- a( j: w( |如果火了就是个前排,
  u8 t5 r% x( @# n! i3 B可以混个脸熟,* h: U) I; h! d9 B7 C" j; Q
说不定谁好心就给粉了…稳赚不赔;
! {- J; P: G1 d  \如果沉了就感觉是我弄沉的,0 M- |. J5 q; u( u2 V; T2 Q' W
很有成就感,
% Z7 y0 I) j8 w; r9 h4 F2 z还能捞经验。{:12_623:} - {+ a" u8 Y! W+ }4 ]% R) {
您需要登录后才可以回帖 登录 | 免费注册  

本版积分规则

关于本站|大事记|小黑屋|古黑论 网站统计

GMT+8, 2020-11-24 14:45 , Processed in 0.032366 second(s), 22 queries , Redis On.

© 2015-2020 GuHei.Net

Powered by Discuz! X3.4

快速回复 返回列表