受尽苦难而不厌,此乃阿修罗之道。 收藏本站
登陆 / 注册 搜索

查看: 2.7K   回复: 2

[# 生活] 我们的社交数据是怎么泄漏的?

[复制链接]
发新帖
跳转到指定楼层
楼主
手摘星辰龙战于野 发表于 2019-3-1 16:13:51 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

人生若只如初见,何事秋风悲画扇。

前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!
- F# [- @  G! p0 V9 f" j9 p) @
20180926180814-GettyImages-667585627-crop2.jpeg__我们的社交数据是怎么泄漏的?
一时各种猜测。+ V; A# ~/ k& p* C

) l( j. m) ~/ q" d8 I3 q  M那么,首先,微信是不会透露任何关系链给第三方的。7 d) j7 U8 m- h& |& F
/ d/ Y# p" P; S) `  a- {( S' u% f
分几种情况吧。' ]  w. M1 F; {" K5 s

2 U& r8 ?4 W2 q% c( d7 L& O6 u- g第一,通过直接关系的通讯录获取
, M6 A1 z- N- I$ J% H+ R2 b( A2 W
: `/ Z, J- K6 B5 P; @你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。
  d; G! Q+ c, F; Q" K' q) f# e$ j: ~4 ?  I( e9 G1 L
所以系统标记为,你们很可能认识。这个最容易理解。
! ^1 m0 B, I$ I
" E! s3 n. x0 G% ^# H( y; I第二,通过间接关系的通讯录获取( N. b/ S, p0 q
& Q/ n! T3 M" p: w. Z; d' B
你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。8 \# i. ~  h! E# n
0 `$ j6 Q. ?( E+ B0 B
比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。
# A& A( B/ Y! @4 f4 J, O# z0 s/ X% c$ N
那这个是不是很扯啊,很可能八杆子打不着的关系对不对。
) h+ n4 q, `" t: k5 Q0 I* t
, ^! s3 Y) X/ k/ q6 L可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。
2 R) n) ~# C  `1 x2 Q! q
+ N% v5 l  ]$ G2 r* \5 K现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?
: }3 m, [8 H: z# c% T0 b" w! z
& z% r9 g+ \% y! q* T. \7 S. ~再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。
% L/ n* S0 C5 G# b7 Y* M. Z% I) X0 z3 l! w# ?: Z+ ~5 K2 j
第三,通过转发和访问行为获取4 z+ V( g- A3 k( ~0 n; Q$ s) K
/ X% }8 ]# \" c
这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。' i4 X! e" P, B4 Z0 M7 h( T

$ v* n. X2 z! W: i8 {; ^5 y& g你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。6 ^* D% E- n7 v3 R3 D! w% U
% Q6 G8 M9 n/ G4 [! v& u
通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。7 L# W# S2 R& d6 y" i

2 u% ~" M! g) c" A第四,抓取公开数据& _% b0 `. A6 B2 b2 I9 f

# d0 e" k+ `; H比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?
+ F% O2 M  \/ ^% n  u" W% C/ a4 U* S* Q$ Z" P; C
而互相关注的数据是可以通过爬虫抓下来的。% Z( D. j! H, Q, E6 D' g- ]* `
  v0 ], z$ E" r
类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。0 q( X. ^9 ?6 V$ ~4 a

1 O3 v# Q! {$ I% H还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。
- M" F& S. B* H# U- B
. s+ Y( b5 u: h3 f" t6 n很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。
' C: P5 u" b  ?4 t/ N, m- b/ [  |6 v4 F' S( V2 e, W6 I' B
我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。9 T, T8 j& i2 ]0 X" U
  U3 I9 d: |; e' r
第五,购买地下数据
1 c1 p% ^6 {! o6 }5 h) V4 r4 O
4 K& }3 m: }( S4 L! b应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?
4 d* \2 e- W* P9 H2 [$ V" R8 v" k* r2 _- \
除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?
& `9 a8 e/ k0 L: [, {
+ |5 U- t2 ?9 s5 {- u! h开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。6 C( ~4 h3 i( ?
1 C, X. B+ P6 u/ m" A+ B
其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。# k2 `5 @( Y% V! E

! ~$ S7 Z7 X: n% O4 d& N大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?% l1 |4 G, E/ A' _9 F# E3 H

7 p8 Q1 X! d2 W3 {. s- I另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。# a9 ^+ H4 P3 R: D2 M; [2 L
) Y+ r7 W- ~# a( S
总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。+ p; D( c2 g2 M

6 a4 ^5 t. H7 e! g1 ~6 ?# k

上一篇:  21世纪20条讽刺语录

下一篇:  终于升级了

左岸云烟「出类拔萃」 发表于 2019-3-1 16:28:18 | 只看该作者
尔等果如其母戏寡人欤?
眼泪早已泛滥「出类拔萃」 发表于 2019-3-1 20:39:49 来自手机 | 只看该作者
对于这种刚发的帖子,' K  U# @; M& }$ L* l& P8 r& Q
我总是毫不犹豫的回了。( i9 U* P; f$ V/ x
如果火了就是个前排,% P0 s1 @1 h: |1 @& x7 w1 Q4 z
可以混个脸熟,* {- q7 @7 T  v& \
说不定谁好心就给粉了…稳赚不赔;
4 ~; |9 C# ?% k7 r7 S1 X2 \% P如果沉了就感觉是我弄沉的,
4 X% u" l, C& d& z很有成就感,
7 n9 f9 T- b  }还能捞经验。{:12_623:}
  j% f5 F8 |+ N. b
您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

关于本站|小黑屋|Archiver|古黑论

GMT+8, 2019-11-22 23:38 , Processed in 0.082642 second(s), 24 queries , Gzip On, Redis On.

© 2015-2019 GuHei.Net

Powered by Discuz! X3.4

快速回复 返回列表