一直保持微笑是有诀窍的,那就是,在想哭的时候放声大哭。 收藏本站
登陆 / 注册 搜索

阅读: 7.6K   回复: 2

[# 生活] 我们的社交数据是怎么泄漏的?

手摘星辰 「龙战于野」 2019-3-1 16:13 |显示全部楼层

人生若只如初见,何事秋风悲画扇。

前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!2 m' P7 ?! }, b) `4 {7 ]. C) h
我们的社交数据是怎么泄漏的? 20180926180814-GettyImages-667585627-crop2.jpeg
一时各种猜测。  e& T' p: e6 a* G

" y' F* D& A& Y+ }9 `6 K那么,首先,微信是不会透露任何关系链给第三方的。6 R" _4 R; ]% g8 r& ]

) u, X6 U/ ~) ?" x! i* T% |2 j分几种情况吧。
5 m3 d1 x4 J  f8 G& C8 w# q- U* g, s: `2 F
第一,通过直接关系的通讯录获取) U2 ~  x& E8 W5 Y

4 ?" |4 _& l5 _. w7 w你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。$ w1 P0 G' d1 Q

! E8 a7 R1 S2 o4 h+ ?, o所以系统标记为,你们很可能认识。这个最容易理解。2 b9 a  F' o: o( y, c8 Q" I% S! ^

8 H! Y3 Z* v& P! q/ h6 u$ h  I7 j第二,通过间接关系的通讯录获取
: s- z" w  }  C% r8 p, T9 J
  B/ Y0 B& h3 q, }5 e4 E- u& F你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。7 ~) }/ Z6 g' A! T
0 T2 f7 |" ]- w8 E- Q
比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。4 z. w- b* K2 Q1 ]  a
* F0 A5 g& u) ~: y* T3 W, |
那这个是不是很扯啊,很可能八杆子打不着的关系对不对。, ?, `9 Y( z# w

; j! l) m0 y# U  }; T  Y可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。
- w6 I( S* w% J6 G. O: A# S! g6 k
现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?1 @% L9 P2 n/ }, v- g3 ~2 D  \

) o1 w3 ?9 x. c5 s' v) o7 L再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。
: M) G" w4 g0 R# ~! t- S0 P; p8 B3 g. V
第三,通过转发和访问行为获取
1 v% \: u7 o  U& E- ?) u$ x% ~6 Z0 i* [) V3 Z# M6 p
这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。" m2 a+ v4 @2 y1 d' V2 k' q4 N" K& e/ [
) w1 V4 U: j$ k  B8 G3 U
你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。  O0 T- _1 N1 f

6 k4 M1 L+ E# D6 w, k/ X, r3 n通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。, O9 r9 [. u3 d' Y

1 v/ G. }; \2 |/ U第四,抓取公开数据
* H8 W7 V2 T( l. w! u+ ~, B! H2 ?2 L- [: [2 T: u% ^
比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?
5 x( m* _% o6 J# O+ u( |9 ]2 {/ S; J1 d' ^
而互相关注的数据是可以通过爬虫抓下来的。
( ]" B# s. {& z  ^4 H/ ]0 W+ |3 y" O' \0 u. @
类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。) p, h% a: s. N1 q3 |; h. ~

# v1 d0 L$ @$ Q: X: K! x2 e还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。
: ~; O, W; p6 D9 O( j: F% e& C6 |
/ c& N# I4 O+ B9 e  o# N. r* a: x很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。5 U, f  }/ g# j7 X: Y/ X% z5 v
1 S+ A" l3 ?7 ~0 s& n) V1 O* p
我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。7 e! ^2 R( t$ L
: ~1 c; g* v" j+ u/ c; O8 K2 D0 \
第五,购买地下数据
. ?+ V8 X. R; F2 w3 ~8 j- ]
& {" `6 `3 G' ]% ~! y/ R" P9 T) p应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?
& F0 _/ O& D. {4 `* I9 \8 F% u% j1 z9 A7 w6 k" S6 j0 C
除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?; T4 R8 B7 z: @+ ~; Y
4 {5 \  \( g9 l" E4 ~1 J
开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。
8 S: F5 I* C, L, x/ h) w5 E
  [- B7 V; g, @+ Y其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。
  I  h- _& t5 L* S3 p: x% F" H# ~& D; N4 z! r) [  Y
大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?
9 t% R/ v% R1 d: `
( r7 Y/ [2 d0 y7 Z& y6 H另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。
% R, a. ]# [- }  K& J, J, T6 q. h3 z) i
总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。
; ?; @3 @: f! T. ~- d, s+ ~  l3 C. A9 T! b$ d" r
上一篇
下一篇


左岸云烟 「出类拔萃」 2019-3-1 16:28 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

尔等果如其母戏寡人欤?
眼泪早已泛滥 「出类拔萃」 2019-3-1 20:39 来自手机 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

对于这种刚发的帖子,
' ]  }- M0 _, J6 Q( u# ^1 m我总是毫不犹豫的回了。3 Z4 c4 a' e8 G+ m
如果火了就是个前排,; h$ U* K0 }& `' h. E
可以混个脸熟,4 M+ K, \5 S) l; b; ^0 W2 y* t
说不定谁好心就给粉了…稳赚不赔;6 N6 z; V* d$ e% R/ i6 e
如果沉了就感觉是我弄沉的,' e  c. J" A* ~2 W
很有成就感,
3 Z4 l$ ]8 n3 L8 j# P# o& n还能捞经验。{:12_623:} ( s; V& y4 d* e9 {9 A6 C
您需要登录后才可以回帖 登录 | 免费注册  

本版积分规则

关于本站|大事记|小黑屋|古黑论 网站统计

GMT+8, 2021-7-30 19:07 , Processed in 0.030459 second(s), 19 queries , Redis On.

© 2015-2021 GuHei.Net

Powered by Discuz! X3.4

快速回复 返回列表