欺骗世界,欺骗最初的你。 收藏本站
登陆 / 注册 搜索

阅读: 8.5K   回复: 2

[# 生活] 我们的社交数据是怎么泄漏的?

手摘星辰 「龙战于野」 2019-3-1 16:13 |显示全部楼层

人生若只如初见,何事秋风悲画扇。

前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!
/ Y3 H1 M- U) s3 U6 `7 b
我们的社交数据是怎么泄漏的? 20180926180814-GettyImages-667585627-crop2.jpeg
一时各种猜测。
3 I- r) M. z3 P+ ~/ Z. v4 T3 R5 ]) }* g, _( M% [
那么,首先,微信是不会透露任何关系链给第三方的。
3 ]" S3 g& H' `( N. p, I
2 L4 E8 E3 ^9 e# r% N1 {$ p0 `. {分几种情况吧。
" H2 U2 n0 Y& }+ J2 B8 b) S' g6 }9 H0 |4 _$ u& C  I
第一,通过直接关系的通讯录获取, v- h7 A3 R- n+ C4 X# t

) h) W. a7 M6 A你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。
+ a3 w( E! `- _1 J/ T! r* A4 b+ t* b' O9 v5 R) q' W% G: b5 r
所以系统标记为,你们很可能认识。这个最容易理解。6 B' Z  }7 p+ u& [% M7 c! j
/ i' w! ?7 f: T4 b
第二,通过间接关系的通讯录获取) N; t, E6 F0 S0 T

- I* f* W3 y; p7 {. ]; P+ V你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。
6 T/ d' p8 w/ t( O0 @+ t, W4 `; F0 P# S$ O% r0 u
比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。
: W" `$ C4 l# ?- i$ y* k# C3 M: k4 x- ?4 `
那这个是不是很扯啊,很可能八杆子打不着的关系对不对。+ l  h/ ^! U1 T5 y' H
% Z- ]% q" \' |
可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。3 e1 p) K0 G0 o8 N8 l2 S  O' J

0 l2 t: E& `4 y  P' @现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?
) o1 t' N0 g% u$ W( z1 f6 T+ @" j9 l: Y- B2 z! {7 ]1 P# V( U& N
再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。" K: Q8 ]) J: O% \
+ _% ~, N: Y) p: y. H6 ]0 d  {
第三,通过转发和访问行为获取! E& \* z# Z" ~/ w) e+ [
! f$ M% B* o$ U) T  W
这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。3 S9 d) M/ j' X
+ b/ I/ h) u4 G7 m% a' k9 @
你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。
2 l8 ~4 i  Q% e5 r3 R
+ I. ]6 V( }% J通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。
  f9 p3 c8 J* Z; N4 C; Z0 K+ Q+ d# p" _. p% L
第四,抓取公开数据
+ l- n) b4 t; X% a. X1 G( p6 \1 q/ `3 x( g; K0 S, z; X9 m3 r, F
比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?+ p/ c) b9 ?6 q, s: y
+ X7 o6 ^% N6 |% Y6 O% k5 d
而互相关注的数据是可以通过爬虫抓下来的。0 u/ t" n. V, m$ }0 Q' L5 x3 W; b" I
8 ^( Y* v& R1 b3 z6 e
类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。
/ ^# b2 Q$ E( y! s
  v: L- i2 H3 b4 _2 A5 _) I还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。; {8 ?1 l( u/ D8 W) s. D, Y$ ^
* M5 O1 c+ }: Q# w. _* N
很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。
0 v8 r7 n( v+ E! t9 H3 T- S: B2 q. y, l% Y
我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。
3 q! o3 s( T5 J4 L/ |# Q6 L/ c
( z& N6 a5 W. R" D/ ~第五,购买地下数据( F8 p% M1 D1 |- H7 j" \( i
/ d' X, Z: D* N' U- H+ e# J4 Z
应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?
7 N& @" _' [2 Y/ {- z, O# K% b1 @/ F3 {1 x
除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?0 L+ K, }/ T- r! u; O+ Z

, A* Q. K9 D% x' Q1 `9 y开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。
9 l5 k2 @! _1 b/ g! a( \3 V1 \/ s; S( x! q7 h8 m
其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。7 {* q( d7 S# P- T+ }7 Q
( S- K: ^3 i' S1 K/ C
大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?
9 i" l) l3 l7 M
) F4 X7 M7 ~) u! _另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。2 M  t5 I+ B( K/ s% r* e
1 R$ ^# T. C0 b
总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。
6 y! V9 `4 q; l/ A& u) n4 u- U% G5 c; b) T
上一篇
下一篇


左岸云烟 「出类拔萃」 2019-3-1 16:28 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

尔等果如其母戏寡人欤?
眼泪早已泛滥 「出类拔萃」 2019-3-1 20:39 来自手机 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

对于这种刚发的帖子,6 f$ Q. k* s4 X% k8 f
我总是毫不犹豫的回了。
5 W0 Q8 ]( j" D0 I% u! w" b% D如果火了就是个前排,- E8 M  K8 |8 l+ Y/ t
可以混个脸熟,
8 K7 W$ l1 n2 t5 j3 `, }6 m. D说不定谁好心就给粉了…稳赚不赔;
$ C5 I' F* o. R7 F6 J0 A2 W+ S如果沉了就感觉是我弄沉的,4 \( n: Y$ ^: f6 Q
很有成就感,
* v7 G4 \( C7 U: M还能捞经验。{:12_623:}
2 Y: f1 I3 k, K- r$ c
您需要登录后才可以回帖 登录 | 免费注册  

本版积分规则

快速回复 返回列表