龙儿是我的,谁都不准碰! 收藏本站
登陆 / 注册 搜索

阅读: 5.6K   回复: 2

[# 生活] 我们的社交数据是怎么泄漏的?

手摘星辰 「龙战于野」 2019-3-1 16:13 |显示全部楼层

人生若只如初见,何事秋风悲画扇。

前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!
; l" A4 l6 g% H' Q; v! \) Q
我们的社交数据是怎么泄漏的? 20180926180814-GettyImages-667585627-crop2.jpeg
一时各种猜测。# A$ V. V" l1 A0 z- w5 Y; }0 H7 I4 q8 Z
) W: h* k  s. H! ^/ s: S
那么,首先,微信是不会透露任何关系链给第三方的。
3 w7 v' E0 c) z4 g* q& t2 \. z& B" S) I6 C8 r7 U* W! Z. |
分几种情况吧。0 k! M3 `' G7 y( G
3 [' V* x4 J3 P7 I3 s, c
第一,通过直接关系的通讯录获取
- W3 p2 O0 I( m3 v) K* }. P. R' L5 B+ Z5 R7 m6 C. f& F* [
你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。
# G5 m' g% `' M7 L! A9 P6 }
2 }9 M5 I  q$ M  P所以系统标记为,你们很可能认识。这个最容易理解。
; _% P  m3 h2 e1 v) x6 Q, S
/ e# f" f  E' a2 r: j. W第二,通过间接关系的通讯录获取# x+ v" r$ H2 Y. L9 L9 Q" m
% j& Z9 J/ ^# w3 T
你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。! e. j# @7 t6 c9 q4 C7 [1 t- L1 S) Q
" D* |( d# q+ {/ u( {$ s, O2 x
比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。* {" u* M1 t5 H. h  m# W
" Q+ A$ ]) _) X: v0 ^
那这个是不是很扯啊,很可能八杆子打不着的关系对不对。1 d* K, n$ o4 Z& i) g
% D! Q/ I9 s3 c' i
可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。5 ~! J3 a. Q$ X/ C" K. ^7 T& |5 G

- u( P2 M' n  k, E/ T' _9 h& O0 y/ ~现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?
* d4 g4 d/ ]2 T) X( V/ Z; n' @8 i  Q/ v; T
再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。
1 M' P  ~2 i; b$ {8 ], M6 s
  D) h: p* j2 t2 _第三,通过转发和访问行为获取
8 m$ J, H9 q$ Q
' _# U* e* d" N这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。
* y: _* w6 m) J7 ]0 x4 y' s
1 |* b% L' o2 R+ v你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。. e: `; g$ F$ d) t# w2 A

6 p2 T- B5 M# y; T! |通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。0 n* R2 X1 ~/ f) ]7 e
" R2 B% m: Q- U. C
第四,抓取公开数据
) S. F* q/ v, v! @6 K# H6 ?
, c0 r/ ?: ?$ q) b/ ?比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?. Y' g) R9 I2 F# N; [+ ?

/ N) g$ t; x4 j7 b, s; u而互相关注的数据是可以通过爬虫抓下来的。3 G5 H# v, J! P, S- T' B

" m) y/ y! T; b4 c/ l: |4 w5 i类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。* P! o6 C1 q; y3 ]' S
1 G1 R5 }/ Z! r# k0 V
还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。
. }0 g! [* f6 M) N8 g9 n( i
0 E, F1 ?/ r* n1 D很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。  |/ d7 [% @3 e/ c- w0 S% r9 c- P, C
# i3 @8 }) d/ U; W; x% z
我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。* H9 J% p8 @- K  ~

$ t, q" r5 S+ N; Y第五,购买地下数据
1 N; ?" Q% v% j7 e5 }4 p$ K/ Q& e& ~  |" B3 G
应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?
! S/ d6 |4 y4 o8 Y8 K0 D
1 }# W6 \& R/ j$ e除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?3 {8 I+ c/ d& Z& n) `6 p0 x- v$ {. |' }
0 j% ~. B' U5 o
开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。' Z1 J. `* D/ `2 Y" E. Y

- r/ a3 _7 j9 X8 U. ^其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。
! M! s6 f! {% R, b0 r
$ d( D% V# g3 ^$ T) _, h4 c大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?3 b8 M' k* t( ]; s) t

6 e7 V, ]4 D+ X: f7 H" B& V另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。4 Q. U8 Z0 J" p' I& Z6 w
/ ?) }/ Y' c5 R: ~1 a7 O7 X
总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。
! U; e) W# {5 N- {' [# h( E) L: }& T# ^  x  u9 g. u

上一篇:  21世纪20条讽刺语录

下一篇:  终于升级了


左岸云烟 「出类拔萃」 2019-3-1 16:28 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

尔等果如其母戏寡人欤?
眼泪早已泛滥 「出类拔萃」 2019-3-1 20:39 来自手机 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

对于这种刚发的帖子,  f0 F. e0 g' A1 ?
我总是毫不犹豫的回了。
  d! n4 b4 m; k3 U7 h3 K如果火了就是个前排,5 [! s$ F- s5 w& }) y+ \; K
可以混个脸熟,( t4 m! P$ |. T
说不定谁好心就给粉了…稳赚不赔;
. I% e, l* Y5 W, ^如果沉了就感觉是我弄沉的,
! A* R# u# X# o" I7 N很有成就感,* c* k& l4 ^# R4 R: {
还能捞经验。{:12_623:}
  E. N+ h7 |+ z( u; Q/ w
您需要登录后才可以回帖 登录 | 注册账号  

本版积分规则

关于本站|大事记|小黑屋|古黑论 网站统计

GMT+8, 2020-9-26 14:03 , Processed in 0.027291 second(s), 21 queries , Redis On.

© 2015-2020 GuHei.Net

Powered by Discuz! X3.4

快速回复 返回列表