有些事情我不看透,不是我笨,只是我太善良。 每日签到 收藏本站
登陆 / 注册 搜索

USERCENTER


查看:2465   回复: 2

[生活] 我们的社交数据是怎么泄漏的?

[复制链接]
发新帖
跳转到指定楼层
楼主
手摘星辰龙战于野 发表于 2019-3-1 16:13:51 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

人生若只如初见,何事秋风悲画扇。

前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!
4 n! n& L/ n% p+ y
 20180926180814-GettyImages-667585627-crop2.jpeg 我们的社交数据是怎么泄漏的?
一时各种猜测。
: k4 Q; ^  H1 c  c  X8 b' _% V3 }2 r4 C/ f) k
那么,首先,微信是不会透露任何关系链给第三方的。* H; Q  l% S% ?$ \1 _, d

4 \1 u- a3 I* u6 v% k' b0 T9 n分几种情况吧。4 i+ A5 R) {# Q% G4 j! r7 x

5 T! g+ K5 I" b  h/ v第一,通过直接关系的通讯录获取% B# K% p8 C) v4 H) ]

% H+ [2 @/ Z0 q# e你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。
+ p, A/ B9 F% J8 B
7 u" B1 v( a/ ~: _# {9 T( h所以系统标记为,你们很可能认识。这个最容易理解。
; y, Z, }, y( F5 `  Y6 ]
2 B! @+ C# ^0 h& p, [! n: l2 v第二,通过间接关系的通讯录获取
( Z4 a+ i( g" s8 e8 {# w2 @' ?
1 \) x7 S/ j6 C8 G$ v你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。
% e4 |4 p( G3 H/ v8 S( O
; J5 v# |7 ^0 F/ A( e比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。8 m+ L' A% Y% y/ N- |

: h: P4 I" W, T# v那这个是不是很扯啊,很可能八杆子打不着的关系对不对。
( r3 O% \$ {' N$ ^7 ?- A5 m3 _$ p+ J2 Q: b0 g' S9 y
可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。, q7 s  _) m+ _; k9 Y# e8 j+ C

( V3 F9 O$ Q/ H' p& Y# {+ O现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?) t4 q( ^: D9 w0 s$ N& U6 K8 o
7 }  h6 w, G' K5 f: T. m
再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。& F6 v* u! v, Z1 v3 k5 e
0 w" \" v; v$ M0 G9 i8 j' Q. Z
第三,通过转发和访问行为获取
, @2 k) c& g2 c$ m3 J3 L4 }5 X' R6 P$ P# o
这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。
( ~. t3 D/ |, N7 D/ `. y% s4 M$ ?( _# R  m4 R8 n7 T! h
你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。
1 a0 Q8 g. u  |9 y  j# V$ a- c+ e; w4 c2 Y4 I, P
通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。+ w" K! f+ w# W+ a
' k* H3 [: A5 V5 Z1 v! p
第四,抓取公开数据# p! v$ F) j4 s5 m% d1 X
; ?/ w0 u2 m" p, z1 ?# Q
比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?
7 T3 v) y9 u# y# j6 r- i) Y& C( m
而互相关注的数据是可以通过爬虫抓下来的。5 @! X' I/ g" g9 j
& Y5 O+ S) v* K
类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。
& D* C; Y( a: f8 N& ]1 s$ ]
& w* A& ]2 W! ~6 x  p; d. q: n; B还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。  Q0 F5 c" z8 G2 Z, x2 E1 N
6 }  S4 h8 e& B5 @3 k( \: `2 I) ]
很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。; P$ z1 B7 l% A0 I
2 y  [' ^6 h7 @# x( Q! m  L
我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。
! p; L% S" j5 h1 d5 S% L2 D1 h9 }+ o
第五,购买地下数据
+ D+ s/ B5 ^9 V. m6 O- v1 t1 o# b, X6 }) q
应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?8 U2 S& Y$ h" U, H* \- T' S

4 C1 A9 t5 f4 V( i8 ^$ [除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?! w4 T9 K% a- j" P
$ A6 X8 r4 M* D% U
开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。3 T6 }# l/ {; Q
  z" c) h0 _# t0 p! i
其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。% g% v, z: ]! J4 H

4 q/ l2 ?0 e: F/ K. k大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?: V8 g; t" c  K
6 L" ?3 h0 [! A
另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。
7 _" b& M5 |4 a# W( N' e) z# m% u# `0 d6 o- v0 o# I9 Z
总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。
# X8 B& A3 W. z9 j7 k
4 m4 ^+ T6 I; H" Q

上一篇:  21世纪20条讽刺语录

下一篇:  终于升级了

左岸云烟「出类拔萃」 发表于 2019-3-1 16:28:18 | 只看该作者
尔等果如其母戏寡人欤?
眼泪早已泛滥「出类拔萃」 发表于 2019-3-1 20:39:49 来自手机 | 只看该作者
对于这种刚发的帖子,) i' X3 x) T2 y; S: P
我总是毫不犹豫的回了。
3 A/ f8 N9 j0 U+ j( a  X" n0 D5 G, {如果火了就是个前排,. C( M% S$ U1 A- N8 P" O
可以混个脸熟,
. E5 K/ _4 W& R: C& H( S说不定谁好心就给粉了…稳赚不赔;+ `5 [) i* i" ]7 l# n- v
如果沉了就感觉是我弄沉的,. B5 M5 C: b$ w) B$ n8 @
很有成就感,
" f  f! \2 E  o7 c/ }8 }. s1 ]还能捞经验。{:12_623:} - i1 R8 E8 Y5 U- Z8 T* [
您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

关于我们|小黑屋|手机版|Archiver|古黑论

GMT+8, 2019-7-22 16:06 , Processed in 0.158611 second(s), 32 queries , Redis On.

© 2015-2019 GuHei.Net

Powered by Discuz! X3.4

快速回复 返回列表