到底该怎么做,你才会重新喜欢我呢? 收藏本站
登陆 / 注册 搜索

阅读: 7.2K   回复: 2

[# 生活] 我们的社交数据是怎么泄漏的?

手摘星辰 「龙战于野」 2019-3-1 16:13 |显示全部楼层

人生若只如初见,何事秋风悲画扇。

前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!  v# e8 |5 T2 [: D, x/ d7 I
我们的社交数据是怎么泄漏的? 20180926180814-GettyImages-667585627-crop2.jpeg
一时各种猜测。
1 G( V. b& z* Y/ [$ i
3 `2 E- n; m# k  R& ~4 T那么,首先,微信是不会透露任何关系链给第三方的。
; \7 J: _6 Y% i! d* m6 o
" G0 f8 J; o+ a) Z分几种情况吧。( V5 }5 c7 Z8 k

- @5 V2 J) A: R' a3 g第一,通过直接关系的通讯录获取* h" l0 r# }+ w3 Q. b6 t7 `# r

6 q& L% [0 Y$ D) b* K: H你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。
+ U( \  I! {$ _! M( o9 ]8 S- B  p4 f1 a$ G
所以系统标记为,你们很可能认识。这个最容易理解。
, g# c. Q8 k) a
+ [- m# p$ w) d& ?" z+ h第二,通过间接关系的通讯录获取) v. [9 p" _4 r1 E; O3 l

6 r: m0 c2 \6 p5 {9 H- N你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。7 T, q2 d9 q( G$ N
7 z- h" b# \/ [) {1 _$ q/ c
比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。. ], c2 W% x* ]" n9 D" W: F

( O% U4 @1 k! n4 g那这个是不是很扯啊,很可能八杆子打不着的关系对不对。
  [) S: G9 s6 L0 B6 {  H, W, ?; C) @0 g9 n& @5 v
可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。
: ^2 `7 N  A1 F/ ?4 Z+ }. S$ t8 W
1 x+ w& d. `1 Y" k现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?
5 J3 l& t7 c& x$ h5 v
8 Q# t. G0 G1 n+ M, x* y( N6 {再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。
' K6 d9 X) l; S8 i6 F# t6 d2 K4 e8 b" V/ a
第三,通过转发和访问行为获取+ R8 f$ c, v4 Y5 i* b

! J3 Z% g) }1 X这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。9 H( ?% v0 `' j9 R1 H
7 T% t7 W9 ~6 L& K: ?
你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。- X: j- i" h6 g7 J" o

: A1 B/ z: w( t6 `" H% @, p通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。
: h2 A0 f" D! i" y
1 U, l/ m1 x- x1 z) q第四,抓取公开数据
+ ?. G; E; a$ r
" H: [- {, t& U) @比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?. k! Q7 d4 U' s& b

5 E( c( k. K# W% {而互相关注的数据是可以通过爬虫抓下来的。
4 R& a; i/ c( w
$ R- J, E5 F0 g7 ?) X& N( s+ L类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。+ ?  e7 @' R7 C( Z

) b* D5 L( e7 C2 P还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。( U" j; `* E; M1 g4 g
' W  e/ l: q, h  J, o3 E, t1 Z  |
很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。
) Y& c  h  @+ [3 ]3 G. K; k+ }; x0 f# C! f0 x
我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。
$ n( z( }/ D6 [+ F( C
1 D+ R+ P5 S1 o第五,购买地下数据/ c$ A8 t% p9 k& {& G/ M
- G& M  b% M7 B7 b
应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?7 _! A/ F1 E& L  C" L

: P6 s7 T) h( q; {" ~. A除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?5 W; A5 u- d" \9 d
6 n3 t1 c1 f6 L
开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。' e% t* z' k  l" A1 u

- e  `. ~+ i7 U9 }. f9 K6 V+ y5 x6 N其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。
, b7 ]1 M6 |. O/ S/ @8 r. M, u; F1 L
$ [+ e; c% E2 D7 Y大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?
( @0 [* e& {. P9 c2 _8 n5 N; n" [, n* L# [. I) {0 t7 E
另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。
- F0 t5 H3 d; S- P, ^: \0 p, P( u/ ^8 ]  {1 f! s% x: d
总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。' _/ ^6 C- v; h8 \* Y

3 ~  I" a6 y9 U/ y1 H
上一篇
下一篇


左岸云烟 「出类拔萃」 2019-3-1 16:28 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

尔等果如其母戏寡人欤?
眼泪早已泛滥 「出类拔萃」 2019-3-1 20:39 来自手机 |显示全部楼层

这个用户很懒,还没有填写自我介绍呢~

对于这种刚发的帖子,
  V3 z* \& |) O& ~0 r( g我总是毫不犹豫的回了。
) f. _  k" y; W- U如果火了就是个前排,
& v7 x, {% a3 ^5 I# Y+ ]8 j可以混个脸熟,
( \9 c( L7 j6 q! C& y$ [说不定谁好心就给粉了…稳赚不赔;0 O5 G3 |& ^9 ?) N8 h4 @) p- T
如果沉了就感觉是我弄沉的,( B; D7 n# S& L3 P. k2 {
很有成就感,
# \- f' U- q' L' ~& S7 e还能捞经验。{:12_623:} ' o7 D$ H+ C# z0 Q% b
您需要登录后才可以回帖 登录 | 免费注册  

本版积分规则

关于本站|大事记|小黑屋|古黑论 网站统计

GMT+8, 2021-4-12 06:13 , Processed in 0.026716 second(s), 21 queries , Redis On.

© 2015-2021 GuHei.Net

Powered by Discuz! X3.4

快速回复 返回列表