有些人,一旦遇见,便一眼万年;有些心动,一旦开始,便覆水难收。 每日签到 收藏本站
登陆 / 注册 搜索

USERCENTER


查看:2584   回复: 2

[# 生活] 我们的社交数据是怎么泄漏的?

[复制链接]
发新帖
跳转到指定楼层
楼主
手摘星辰龙战于野 发表于 2019-3-1 16:13:51 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

人生若只如初见,何事秋风悲画扇。

前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!- [1 @4 s' I, ?# U3 g
 20180926180814-GettyImages-667585627-crop2.jpeg 我们的社交数据是怎么泄漏的?
一时各种猜测。
  v  C1 r8 ]: F. Y4 p' S; Z6 O5 ]3 r% c. k5 y) F
那么,首先,微信是不会透露任何关系链给第三方的。
0 ?: T1 N$ S! s/ B" R' a+ x+ z$ q/ \+ L1 |* `% _* r
分几种情况吧。) w7 n9 e4 F8 K2 l) z
5 h/ R7 J- p) F  c, c
第一,通过直接关系的通讯录获取
: e4 G% z! T$ U* }
6 P8 ?4 u3 L0 w你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。
6 x9 `6 H: {! |$ J. a; S( D5 i) N# t  e' O9 R' {2 H
所以系统标记为,你们很可能认识。这个最容易理解。' U* Y# P  X  F: s) o) N
# y: p& d+ `3 j9 U
第二,通过间接关系的通讯录获取
' B3 g# Y4 p1 O. S* C# h
3 N9 g6 M. k- u* w( B- f! U# m你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。! y# y: g6 T5 o) w

9 A! ?* k! x  H% K7 \2 ?; q4 q比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。
, \0 k" t7 _' k5 d( }( ?9 p/ f$ i* |. v) Q
那这个是不是很扯啊,很可能八杆子打不着的关系对不对。5 ^9 N' Y& L5 ^4 T- V

8 D; p4 Q8 m; u  Z可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。
* O, p! `8 ?; p1 i  T
2 u, J4 {7 \( {现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?
" [2 r8 h% V" U" w
7 b$ N: L: }$ h/ n) i1 b9 o1 D再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。3 p9 v8 Q! G5 Q, d2 T

9 e# {$ X& D' O0 b第三,通过转发和访问行为获取
2 f$ ?9 _( n$ `- I6 p& J
* O6 a  G1 W) `0 l# t' s/ d, l这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。7 g7 v$ h9 S: k) }

' C. n' |, w6 Y& {& D( f你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。
5 l0 T% o) o/ n" n
. x6 a1 w% X( A2 L6 Y9 i通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。
# K$ p! L9 P) k: [5 P# x' G1 u9 H7 d. n  i" {
第四,抓取公开数据! o( \4 q6 V  O, f

! ?4 s3 k1 V0 B7 F比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?
2 B$ Q( \% a5 T' \8 y7 H& k! s$ G% k
6 Z( r" _, E1 O/ G8 K. H而互相关注的数据是可以通过爬虫抓下来的。3 Q' y& Z, {) `5 R" y3 U) Y
; c1 M0 _) S) n7 a( {. j/ _
类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。
- [; q2 I& T" X5 H- w; a: m5 x3 N: R* ~% _6 [' r
还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。
  X) L1 z' v" t, m9 I4 {$ Q/ j" w# d
很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。
) e: H1 b7 w  ~( Q/ V
' W/ ?1 ^( t% z我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。
; O' z" @! S- B) m, Z
4 o; U# v% _2 [, t- r1 d' I3 |第五,购买地下数据, ?. L+ z# G" @" }
' d% w3 i' F* c/ x5 d4 R8 U0 k
应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?
3 a) |9 b9 J: _% A- Y' Z' e1 |' s9 S, |3 b2 Q  I
除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?
6 R0 N$ x5 u$ ]* g, n" L3 }
* E5 Q# m% V) Q0 N4 y开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。2 T! {2 T  t5 G3 S$ @2 J% V) n& z
7 d. _' y, u$ L7 f
其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。
! m% t1 D. X  H! ?# N$ C6 C; R  e5 M  ]% \. x
大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?
1 Z9 g. W0 _" g$ Y; M, u
4 Z2 j6 z: \: b3 R$ j另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。
/ Y% Z* X  H! ]# ?1 _5 R2 W; i+ @8 L9 x% T: t
总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。3 Z- w0 s/ \+ Q2 c, ~2 }: p9 C2 c4 j
  d: T/ |. u, \+ V, k: O7 {6 A

上一篇:  21世纪20条讽刺语录

下一篇:  终于升级了

左岸云烟「出类拔萃」 发表于 2019-3-1 16:28:18 | 只看该作者
尔等果如其母戏寡人欤?
眼泪早已泛滥「出类拔萃」 发表于 2019-3-1 20:39:49 来自手机 | 只看该作者
对于这种刚发的帖子,  q, q2 }: q8 T+ x, q
我总是毫不犹豫的回了。
; j: U' n7 I, U, D; O如果火了就是个前排,
5 n- ~7 o# k- @5 A3 w8 _可以混个脸熟,+ k2 G; I% W0 }5 `/ t5 F8 l
说不定谁好心就给粉了…稳赚不赔;& g' K) J- n5 N" f: O
如果沉了就感觉是我弄沉的,
# L  V0 R: ]4 x; x很有成就感,
) G% L' _% X3 y2 u, Y  s还能捞经验。{:12_623:}
! M# I) |. L, @1 R
您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

关于我们|小黑屋|手机版|Archiver|古黑论

GMT+8, 2019-9-22 14:08 , Processed in 0.033973 second(s), 25 queries , Gzip On, Redis On.

© 2015-2019 GuHei.Net

Powered by Discuz! X3.4

快速回复 返回列表