古黑论
登陆 / 注册 搜索

USERCENTER

站内搜索引擎

打印 上一主题 下一主题

[生活] 我们的社交数据是怎么泄漏的?

[复制链接]
跳转到指定楼层
楼主
前段时间,几个新的社交软件出现,那么,很多人使用中发现,哎呀,为什么我没有把通讯录上传,他们仍然可以知道我的好友!甚至很多不再通讯录上的微信好友,也被当作可能认识的人推荐给自己了!$ x! b; E% z! w' L2 \7 K
 20180926180814-GettyImages-667585627-crop2.jpeg 我们的社交数据是怎么泄漏的?
一时各种猜测。
$ V1 F5 K8 o* `" P3 s1 Y/ H9 [
7 R! a7 B: U) N- _那么,首先,微信是不会透露任何关系链给第三方的。
* I  G7 S7 b, q- e, n- a) Y8 `
1 @* l' y  {# B7 p分几种情况吧。
) d* ^% M4 l0 u6 V. b% T8 B( p: k) d
第一,通过直接关系的通讯录获取
( I+ [  c' k/ C0 ]. S# R7 D9 _. _1 R' x/ L; k
你没有上传通讯录,但对方上传了通讯录,你在对方通讯录里。
# s: X# ^; |- a' C, T7 A/ T5 n8 f
所以系统标记为,你们很可能认识。这个最容易理解。0 ?. g; |1 T* S" L- C+ g
. w- i3 c9 S" _# Q  F9 |& e4 o
第二,通过间接关系的通讯录获取
% Y* o6 ?5 f5 T
6 n8 l+ y! U7 `你和对方都没上传通讯录,但存在第三个人上传了通讯录,并且同时包含你和对方。
- x) _0 d9 _! e
7 A' x2 \. b( g  z4 b比如说,A和B都没有上传通讯录,但C上传了,C的通讯录里同时有A和B。9 P- @9 `" J8 _+ |
5 _7 q& s- V0 }" H4 Q4 j! W
那这个是不是很扯啊,很可能八杆子打不着的关系对不对。% v) |8 x1 d8 x, f& F1 [* U) A" U8 r9 m
4 h6 z: u2 u! i: R5 ]0 B1 E
可是如果D上传的通讯录里也同时包含A和B,E上传的通讯录也是。
! p( `" O1 c* Y. j6 B5 s# ]5 b* Z/ ]: Z. [, u3 y$ d$ C
现在想想,如果设计一个阈值,存在多个人提交的通讯录里同时包含了某两个人,这两个人可能认识的概率是不是就很大了?3 ~9 o% {! o$ H! L! k/ B9 m
/ _$ l& y8 [+ D* u/ v
再说,人家系统推荐写的就是可能认识的人,就算不认识,用户也不会多想的。
! D: L6 n7 p- ]! F# g$ P; i7 P$ e0 b% _$ l9 `! Q
第三,通过转发和访问行为获取2 x, X' Z: a' z' R2 x
4 T0 ]/ N; m/ J( ?* b3 q. ]% m( ?
这是前几天在朋友圈看到一个方案,是个图片,追了一下水印,来自于微博的 "Barret李靖",是阿里的员工,但这个是不是原始出处我不清楚,如果还有其他出处烦请告知,方案一看就很靠谱,我用自己的理解描述一下。
* e5 E% c+ Z8 {0 d$ q5 D1 @+ w" O1 w2 Q: m  f
你在头条看到一篇文章觉得有意思,分享到微信,那么分享这个链接就带了你头条的用户标记。微信上你的朋友打开这篇文章的时候,他可能也是头条用户,那么打开时头条会获取他之前访问的cookie,这样就知道他是谁,同时链接的参数也知道你是谁,那么头条就认为你和他应该是可能认识的。- Q7 w  y% q( H

/ m: W7 E  j: I: ~0 ?' r通过分享朋友圈的点击浏览行为,基于分享者的URL特征和点击者的Cookie信息,可以快速建立可能认识的人际关联。+ `! d# L" n7 X( \5 y5 j
6 @- n" w5 T2 q' N% T3 l# g
第四,抓取公开数据+ s! P1 t' [9 T' A4 b4 i* }7 f

3 j7 h6 t7 C' K! c比如微博,单向关注不能代表认识,但是如果是互相关注呢?那是不是彼此认识的概率就很高了?0 w/ W3 n& m# {3 x+ }; L! z

; N0 E$ z. A2 t5 x+ S/ J6 I而互相关注的数据是可以通过爬虫抓下来的。  s$ v: y0 B! [" Z  j4 }/ Q& m

& S' G# v. h  e类似这样的还有,比如QQ空间的评论,我记得是公开的吧,比如linkedin的社交关系。
: y# H% j8 @. f8 s
/ P  ?: z- u6 h6 G5 V还有历史上一些同学录产品,或者人才网站上的工作简历,如果你和某人同一时期在某个公司某个部门就职,或者某个学校某个专业就学,系统是不是认为你们或许可能认识。
4 Q( r4 m; I- J7 q% y6 a+ i2 ^  z! F4 ]7 n9 H4 @
很多产品要求你绑定微博啊,绑定微信啊,绑定QQ啊,绑定这个那个啊,然后他们通过公开数据的关联关系,就把其他很多信息的关联就建立起来了。0 {' a2 T. q" w: I

* l' ]2 ^/ g& K, z) r- j2 J, |我记得前两年有个读者,基于公开数据来推断我的好友信息,结果发给我了,怎么说呢,让人有点害怕的那种。+ h3 i+ p" W# L; U) R+ z
8 ?9 g$ K! J- r* t2 Z$ H) l3 f
第五,购买地下数据" t, R! j6 K3 r- {5 I
3 h7 J8 [: J! ]  f5 q
应该是2013年吧,7000万QQ群数据泄露,这个数据在地下市场一直有流转,很容易得到。如果某两个用户同在一个群,也许无法得出他们的关系,但是如果同时在多个群呢?是不是认识的可能性会很高?
8 {/ k4 |) {9 \! B2 ?+ W$ O( O8 @# @/ {" G+ i) H/ s/ W4 ~4 p" }
除了QQ群数据泄露外,还有哪些与社交有关的数据泄露呢?
' N/ T/ I; A7 y6 @+ J& z' n- w, Z# I1 I* L2 Z
开房数据泄露是不是也有很多起了,同一间房开房的除了情侣关系,同事关系也不少,毕竟很多小公司出差两人一间也常见。家庭关系,很多家庭旅游为了省钱是不是也经常亲戚挤在一间。旅游伙伴关系,此外还有商务会议接待,有时候也会把一些商业伙伴安排在一起。这是不是也都是社交关系。- Y5 n7 m( [# }. `8 z+ t  ^( U

# K( ^- s4 w4 P3 S( D* K8 R9 C9 B其他的还有没有?别问我,我不知道,但地下市场数据库的强大经常是超乎想象的。+ f- K- a  c/ E: M* \

/ }2 g$ T+ s+ {: p大部分会觉得,一个正规企业做事情不会用黑产数据吧,来,说个我知道的,前几年小额贷,网上保险等行业,为了拓展业务买第三方线下数据还少么,第三方线下数据哪来的?哪个是干净的?你真以为巨头就不会买?: v3 J; @7 H! G
3 g4 s  N* ^! N  p9 b4 m* \
另外,巨头找第三方做爬虫抓竞品数据的反正我知道有不少案例了。这是另一个话题了。
8 G$ C+ D7 o+ G3 l7 b5 W) w+ R
3 m8 c& s+ j% a2 E+ V- b总之,互联网无密可守,社交数据有很多种可能泄露,防不胜防,可能他们还有其他手段,我所能知道的可能也只是冰山一角。如果你不想与世隔绝,这事,就现实而言,也没有更好的规避方法。
$ m( e' {, P: [4 J4 C* a
( b- Q( m' g) u; X( w: U
上一篇:21世纪20条讽刺语录摘要:01 啥叫抢红包? 就像过去旧社会, 财主老爷站家门口 ...
下一篇:终于升级了摘要:终于升级了,高兴
回复

使用道具 举报

沙发
左岸云烟 发表于 2019-3-1 16:28:18 | 只看该作者
尔等果如其母戏寡人欤?
回复 点赞 点踩

使用道具 举报

板凳
眼泪早已泛滥 发表于 2019-3-1 20:39:49 来自手机 | 只看该作者
对于这种刚发的帖子,
$ X/ h  P9 u0 T( ]- v$ z! p我总是毫不犹豫的回了。
2 q( M$ R/ ~* s* ^. Y0 P; t' S如果火了就是个前排,
; v. ?# y  a  r可以混个脸熟,
* z! \. P( Y9 R7 i. }" ^说不定谁好心就给粉了…稳赚不赔;+ O1 Z, a* [2 F! u5 A
如果沉了就感觉是我弄沉的,! l3 J& F) P- z5 C- k3 w
很有成就感,
* T& ?$ C* C% ]3 R还能捞经验。{:12_623:}
! ]2 O, b1 z) m1 Z. H" ~7 w
回复 点赞 点踩

使用道具 举报

高级模式
B Color Image Link Quote Code Smilies
您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

关于我们|小黑屋|手机版|Archiver|古黑论

GMT+8, 2019-5-20 21:03 , Processed in 0.257507 second(s), 48 queries .

© 2015-2019 GuHei.Net

Powered by Discuz! X3.4

快速回复 返回列表