如何练就辨识微博网络水军的火眼金睛?( 二 )


01 单因素水军识别路线
对于水军特点 , 一般可以通过人工基于相关理论或者是事实逻辑、常识进行分析 , 另外也可通过对用户信息进行数据挖掘 , 发现隐藏在其中的水军特征和行为模式 。 本文中对于水军特点的发现采用第一种方法 。
根据以上分析 , 就水军四个方面的特点分别进行分析 , 先定性分析其特点 , 再利用统计分析法、机器学习等方法(可选步骤)得到一个定量描述问题的指标或者方法 。
本文在水军 “用户关系”维度中构造了一个特征 , 进行单因素实例化分析(见图“微博网络水军识别路线”) 。
如何练就辨识微博网络水军的火眼金睛?
文章图片

图:微博网络水军识别路线
02 关系图直观描述用户社会关联性
如前所述 , 水军用户社会关联性简单又集中 , 本质上每个账户之间难以构建正常的“朋友圈” 。
分析可见 , 正常活跃用户的各个好友之间的关系明显要复杂于水军用户 。 水军用户所关注的对象之间 , 则明显并无太多联系(见图“正常用户(左)与水军社交关联性比较”) 。
如何练就辨识微博网络水军的火眼金睛?
文章图片

图:正常用户(左)与水军社交关联性比较(关系图)
基于此 , 对社交关联性可以使用清晰可见的图论方法来描述和分析 。 研究中无需对每一个用户都建立图示的社交关联图来人工判别 , 而是可以构建一个描述这种关系紧密度的公式来测度 。
03 构建聚类系数 定量描述社交关联性
图论〔Graph Theory〕是数学的一个分支 , 它以图为研究对象 。 图论中的图是由若干给定的点及连接两点的线所构成的图形 , 这种图形通常用来描述某些事物之间的某种特定关系 , 用点代表事物 , 用连接两点的线表示相应两个事物间具有这种关系 。 根据图论的知识 , 可以定义一个所谓的 聚类系数用来定量刻画两个好友间互为好友的概率 。
微博好友关系网络中 , 两个在现实生活中相识的用户在微博上也很有可能互相关注 , 这种可能性的大小反映着朋友圈网络的紧密程度 。 水军账号关注对象一般互不相识 , 其相应的聚类系数较小 , 通过这个方法可以用来判断水军用户 。
应当看到 , 现在网络水军有了许多新的变化 , 如养号控评 , 热评背后藏匿不同诉求;水军投票 , 伪造口碑扰乱市场;营销号抱团 , 制造热点干扰舆论等 。 因此 , 仅用单因素来识别水军是远远不够的 , 运用多因素分析加强网络水军辨识同样值得关注 。
本文转自人民网舆情数据中心 作者:李伟
本文编辑:徐彦琳

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。