如何监测出Android推广渠道作弊?

by:leotse

本文整理自知乎,如何监测出安卓推广渠道作弊?
文章比较系统地介绍了三个境界的防作弊手段,对于APP运营者有一定价值,同时对于广告渠道来说也有一定的意义。

如何判断渠道的质量和狡猾程度,如何判断用户是否真实、是否来自墙、是否机刷or肉刷而来,是运营人员乃至整个公司最为头疼的事情,因为事关成本,而寒冬将至,成本则事关生死,不可谓不大。

那么我们如何识别真假用户,从而有效的管理渠道呢?从运营的角度,要是能根据上量的用户的综合价值来给渠道付费,那当然就是最佳策略。什么叫用户的综合价值,那就是该用户为公司创造出来的综合价值,价值包括但不限于:

1) 直接利润价值:比如购买行为,产生收入和潜在的利润;
2) 内容价值:比如产生了积极的、优质内容,间接的创造价值等;
3) 传播价值:比如因为ta的传播,引发了其他用户的使用等等;
4) 衍生价值:停留时长或关注时长,所带来的广告收益等;

每个App的行业不同,这四种价值侧重不同。
因为按照激活这个时间作为结算的时间节点对我们来说,这个时间窗口太短,对甄别用户的真假带来巨大的挑战。
在这个巨大的挑战面前,就分化出作弊防护的不同境界。

第一个境界——事后诸葛亮,事前猪一样

稍微量化一下这个境界,发现作弊的时间需要7天以上,能感知到40%左右的假量用户,其他超过半数的作假不能确保;通俗的讲,知道自己被骗了,但不知道骗了多少。他们的手段一般是这样的:

(一) 看留存率
根据长期的斗争经验,他们发现渠道刷量会选择在次日、7日、30日这些重要时间点上导入用户数据。然后发现App在次日、7日、30日这些关键时间点上的数据明显高于其他时间点。而真实的用户的留存曲线是一条平滑的指数衰减曲线,如果他们发现留存曲线存在陡升陡降的异常波动,基本上就是渠道干预了数据。

(二) 看用户终端信息
1) 低价设备排名
根据经验分析渠道的新增用户或者启动用户的设备排名。如果发现某款低价设备排名异常靠前,他们就视其为异常,开始报警。

2) 新版本操作系统的占比
经过渠道多年蹂躏,运营人员终于发现,很多渠道刷量工作室在操作系统版本的适配上会有延时。查看渠道用户的操作系统时,可以和全体手机网民的操作系统的分布做比较。

3) wifi 网络的使用情况
比如说2G、3G、4G的使用比例分布是否正常等等。

(三)看延伸信息
1) 注册昵称的分布和规律,很多低端的刷假量的注册昵称有很强的规律性,各位运营看官肯定遇到这样的情况;
2) 注册手机号码的归属地分布,这点相比各位看官也遇到过,某个渠道上来的用户手机号码不但来自某运营商的某个地市,甚至都是连号手机号码。

小结:该境界中的运营者严重依赖于个人经验,工具手段不专业化,操作效率低下,耗费人力物力,但发现问题时间滞后,而且稍微高级一点的作弊行为不能被发现。

第二个境界——亡羊补牢,损失在所难免

在这个段位的选手,甄别出真假的时间周期大概是2-7天之间,识别出来的假量大概在40%-70%之间,通俗的讲,他们可以比较确定性的识别出很大一部分假量用户,如果商务条件比较给力的话,是可以控制损失范围的。之所以有这样的效果是因为他们采用了一些专业的手段:

(一) 单个指标
1) IP:是否为黑名单IP、是否为代理IP,跟一个巨大的黑名单库进行比对;
2) IMEI:是否为黑名单IP;
3) 手机号码:号码是否非法,是否在黑名单;

(二) 群体指标
1) IP:用户IP的地域分布是否符合先验数据的分布,地域包括国内的省份分布和海外市场的分布;
2) IMEI:用户IMEI号的地域分布是否符合先验数据的分布,IMEI所代表的制造商的分布是否随机;
3) OS:该渠道操作系统版本的分布情况是否符合一定的随机性和统计性,并与之前的先验数据进行对比判断;
4) 机型:机型分布是否符合先验数据,以及最新智能手机出货量的比例;
5) 位置信息:位置信息打开的比例,以及获取到位置信息的地域分布比例是否符合先验数据的分布,是否符合渠道承诺的地域情况,是否符合应用的实际分布情况;
6) 运营商:运营商的数据分布是否随机,是否符合国内运营商的正常分布,以及海外运营商的随机分布;
7) 网络接入方式:wifi、2G、3G、4G的分布比例是否与先验数据保持同样的趋势和数据特征;

(三) 信息一致性:
设备一致性的验证,包括:CPU、制造商、Mac地址、IMEI、机型、操作系统的一致性验证。
一般而言,通用的统计分析工具是实现不了上述的分布,这就需要用专业的作弊防护软件或安全软件来。
这个境界的运营者已经摆脱了手工处理,依赖个人经验的阶段,而是走上了算法和数据的专业化路线,但问题是每家的算法能力和数据积累参差不齐,因此在效果上各家能力差异很大,而渠道反过来猜测各个运营者的能力的强弱,来给他们掺不同比例的假量。

第三个境界——当下即断,零损失可以期待

在这个段位的选手,甄别用户的真假所需时间从15分钟到30分钟,如果是时间窗口延伸到24小时,那么他们的把握将更大。那么他们是如何做到的呢?总结一句话就是:软硬兼施,进攻是最好的防守!

(一) 硬手段:
所谓硬手段就是在用户端的硬件上下功夫下手段,进驻在用户硬件设备上的SDK主动进行探嗅,探测硬件环境的变化、操作系统环境的异常、以及各种应用接口是否被劫持。第一时间得到用户智能设备的状态。当该用户的手机硬件及其系统环境出现异常时,立刻在后台对该用户的所有数据进行缜密的审核,1)追踪其IP及端口的状态,以及IP的历史行为;2)追踪其IMEI以及IMSI的对应关系,IMEI和IMSI基本可以理解为一把钥匙一把锁的对应,伪造一个IMEI号容易,但要想连同IMSI一同伪造,这个成本就变得奇高无比。而整个过程可以控制在15-30分钟,为跟渠道斗(si)争(bi)赢得充分时间窗口。

(二) 软手段:
在第二境界的基础上,他们通过长期的数据积累和研究发现:各个指标反馈出来的信息强弱不同,因此对所有的指标进行赋值,并让这些指标对该群用户做作弊投票,当累计值超过阀值时,宣布该用户为可疑用户。这样就可以完成了在24小时内对用户真假的补充判断。

要达到这个水平,不仅需要长期大量的数据积累和与时俱进的更新,还要有强大的数据处理算法和软硬通吃的技术实力。

作者:古婆
链接点击这里
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。