百度竞价推广会涉及到很多环节,数据分析是重中之重,因为它是对上一步工作的总结和下一步工作的计划,数据分析好了才能为下一步工作做准备。今天赵阳竞价培训小编特地写了一篇文章,帮助大家进行数据分析。
数据获取
01.数据来源平台的选取
大多中小企业都是直接外挂的三方统计软件,如GA、百度统计、CNZZ、51la等,虽然大多数统计平台在功能上相差无几,但是统计数据还是有微小的差别。
我曾在百度统计和CNZZ两个平台的优劣选取上纠结过一段时间,后来索性两个平台都上,当双重保险。平时的分析中我比较习惯CNZZ,但是如果你的网站上了百度竞价,那么百度统计是更好的选择。现在统计代码基本都是异步加载,不用太过担心速度问题,如果你还纠结,那就和我一样都上吧。
02.本地保存“即时数据”
统计软件后台都会保存大部分数据,如CNZZ的来路页面、受访页面等,基本不受时间限制,随时可以下载的。
但是要注意那些需要即时保存的数据栏目,如CNZZ后台的“访问明细”,该栏目只保存最近7天的数据,这就意味着如果你一不注意,放个长假回来,数据找不回来了。所以,类似的“即时数据”,一定要保存到本地。
03.下载数据格式选“.xls”
统计后台遇到报表需要下载时,基本都会出现下载格式选项,CNZZ是.csv和.xls,百度统计是.csv和.pdf。
pdf数据自带图表;csv为纯文本数据格式;xls为Excel专用,便于数据分析。其中.csv文件和.xls下载下来后,数据的长相极其相似(这就有个坑,后文有避坑方法)。因为csv文件是纯文本数据,并不是数值,所以不能进行数据上的求和,求平均值,只能计数!
如果你不小心用了.csv文件,一定要先处理成数值,否则后期数据分析时会有无法正确统计的情况!
04.多页数据采集及合并
当你需要保存在线数据时,需要注意一个小细节,比如CNZZ的“访问明细”栏,右上角显示的下载按钮是“下载本页报表”,而其他栏目的下载按钮是“下载报表”,下载报表是不管当前显示多少页,系统默认下载所有页面数据,不会缺失。而下载本页报表就只下载当页显示的页面数据。
我被坑过一次,分析数据时发现数据明显少了很多,一看原来只下了一页的数据,再想下载的时候,服务器数据已经过了7天,没了…
下载每页报表,会遇到的第一个问题是:当网站访问量大时,访问明细数据每一页都需要点击下载。
我目前的解决办法是使用“火车头采集器”,模拟人工点击,下载每页数据;第二个问题是:自动下载的数据每一张都有表头/尾,人工合并也会累死。可以使用Excel VBA功能,但我的办法是使用“慧办公”插件的合并多表功能(有次数限制,需购买)。
这两大问题,有更好的解决办法,欢迎告知。
数据清理
01.尽量不对源数据做修改
我做数据分析有个原则,就是“坚决反对对源数据进行直接修改”。
首先,专业的统计软件在设计统计后台的数据时,已经千挑万选,选出的数据能符合绝大多数用户的需求。当源数据不符合你的要求时,千万别在源数据中插入行和列,比如要插入日期列,请插入在数据表头或者尾。
因为每次保存数据时,都是直接从下载好的表格中粘贴数据,在源数据表中多出任何一行或列都会增加你的操作成本。
我曾经为了数据看起来更直观,把下载好的源数据两列值进行位置对调,最后导致我每次粘贴数据时都要先调换列。特别是有一次做工作交接,我忘记提到这个细节,交接人员没注意位置和源数据不一样,导致分析出错。
也就是说,对源数据尽量减少人为干预,省心省力。
02.坑货csv要转化为数值
在数据获取部分我提到了关于源数据是.csv格式的问题,如果你知道这里有坑不进去是最好的,但是已经进去了,怎么办?
我最开始下载源数据一直用csv,因为csv的文件小,下载速度快,最后数据分析时蒙了。那么已经保存为csv格式的数据怎样变成数值呢?答案是Excel的分列功能。
1)Excel打开源数据表,复制部分数据到.txt文本中,观察源数据用的什么符号;
2)选中某列数据,点击导航栏“数据”—“分列”;
3)下一步,如图中的数据分隔符是“Tab”+“””,那么选择Tab和其他两项,继续下一步;
4)选择目标区域(要复制在哪里),搞定。
分析要素
01.日记:当天有特殊情况记录在趋势表中
作为网站运营者,每天上班的第一件事就应该是粗略过一遍昨天的统计数据。在每天的过程中要密切关注不同小组有没有做可能大幅度影响网站流量的工作。
比如EDM、活动运营开展了一次线上活动、内容运营抓取了某个栏目的文章、技术人员对某个栏目改版等。这里存在沟通问题,本部门作为各平台负责人一定要事先强调事先通知的重要性。虽然事后可以通过数据反推,但是可能导致思考过于发散。
把每天收集到可能影响到网站数据的情况“批注”在趋势表中,等到周报时进行数据对比,会方便很多。
02.峰值:高峰、低峰都不能放松
在面对图表分析时,峰值最为明显。但是很多人只分析不好的低峰而忽略高峰,对高峰擅自代入。
面对峰值时,首先要缩小粒度。如观察8月8日出现低峰,那么再看是在8月8日当天哪几个小时数值降低,再分别筛选出这几个小时的来访及受访数据,逐一分析,找到根源。低峰找出原因,今后避免;高峰,也找出原因,今后重现,验证你找到的原因。
03.对比:约束变量,同轴对比
在上文中提到了“制定表格规范”,其中对比规范的核心就是要同轴。
比如数据对比坐标轴不能瞎变,这周记录的是星期一到星期天,对比的是本周和上周;下周记录的变成了星期三到星期五,对比的是上半月和下半月。坐标轴一定要按照表格类型来,周报告就以周报告为轴,对比的也是本周7天和上周7天的数据。有特殊情况需要在周报告中显示更长的时间段时,也请固定该时间。
频繁更换坐标轴或者完全乱来,不仅会影响报告的可读性,也可能会导致分析人分析出错。
04.经验:记住周期性现象,这是你的宝藏
什么叫周期性现象,比如“每逢节假日流量下降”、“每逢周末流量下降”、“每周三9点PV暴增”等等,多次重复并反映在数据波动上的情况。
针对平台运营,记住所有周期现象,这就是你今后工作比别人更专业的经验来源,不需要企业花费大量试错,节约的人力物力就是你的价值。
但要注意的是,周期性现象也是有“周期”的。互联网时代知识日新月异,不要守旧,经验也可能骗人。
05.反常:事出反常必有妖
什么叫反常现象,比如大多网站在中午12-14点间,流量都会因为网民需要休息显著降低,且PC流量降低,移动流量骤升。但是如果某一天,或者某一周的12-14点流量全体暴增呢?
反常现象就是在周期性现象的异变,当多次出现反常现象时,你找到原因后就要开始重新审视周期性现象是否产生了变化,是否是政策变化;是否是环境风向变化;是否是平台玩儿变化等。
理论误区
01.猜测不代表结论
进行数据分析时,先看日记中记录了哪些行为,再对比数据结果看记录该行为的同时是否产品数据波动,如果数据波动符合日记中的行为常识,那么就可以大胆猜测该项数据变化是由该次行为导致。
接着你要做的就是通过数据验证它,而不是武断的认为数据波动就是这个行为产生的。
举个例子,某次公司派同事去路演,路演PPT尾页留有微信公号的二维码。结果在数据分析时,发现当天微信新关注数量暴增。然后运营人员不经过验证就直接武断的把新增用户的效果归于路演,甚至得出了要多参加路演的指示。可是最后在数据分析时,发现当天新关注数的增长来源是“名片分享”而不是“扫描二维码”,后来一问才知道,是社群组的同事进行了一次小范围的社群名片互动。
始终要记住“猜测不代表结论”,提出猜测后,要证实它。当出现实在找不到根源的问题时,先暂时放弃,记录下你的猜测,找机会再验证它。
02.深入分析,结论可能是假的
刚才提到了“猜测不代表结论”,这里面存在连环套。因为数据分析工作面对着大量数据,时间一长,人难免会焦躁,特别是老是找不到原因时,很容易得到假结论。
举个例子,某次分析网站数据时,对比发现有一天网站的PV暴增许多,缩小粒度后发现数据增幅集中在当天14-17点,然后开始分析“受访页面”的访问次数,一排序,发现某个栏目PV暴增,一问部门同事才发现是因为内容运营开了爬虫,抓取了大量的信息流,提高了PV量。
这时候,如果不细想很容易得出“PV暴增是因为内容组抓取大量内容导致”的表面结论。因为回到问题中,原现象是“14-17点,PV暴增”,现有的表面结论并没有按照小时粒度去分析,最终分析14-17点小时数据时,发现原来是因为这三个小时来了一位新访客,浏览了多篇资讯文章,然后把所有栏目都看了一遍。
所以最终PV暴增的原因应该是“新访客浏览整站”和“内容组开爬虫”共同作用引起的,而非单一项。在实际工作中,人们很容易只是看到了第一层表象就得出结论,时刻记住多深入分析,想想现有的结论是不是到最小粒度了,有没有可能是个陷阱?
好了关于数据分析的文章今天就写到这里了,希望能够对大家有帮助。
另外再告诉大家一个消息,赵阳竞价培训课程正在开课中,想要了解竞价培训课程的盆友们,可以加樱桃助理zy501873328了解课程的详情,现在加微信(或者扫二维码)可以限时免费领取价值199元的竞价试听视频课程。
加樱桃好友,还可免费获得以下福利哦~
1. 竞价员必用数据分析模板
2. 竞价疑难杂症专用优化套路之思维导图(超全)
3. 竞价员晋升所需掌握能力一览表
4.史上最全竞价干货合集
厚昌学院—百度竞价群:850434915
厚昌学院—信息流交流群: 826725915
往期回顾: