数据分析不是个事儿,来看看大神怎么做的
导读:商业数据分析,并不神秘,和其它工作领域入门一样。
下面,是数据分析的几个过程与重点项:
第一:排除异常数据
2.12日,疫情数据暴增,如果这是一张普通的商业数据表格,这一天的数据可以排除掉。仅做为部分参考。因为2.12号增加临床诊断,放在商业实战中,数据定义发生改变。所以一般,当天确定为异常数据。暂不作为分析,否则单看趋势,已经吓死人。
作为疫情数据,大家要看,因为这太重要了。如果这里是业务数据,这个数据暂不用做分析而导出结果。商业分析中,也会出现数据突变,数据分析的第一步,是先排除异常数据。
切莫直接切入分析中,会出现大量误判。
(初期数据分析岗位,运营经理,产品经理,在出现异常数据,强为之分析时,会掉进去无法自拔。)
第二:数据采样
数据采样,最少要达到一定量级。否则一般波动,变动无法分清。无法做为分析依据。
以武汉疫情举例,起初,数例,以及几十例,上百例,如果以天,画出折线图,会极端上下摆动,图表呈现无秩序状。
作为疫情数据,是民生,是科学,需要集中去观察,以及后续结果。
作为商业分析,采样数据,在几个,数十个,样本量太低,无法呈现出趋势性,此时也先放着看看,暂不分析。
第三:观察波动还是变动
波动的数据无意义,仍然不用作分析,只有变动的数据才具备分析价值。
作以1.27至,1.30,数据呈现起伏波动,暂时没有方向。作为疫情是民生,是大事,需要观察。
作为商业数据分析,波动数据,暂时只是看一看,仍然不作为结论依据。在31号,之后,数据逐日提升,是明显的数据变动,可以做为预测未来的依据了。
数据分析重点,是找出变动数据。
第四 观察增减变化趋势
根据数字变化,观察增减变化趋势。
自1.31号之后,趋势明显,逐日抬升,数字变化,是必然波动变化,趋势始终向上。
第五:找到导致增减变化的原因,改进产品和业务。
在这里疫情和商业分析方式是一致的。疫情分析,数据始终向上,已导致国内恐慌之极,已然是一场大难来临,于是,关城之后,纷纷,社区防控,两天一出门,层层加码。甚至武汉更严,所有人闭户不动。
在商业上面,所有的互联网企业,毕尽全员资金,技术,人力,无非在寻找一条昂扬向上数据,导致它的原因,究竟是什么,产品的,推广的,运营等等。
放在业务功能上,可能是运营做了推送,产品增加了功能,商务做了新的推广。
第六:变量锁定:
如果影响结果有5个因素,想知道某个因素带来影响是什么,注意要锁定其它4个,让其中一个变化,这样才可以得出结果。
再重复一下以上几个过程和重点项:
第一:排除异常数据第二:注意数据采样第三:观察波动还是变动第四 观察增减变化趋势第五:找到导致增减变化的原因,改进产品和业务。第六:变量锁定: