数据驱动的5个阶段

2017-05-26 11:00:10 皇廷世家 647

随着大家越来越重视数据,现在数据部门已经是很多公司尤其是互联网公司的标配了,一个典型的数据部门会包括大数据系统架构师、大数据工程师、实时计算工程师、算法工程师、ETL工程师和数据分析师等,要想组建一个合格的数据部门,其实不是一件容易的事儿,很多大一些的互联网公司,甚至把数据部门的分工做了更细的划分,之所以数据部门越来越庞大,职能划分也越来越明确,是因为数据驱动企业的发展已经潜移默化的进入到了全新的阶段。


今儿我想来浅谈一下数据驱动在一家企业落地所要经历的5个阶段,先来看下图: 


图片关键词

从我实际的观察,结合对数据的理解,和对未来的预期来看,数据分析或数据驱动在不同的公司,在不同的阶段落地,经历了或者正在经历着这样的5个阶段:

 

1,无意识:靠经验+拍脑袋决策

2,感知数据:统计数据产生后的数据结果

3,开始思考:分析数据产生背后的原因

4,开始行动:根据数据分析的结论开始行动

5,数据驱动:让期望产生的结果产生

 

为了能够让大家清晰的理解这5个不同阶段,我就从要用什么人,用什么工具,做什么样的事儿,能够给企业带来哪些价值这几个方面通俗的讲一下,以便大家来判断你所在的企业,在数据驱动方面正处在哪一个阶段,或者是不是具备在不同阶段的能力。

 

1,企业对数据人才的需求和投入(人)

2,分析数据的工具(工具)

3,分析数据的深度(做啥事)

4,能够给企业带来的价值(啥好处)

 

一,无意识阶段:

说是无意识阶段,其实指的是在企业中,从上到下,没有什么人有强烈的数据意识,也很少有人关注除了收入和一些General指标以外的数据,而企业决策基本是靠老板拍脑袋,部门决策基本是靠有经验的人,执行层面的人几乎没有什么工具和方法论做指导,公司如果处于这样的阶段,是完全和数据驱动理念不挂钩的。

 

人:处于这样阶段的企业,基本上没有数据分析部门,也没有数据方面的人才,对于企业运营过程中的常规数据分析,基本上由产品运营人员手工做报表,定期给老板发邮件,或者汇报工作。

工具:公司自己内部没有专门开发的数据分析系统,也没有接入第三方数据分析平台。

做啥事:啥都做,就是不做数据分析。

啥好处:无法通过数据给企业带来额外的信息和价值。

 

二,感知数据阶段:

这个阶段,是关于如何回答好5W2H的,而回答5W2H的方法是通过数据统计的结果展示在各种报表和Dashboard中,再由分析数据的人员介入,跟据企业自身特点将各种数据做汇总分析,这样企业经营者就可以量化企业运营的状况了。

5W2H是指什么人,在什么时间,什么地方,做了什么,为什么做,怎么做的,花了多少成本做(Who、When、Where、What、Why、How、How Much),一个典型的公司,尤其是大量产生数据的互联网公司的如下一些部门均会产生数据:

图片关键词

对于对外的市场投放部门、渠道(联运&分发)部门是花钱的部门,投放经理和渠道经理需要实时统计的是关于花了钱获取到的用户是从哪儿来的,来的用户都是什么用户,怎么能获取到更多的用户,花多少成本才能获得,诸如此类的问题,而坦白讲,现在绝大多数企业的对外市场投放部门和渠道部门,还无法100%回答这些问题,例如来的用户都是什么用户这个问题,就不是通过单一统计数据就能得来的,很多公司甚至也不关心来的用户都是什么用户。

 

对于绝大多数公司的产品和运营部门是企业挣钱的部门,所关心的产品数据是对于用户使用产品后所表现的用户行为结果的统计数据,也可以叫用户行为数据的分析,是分析用户用了产品的什么功能,用了多久,在哪儿流失了,什么因素导致了流失,怎么吸引用户留下来,如何设计付费点,产品卖多少钱最合适等等问题的,产品数据分析是一个可深可浅的工作,说浅一些,很多公司只要接一个第三方数据分析平台,把每天产品的新增、活跃、留存、付费、流失和核心功能每天多少人参与统计了就可以了,而如果往深了做,工作量就大了,通用的AARRR模型(Acquisition、Activation、Retention、Revenue、Refer)的每一个不同阶段都可以深入下去,做不同的模型,随着用户获取成本越来越高,现在越来越多的企业不得不开始在分析产品数据和用户行为方面投入越来越多的精力。

而运维和前后端技术等部门作为企业的研发成本中心,服务器产生的大量系统日志、前后端代码性能和生产环境的Web Log分析,也被越来越多的企业所重视,哪些系统服务最吃资源、哪些程序需要优化、哪些SQL耗时最长、为什么会产生504 Code、怎么节约服务器成本等等,这些都是技术部门需要负责的工作,而有统计的数据是技术接下来解决问题的基础。

 

现在很多公司都在这个阶段,有些企业开始构建自己的数据部门,来专门做数据的统计和分析,有些企业则会选择第三方的数据统计工具,不论用哪种方式,目的都是希望能把企业各个部门所产生的数据监测和统计起来。

 

看一个TrackingIO的事件分析的截图,通过使用TrackingIO,几乎可以满足这个阶段所有对于数据统计和分析的需求。 

微信图片_20170526093718.jpg

人:在这个阶段的企业,需要有数据分析师的角色帮助各部门分析各类数据,另外各个部门的人也都需要时刻关注数据报表,及时进行分析和决策。

工具:公司可以成立自己的数据团队来开发自己的数据分析工具,也可以选择第三方的数据分析平台,不论哪种方式,都要收集足够丰富的数据,另外也要满足各个部门分析数据的基本需求,想要分析的数据可以比较方便、灵活的进行分析,市面上满足不同部门数据分析需求的产品也很多,例如热云数据就有监测市场广告投放数据的平台、分析产品用户行为数据的TrackingIO,而分析服务器性能和系统日志的例如OneAPM、日志易等。

做啥事:这个阶段,需要把各个部门所产生的数据,尽可能准确、详细的统计到,并且有可视化展现的报表可以查看,不能说想要看啥数据没啥数据,哪怕是让分析师手工查数据库也要有可查的数据。

啥好处:企业经营者可以通过数据统计的结果,感知到公司各个部门的运营情况,把各个部门的工作内容变成可量化的指标来评估。

 

三,主动思考阶段:

这个阶段是对数据更进一步的认识,是关于通过分析、洞察数据来回答为什么数据会表现出来这样的结果,是对于上面后知后觉阶段的进一步诊断,就像是一个人去了体检中心做完体检,拿到了体检报告,发现有脂肪肝,体检中心的工作人员说建议这个人去医院做进一步的检查,而针对研究这个人为什么检查出来有脂肪肝,是什么原因导致了脂肪肝,就是数据分析的主动思考阶段。

 

例如:

为什么A、B、C这3个广告平台投放的转化率低?

为什么从A渠道导入的用户留存率比B渠道导入的用户留存率高?

为什么这周的收入有明显增加?

为什么用户花了5万块钱后就流失了?

 

诸如此类的问题,均是基于数据统计的结果而进一步想要弄清楚的,但坦白讲,实际情况是统计数据容易,要想进一步回答为什么数据会呈现出这样的结果就非常困难了,搞清楚问题的成本也会增加很多,从实际的角度出发,我们不需要搞清楚为什么用户花了5万块钱后流失了,但是我们需要关注花了5万块钱后流失的用户占总付费用户的比例,假设行业平均数如果是5%,那么只要我们的这个比例不高于5%,我们就不管了,但是我们必须要弄清楚为什么我们的产品里面有20%的花了5万块钱的用户都流失了。

 

人:需要对数据进行多维分析,需要有建模能力,通过钻取、切片、切块、旋转、转轴来分析产生数据结果的原因,还需要有很强的行业知识,对数据有全方位的认知。

工具:除了对第一方数据的全面掌握以外,还需要引入行业参考数据、甚至是第三方数据,TrackingIO将试图跟踪每一个用户的行为变化,例如某用户从A产品中流失了,A产品可以跟踪到这个用户是不是放弃了A产品而选择了同类型产品,这就要借助大数据的能力。

做啥事:跟据自身产品的特点,找到每一个可量化指标的最佳参考数据,监控这些指标,当数据指标不在预期范围内的时候,快速查找原因。

啥好处:对于影响企业运营核心指标的相关因素进行监控,当核心数据的表现不在预期范围内的时候,能够清晰的知道是哪些原因导致的,从而做出合理的决策。

 

四、开始行动阶段:

就好比一个人体检查出来有脂肪肝,医生说是由于吃油腻的食物和缺乏运动导致的,那么要想恢复健康,就必须要付诸行动,这是一个关于实践的阶段,企业基于对数据的积累,结合分析数据的结论,进而对市场投放、对产品功能优化等做出来的实际调整,以便获得想要的结果。

 

如下问题均是关于如何实践和行动的:

如何通过积累的数据来优化移动广告投放效果?

如何通过数据分析的结论,结合A/B Test来优化产品,提升产品留存率?

如何通过用户历史的行为,预测用户下一步的行动?

如何通过分析用户的行为,给用户推荐喜欢的产品和功能?

 

有一点需要区分一下,企业每天都在行动,即便没有数据分析结论产品都要改,广告都要投放,我们这里说的行动,指的是基于对数据做了大量的分析,在得到结论或者数据模型之后,对产品做的优化,给用户提供不同的产品体验,例如今日头条是基于对用户行为的长期跟踪的分析建模,对每个用户做的个性化推荐。

 

人:包括数据部门在内的各个部门需要进行联动,将分析结论和实践结合起来,让数据结论不止停留在报表上,要让数据在产品和营销中流动起来。

工具:能够让数据模型、结论和线上的生产系统结合起来,数据不只是报表或者报告,会变成API接口实时和生产系统进行交互。

做啥事:通过实际行动来改变数据结果,或者预测接下来要产生的结果。

啥好处:数据分析不仅仅是辅助决策,可以变成影响结果的价值工具。

 

五、数据驱动阶段:

假设一个人的各项健康指标,都有实时监测和预警,身体也可以根据各个指标的反馈,来调整身体机能来避免不必要的疾病产生,那么人是否就会保持健康和长寿呢?

 

现在多数企业都在从第二个阶段向第三个阶段过渡,也有很多企业正在借助数据能力做实际的行动来优化数据结果,而现在看来,企业要具备全面的数据驱动能力,还有很长的路要走,这也是整个大数据行业未来要解决的问题,无论是数据分析的工具、还是数据积累本身都需要做很多的创新和积累。

 

我们正试图为企业提供更强大的数据分析平台工具,尽可能开放更多的数据,来帮助企业实践,我希望有越来越多的企业进入第四个阶段,即不只是分析数据,还要有正确和有效的行动,甚至将来到第五个阶段,全面数据驱动的阶段。

对于这个阶段的人、工具以及要做什么事儿,现在讲有些为时尚早,到底数据能否发挥出那么大的价值,是以何种形式来驱动企业发展的,需要我们共同来创造。