前记:写下题目的时候,才意识到已经入秋了。我随手查了下节气,已是白露,秋意渐浓。逝去的日子想起来总是那么快,未来的路看起来却是漫漫无边。年初我定下了写文52篇小目标,翻看下今年已经完成了50篇,这是第51篇。虽然文章阅读量大起大伏,文章内容既没定性也没定调,但总归是开始了。
言归正传。做了多年数据分析,接受过多次培训,可总感觉在边缘打转?;氐郊追阶鍪?,自然主动性更强些。借着手熟,复盘下我最近的工作心得。
数据分析,靠数据说话。与感觉、辩论不同,数据有严格的准确与错误之分。数据分析套路基本成形,踩在前人的肩膀上,我归纳了数据分析六步法:明确分析目的、建立分析思路、获取数据源、清洗加工数据、分析数据结果、提供结论及建议。流程万变不离其宗,总结干货总要借用好的思考框架,干货如下。
1.明确分析目的
做任何事,明确目的都是第一步。清晰的目的是成功的开始。数据分析有两类,一类是常规分析,一类是专题分析。常规分析一般是用来监控数据变化的,是考察业务发展的重点指标。在积累一定数据量后,企业会根据业务需要定义数据指标,建立常规数据分析体系。对于使用频率较高的分析指标和结果,企业还会建立BI系统让报表自动化,节省人力成本。
常规分析目的很明确,是前面已经确定好的。专题分析一般是临时发起的,不定期的,可能是业务指标变化要分析原因,可能是需要调整业务线分析利弊,可能是为战略发展提供方向指引。接手专题分析前了解需求方的困境和业务上想要解决的问题,是数据分析的重头戏。了解对方想从数据分析中达成的目的,在分析过程中会有如灯塔一样方向明确,航线自然也会明晰。
2.建立分析思路
确定分析目的后,就要考虑如何根据现有数据达成分析目的。建立分析思路有如制定作战计划一样,必要且重要。好的作战计划能少消耗不少粮草弹药,减少人员伤亡,好的分析思路则事半功倍。
要建立分析思路,就要对目的进行拆解,将目的达成拆解为几个因素的达成,进而对因素拆解为可执行的分析过程。整个分析路线图就确定了。
在确定分析思路时,可能需要数据分析师对自家数据、业务非常清楚,了解哪些系统中有哪些数据,数据源是否能获取,通过哪些渠道或系统获取,从而确定数据分析思路是否可行。
常规分析,常常分析思路已经形成套路,理解其中逻辑、各个数据指标含义,掌握分析方法精巧性即可。在业务娴熟后还可以优化,思考有没有更好的分析办法,优化之。
专题分析,就需要从业务出发,对目标拆解,根据现有数据做可行性分析,输出分析路线图。线上数据分析好处在于,各个关键节点数据都有记录,数据维度足够丰富,定位问题较为精准。而线下公司只有结果数据(一般是财务数据),对可能影响结果的十几个因素无法进一步区分判断和决策。
3.获取数据源
在获取数据上,需要关注两个问题:数据从哪里来,数据是否正确。
即使是在公司内部,数据源也不是单一来源,有些数据来源于bi,有些来源于财务,有些源于市场部,同时各个部门使用的同一数据指标口径也不同,数据分析师既要知道数据从哪里来,也要能够判断数据是否正确。
对数据质量判断关键在于业务理解。理解数据指标,理解数据口径,理解每个指标正常范围和量级。数据指标量级与以往不一致,一定需要核查。
即使是从数据系统中捞取的数据,也不能保证正确。系统背后也是人工写的代码,如果业务逻辑发生变化,口径发生变化,数据系统的数据也就需要更新。同时由于数据系统背后的数据来源复杂,其他系统数据源变化也会影响数据准确性。
所以,常说的数据分析师对数据的敏感性,就需要依靠数据分析师常年看数据、对数据掌握上。
而具体选取哪个口径,则要依靠业务解释,使用不同的口径对结论有什么影响?是夸大了数据结果还是缩小了?使用哪个口径对业务解释力最强,则宜使用哪个。
4.清洗加工数据
清洗加工数据,在保证正确前提下,次级重要因素是加工效率,个人有以下几点心得:
1)保持数据口径一致,尤其是数据来源不同时要格外注意。这里的“激活“和对方提供的”激活成本“中的”激活“是不是同一个口径,成功转化率是新增会员转化,还是购买转化。计算的口径要保持一致。
2)处理过程要结构化
不同人处理方法不同,效率就有高低之分。没有结构化分析的思路是这样的:想到第一步,就从第一步着手,清洗数据、转化格式,就容易出现这样的问题:走到中途后发现漏了一步,或者少想了一步,手工量就要加倍。这是典型的没有结构化思维的表现。
即使是在确定好分析思路后,处理数据,也要构建分析流程。分析思路只是在业务上提出了分析路线图:先从全量用户中抽取样本用户分析转化率,其次分析样本数据代表性,最后给出全量用户购买转化率。再细一些,通过分析样本用户浏览量、点击量、购买量分析转化率。即使是详细的分析路线图仍然不会具体到列出清洗时的步骤,就容易出现上面的口径没有调整,少取了一个指标等问题。
在执行操作时,大脑很少会再去动用思考系统,进行逻辑分析,直到出现问题。所以分析步骤还是要详列。
3)常规分析处理过程模板化
台上一分钟,台下十年功。领导一句话,员工十天班。数据分析过程繁琐,手工量大。如果能对常规分析模板化,则能省掉不少重复工作。数据源模板、数据透视模板、数据分析模板、数据结论模板,都是可以模板化的。等到下次分析,直接更换数据源就能得到数据透视结果;直接更换数据透视结果就能得到数据分析模板。这里面省掉的手工量,只有内行人懂。
4)处理过程要尽量自动化
处理过程要尽量自动化,比如分析过程中能使用函数部分就不要使用手工完成。举例,从字符串中筛选出某个值,手工办法是直接数据分列,找到第几个数据,但只要以后增加字符串,这个过程就要重来。自动化办法是使用函数,找到他们共同特征,用mid、find、left等识别字符串位置或定位具体字符。当前工作量虽然没有减少,但长期看一定是划算的。
5.分析数据结果
最重要的一步来了:分析数据结果。这步需要回答两个问题:结论是什么,从业务上说明什么。
根据业务分析目的和分析思路,在数据结果出来时,其实结论已经显而易见。但从业务理解上还要注意以下问题:
1)数值敏感性
对于每个业务指标,数据分析师都要清晰掌握指标正常范围和异常范围,数值高低背后的业务含义。数值高了是什么导致的,数值低了是什么因素造成的。
2)数据指标间关系
大部分人思维都是单因素思维,大部分数据指标间的关系也是单因素因果关系,但数据关系结构整体是网状的。一个数据指标能影响多个结果,一个结果由多种因素造成,这种关系对于习惯单因素思考的我们并不简单。有经验的数据分析师会梳理每个指标形成的原因和造成的影响的关系,构建出自己业务范围内的数据指标结构关系图。当下次数据指标变动时,就能立马形成信息回路,找到对应策略。
如果分析出数据结论明显有问题,要如何处理?这里,一则要检查自己的分析过程、数据源是否准确,数据是否有变动,一则要与相关业务人员沟通了解其业务变动。另外,还可以旁敲侧击,分析部分关联数据,用关联数据验证结论。
6.提供结论及建议
从对数据结果分析中,其实已经可以得到结论。如果是渠道代理问题,那就要和渠道商沟通,考虑是更换渠道商还是更换代理方式。如果是客流量大减,就要考虑如何引流。结论及建议自然是要根据数据分析结果得出的。只不过结论和建议更依赖业务经验。是更换渠道商还是更换代理方式,是基于业务人员对渠道商了解,对更换渠道商显性、隐性成本了解之上的。
另外,数据分析要想精进,做的游刃有余,补充提供两个tips:
1)探索数据
数据分析师要有主动性,积极思考自己负责的业务,要主动发现问题。在大脑中逐渐形成数据轮廓和数据结构图。
2)洞察数据
数据分析是个体力活,要得到一个结论,可能就需要半天或几天的功夫找数据、处理数据、分析数据。一般分析师会为了应付上级想要的各种结论疲于加班,但可能结果寥寥。高阶数据分析师懂数据,知道自己业务内数据大致情况,在上级提出新思路新想法时能大致判断是否靠谱,从而在第一时间给出回应:究竟值不值得分析。这有赖于多年数据分析后的业务洞察。
祝你在数据分析的路上越走越远!
#蔷薇记#: 记录生活之美和智慧之妙。
这是蔷薇石原创的第76篇文章。