前言
因为在实习的过程中,明白了工作中,数据、业务、人的重要性,我们之所以需要数据分析思维是因为人的直觉思维容易出错,而数据分析思维会强制使用理性思维。
所以花了一段时间,彻底的学习了数据分析的底层思维。以这篇文章做个总结,详细思维导图如下:
因此本篇文章对其数据分析的核心思维做一个简单的总结,方便在具体的工作中进行实操
核心思维:目标思维
数据分析的核心思维是目标思维,搞清楚目标比搞清楚要怎么做更加的重要,因为有时候业务方直接问的问题,并不是他们的真正目标,比如业务方想要知道如何和提升新用户人数,实际上新用户人数应该和具体活跃率、留存率、分析率有关,这个才是我们应该关注的真正目标。
同时,我们报告的目的不仅仅是讲清楚,而是我们的建议被听进去。
这个时候,就要求我们能够在理清楚目标的基础上,进行客观严谨的分析,其中有一个核心的观点是:
客观严谨=事实+论证过程+观点
其中:
事实:可验证、具体数据
论证:说明分析方法(演绎、归纳、类比)
观点:不预设立场、需要假设检验的观点
当我们首先理清楚了自己的目标,同时能够保证自己进行客观严禁的分析(从事实、论证、观点三个角度出发),后面的工作才有价值,否则就是在错误的方向上一直深耕,效果反而差强人意。
基础能力构建
指标思维
指标是用来衡量我们是否达到了目标的标准。
在工作中,我们常常会获得一大堆的数据,数据和指标之间的关系是所有指标都是数据,但不是所有数据都能成为指标。只有据被用来衡量某个目标的进展时,它才成为“指标”。 更直观的说,数据是碎片化、无方向的,比如“用户A在10:03打开了App”,而指标是有目标、可比较、能指导行动,比如“今天有100万人打开了App” → 日活(DAU)。
同时,如果我们用单一的指标来看待问题的时候无法完整描述复杂系统,并且容易产生幸存者偏差或指标失真。
所以我们要尝试去构建指标体系,这样去制作相互关联、覆盖业务全链路的指标组合。
具体构建指标体系的步骤分为四步:
步骤一:确定主指标(使用OSM模型)、其中O为Objective目标,考虑的是用户为何用产品;S为Strategy策略,考虑的是我们如何去满足用户的目标(即需求),而M为Measurement度量,考虑的是我们用哪些指标来证明我们的策略有效。
而主指标通常是最能反应业务成败的核心指标(通常为1-2个)
步骤二:拆分子指标、子指标的意思是把主指标,按照公司、部门、个人,去拆解到每个具体的个人负责的小目标。比如一个公司层面关注的总营收,到部门层面就是市场部关注的获客成本、产品部门关注的功能使用率,最后到个人就是具体的员工执行。拆分子指标的好处是责任到人,避免内耗,同时可以将大的目标拆解成可衡量、可改进的工作。
步骤三:拆分过程指标、过程指标是体现达成结果的关键行为或者中间步骤的数字,我们需要能够每天都能看到,并且及时调整的过程指标。这样才可能保证业务的可控和指导我们要干什么,我们需要过程指标的原因是结果指标反应的是最终的成果,但是它只能事后看到,无法提前改变。所以在业务分析的时候,我们提的建议必须落到过程指标。
步骤四:添加分类维度、同一个指标,在不同的维度下含义是完全不同的,比如日活=100W,如果不分维度的话是一个看起来不错的数据,但是如果分类维度的话,我们可能会发现比如广东地区的日活下降了30%,所以我们必须给自己的指标添加分类维度,常见的分类维度有(时间、地域、渠道、用户群、商品类型等)
逻辑思维能力
从业务的角度出发 ,我们进行业务分析的时候,必须使用逻辑推理和结构化的思维去对业务方讲解我们的分析思路,这就要求我们用科学的方法去讲解,而不是自己纯属臆测分析。
常见的逻辑推理的方法有三种,演绎法、归纳法、类比法。
演绎法指的是如果前提正确、则结果一定正确。经典的形式是三段式,比如所有的哺乳动物都用肺呼吸,鲸鱼是哺乳动物,所以鲸鱼用肺呼吸。这样的优点是严谨可靠、但是如果大前提错了,那么结论就是错的,比如成绩好的学生不玩手机(大前提错的,这是偏见),小前提是小明玩手机,那么这个时候我们得出的小明成绩差的结论也一定是错的。
归纳法指的是通过多个例子总结规律,比如我见过的天鹅是白的、你见过的天鹅也是白的,欧洲人见过的天鹅都是白的,那么可以得出结论:所有的天鹅都是白的,这种方法的优点是从现实出发,适合探索新问题,但是同样有自己的缺点,那就是容易以偏概全,因为人们后来在澳洲发现了黑天鹅,结论坍塌。
类比法指的是通过相似性推理,比如A和B很像,A有某种性能,所以B可能也有。比如地球有水、有大气、有生命,而火星也有水也有大气,所以火星也可能有生命。这种分析优点是启发思路,用于创新或者假设,但是同样存在一定的问题那就是表面相似不一定等于本质是相同的。
除了常见的逻辑推理方法,在分析具体的业务的时候,我们还需要结构化的思维,结构化的思维就是把大的问题拆分为小的问题,常用的方法有两个,一个是议题树,一个是MECE。
其中议题树指的是不断的问这些问题是由哪些子问题组成的,不断的去拆解。而MECE则是相互独立、完全穷尽的去拆解,这样各个部分不重叠,但是所有部分加起来可能覆盖全部。MECE的问题是,事实上我们可能无法完全去穷尽所有的问题,同时根据二八法则,可能是通过解决百分之二十的问题完成了百分之八十的目标。
最后我们需要的是一种系统性的思维,因为局部的最优解不一定是整体的最好解,通过系统性的思维我们才能看清楚事物之间的连接和影响链。比如公司为了省钱裁了客服团队,从局部来看人力的成本降低了,但是从业务的角度来看用户问题没人解答、从而导致了满意度下降、然后导致差评增多,新用户下降,老用户也流失了,最终公司亏损更多的钱。
如何去使用系统性的思维,就要求我们去思考这个改变会影响哪些的其他缓解,从长期来看和从短期来看这个改变的影响是什么,有没有隐藏的副作用。
最后总结一下,当我们遇到一个新的业务问题的时候,我们需要用结构化思维去拆解问题,列出可能的三个原因,然后在用逻辑推理验证每个原因,分析其为事实还是臆测,最后用系统性的思维去想想我们这么做的后果。这样思维清晰,行动就会更加高效有效果了。
常用的分析工具
在数据分析的过程中,我们常用的分析工具有三个,5WHY法、假设树、是否树。
其中,5why是一种通过连续追问“为什么”来追溯问题根本原因的分析方法,其核心在于打破砂锅问到底,直至找到可解决的根本原因。它不限定只问5次,而是持续追问直到根本原因,强调从结果着手,沿着因果链条深入分析,避开主观假设和逻辑陷阱。
而假设树,则是面对复杂的问题,不要等所有的数据,先提出几个合理的假设,然后用事实快速验证哪些假设最可能成立,这种适合面对时间紧,信息少,需要快速行动的业务场景,典型的三步法是(提出假设、列出验证条件、收集事实),最后得出结论。
是否树指的是,把一个判断型的问题,拆解为一系列的是否问题,像走迷宫一样,最终走到明确的建议,它的前提是问题的答案可以穷举,具体的执行就是从一个问题开始,每一步只有两个分支,一直问到是到得出具体行动建议。
通用分析流程(2W1H模型)
所谓的2W1H法,是指定义问题(What)、明确目的(Why)、提出方案(How)的三个步骤,也是问题拆解的三步法。
定位出真正的问题
其中,在定义问题这块, 我们需要分析问题的本质,也就是目标与现状的差距,这个时候,我们需要分析清楚,Question和Problem的区别。比如我们面临的Problem是用户流失严重,实际上要解决的Question的为什么留存下降。
在这个阶段,我们会犯三种常见的错误:
把直觉当做事实
目标与现状没有对应
目标不是业务指标。
那么我们如何去找到确定业务问题的指标,这个时候要从两个方面入手:确定指标和确定数据。确定指标指的是我们要关注是否指标不合理、是否指标的数据口径不一致、是否数据获取存在问题。
在搭建任何业务数据分析的流程链路的时候,第一步永远是搞清楚,自己要解决的问题是什么。
明确目的
搞清楚分析的目的,可以评估分析的价值,从而调整分析需求的优先顺序。
在这块我们要进行两方面的工作,找到表面原因和找到根本原因,从而决定分析的深度和优先级。
找到表面原因
如何找到表面原因,表面原因指的是,问题集中在哪个缓解,能用业务指标找出来的问题。这个时候我们要找到的表面原因一定是可量化,可归因的。
找到表面原因,也有标准的步骤:
排除数据错误
缩小问题范围
定位具体的环境
我们首先要做的是排除数据错误,看是不是问题是真实的,而不是假数据产生的误报,比如数仓存在问题或者服务器宕机了没记录到问题的数据,有时候可能真正的问题不是业务问题,而是客户管存在BUG,用户无法打开。这个步骤的目标是确定事实是否成立。
如果已经排除了数据错误,确定了确实存在这个问题,那么我们要做的是缩小问题的范围,不能大海捞针的去分析,而是选择小于3个最可能的维度去分析,这样效率更高。比如子指标、渠道、用户群体。
最后我们想要定位到具体的环境的时候,就需要我们用到最初的过程指标去定位问题到底卡在哪一步,这样定位出的问题就是一个可以去量化的并解决的问题,比如用户从看到广告到成为活跃用户,需要经历这么几个环境:
看到广告 → 点击 → 进入落地页 → 填写手机号 → 验证码 → 注册成功 → 完成新手任务通过分析我们发现60%的人进页面就走了,所以问题就在落地页的涉及,这个时候我们可以得出表面的原因是落地页跳出率高导致注册离流失。当问题被定位出来后,解决方案就自然而然出来了。
找到根本原因
而根本原因则需要用户思维,去思考用户真正想要的是什么,要从行为链路上去具体分析,比如(引发兴趣、收集信息、评估价值、做出决策)。在找根本原因的时候,我们就可以用到上述所说的假设树,比如用用户属性出发、从用户的需求链路出发,分别去假设不同属性的用户(画像属性、行为属性)对产品的不同决策最后让业务方去验证,通过数据排查找到根本原因;而从用户的需求链路出发,则是如果问题能用用户思维解决就根据用户思维提出假设,如果不能用用户思维解决就用行为数据还原场景,列出用户的使用链路(这个时候可以用漏斗图分析数据)最后根据链路图提出假设。
根本原因比表面原因能更好的解决问题,具体的方法就是提出假设、验证假设,在这个过程中,与业务人员沟通是提出假设最高效的方法。
如何写出好的数据分析报告
我们首先要知道,数据分析不只是展示我们会算数据,而是能让别人愿意去行动,因此建议越具体越可以执行,同时也越容易被采纳。
好的报告,一定是把建议放到最前面。
为了写出一份真正能够推动改变的报告,我们一定是一套标准的结构去展示,这样的报告一定不是先讲故事再给结论,而是倒过来,其具体如下:
分析背景
我们要解决什么什么业务问题
现状和目标的差距
为什么是现在解决
结论与建议
三级递进
分析框架
我们采用的方法(5Why?漏洞分析?
我们的指标体系(主指标是什么,过程指标是什么,子指标是什么)
事实与分析的过程
数据(漏斗图展示)
推理逻辑(维度分析、根本原因分析)
重申建议并且号召下一步行动。
其中为了写好我们的结论与建议,我们应该是分为三级的建议,这样做的好处是找到具体的执行方案的建议能够立刻去解决,能够指导具体的行动,其在具体的业务场景下是分为给方向、给策略、给方案三步走,举一个具体到业务场景为例,其三级建议对照表如下:
总结
最后我们来重申一下数据分析思维的重要性,我们进行数据分析,并不只是简单的用Excel、PowerBI或者Python、Mysql去取数炫技,而是真正能指导业务去进行下一步行动,如果没有一套体系化的数据分析思维,就是盲人摸象,很容易以偏概全或者因为主观臆测产生各种问题影响工作的开展。
总结一下这套思维:数据分析的核心是目标思维,我们要先厘清真实业务目标,再构建指标体系(主指标+过程指标+维度),用逻辑推理(演绎/归纳/类比)和结构化工具(5Why、假设树等)定位可量化原因(表面原因),同时从用户思维的角度去分析问题的根本原因,最终提出具体、可执行的方案三级建议(方向、策略、方案),推动业务行动而非仅呈现数据。
可是讲了这么多,其实最有价值的那部分,实际上是我们在业务中,有意识的对照这个这个思维流程去实践,知行合一。