推荐干货 | 微软认证讲师分析小白发展四阶段,教你用Excel做数据分析

数据分析2017-12-07 19:42:25

你了解数据分析吗?你知道从哪里获取数据吗?你知道用怎样的工具去做分析吗?分析的方法论和框架又是什么?这些问题对于零基础数据分析师来说看似简单但却都回答不全。但是当你了解了数据分析师的每一个成长阶段,看完这篇文章,这些问题也都迎刃而解了。


今天小编特意邀请到金牌数据分析讲师吴老师为大家分析分析数据分析师的四个发展阶段以及如何用Excel做数据分析(包括如何撰写报告)。大家可以对号入座,自审一下自己已经到什么阶段了,下一步又该如何调整。


前大华集团Java大数据实务项目专家

大智慧大数据分析高级工程师

北风网数据分析金牌讲师

微软认证讲师(MCE)


大家好,我是微软认证就职于北风网的数据分析金牌讲师,感谢小编的邀请,能够有机会与大家分享一下数据分析的行业知识。今天主要是讨论一下零基础数据分析师的四个发展阶段零基础如何用Excel做数据分析两个大问题,希望能够帮助到你。


对于零基础小白来说,不是靠着硬实力就能一步登天、快速变身数据分析科学家,而是软硬皆施。既要有清晰的逻辑思维、创新思维这样的软实力,搭配上统计学、机器学习、数据分析方法、理论知识的硬实力,才能真正的入门数据分析师。


先来看看数据分析师发展的四个阶段:

1
数据专员

第一阶段就是数据专员,大大小小的公司都需要配备一位分析师,只要懂得Excel、ppt,具备该行业经验,就很容易被企业相中。


此时的数据分析师就是给领导或者同事导出产品运营的数据报表,整合下出个报告。统计学知识基本用不上,因为领导和同事也看不懂,他们只需要某个数据能够反馈出产品改进、运营的效果即可,所以这类数据分析师的工作比较机械,但是对于自己所在的行业产品还是很熟悉的,相对而言,比较适合刚刚入门的新手或者刚刚毕业的大学生。


这个阶段最好要学会VBA,会做透视表、熟练用筛选、排序、公式等操作。

2
数据专员-数据分析师

第二个阶段就是数据专员-数据分析师的转变过程。


这个阶段必须学会SQL,熟悉行业知识、公司业务及流程,最好有自己独到的见解,若脱离行业认知和公司业务背景,分析的结果就没有太大的使用价值。


加上第一阶段的那些知识,此阶段的分析师一般都就职于传统公司和互联网小运营、产品团队。所以为了更进一步成为真正的数据分析师,那就学习数据库和统计学吧。


数据库对初级的小白来说还没有入职前可以学习MySQL,入职后如果不一样就看公司用什么,你就学什么。

3
数据分析师

第三阶段就是成熟的数据分析师


此阶段的分析师熟练掌握了数据库与统计学,统计学主要学会主成分分析、假设检验、描述性统计、贝叶斯、回归、广义线性回归这几个概念,也可根据自己想去的行业选择性学习,比如时间序列、非参之类以及线性代数等学习方向。


此阶段分析师掌握这些技能以后就能从事与互联网业务、传统公司业务的相关工作了。

4
前景选择

第四阶段就是自我裂变、向上生长的过程。


当你的基地打造牢固以后,就可以建高楼了。这时有很多方向可以供你选择,数据分析师可选择的方向:


数据分析师(数据科学家)、BI、ETL工程师、大数据工程师、数据工程师、数据挖掘、爬虫工程师、可视化工程师


精进统计学,熟悉业务,机器学习会使用(调参+选模型+优化),取数、ETL、可视化等等基本都懂的就是数据科学家。


当然这个阶段工具的使用也不容忽视,不往大数据方向的可选R、Python语言,大数据方向可能会用到scala和java。


可视化(选学):tableau、plot.ly、d3.js、echarts.js,R里面的ggplot、ggvis,Python里的bokeh、matplotlib、seaborn都不错。

如何用Excel做数据分析

了解到数据分析师发展四阶段以后,我今天教你一个入门级的小技巧——如何用Excel做数据分析


数据分析有五个阶段:

第一阶段 数据收集

数据收集对小白来说可能会有点困难,大家可在文末申请我的试听课后获取数据收集资源(45个公开数据网站以及部分国内外权威的数据统计网站)。这一步就叫一手数据,指的是可以直接获取数据的方式,二手数据就是经过他人加工处理后得到的数据。


我们使用的网站都是未经过处理的公开数据网站,可以自行获取。

第二阶段 数据处理

Excel是该阶段的主要工具,可使用数据重复【(COUNTIF函数),删除重复项】先对重复数据做一个筛选,将多余的、错误的、重复的数据统统删掉。

这个时候要用到一系列函数:


数据重复【(COUNTIF函数),删除重复项】

缺失数据【IF And Or 嵌套函数等】

数据抽样【Left,Right,CONCATENATE(文本1,文本2....),VLOOKUP】

数据计算【AVERAGE、SUM、MAX、MIN,Date,If】

数据分组【VLOOKUP函数,采用近似匹配,SEARCH函数】

数据抽样【RAND函数,RAND()】


等等很多函数可根据不同需求配合使用,在我的试听课程中也会详细讲解各类函数如何使用。这一阶段的目的就是从大量且分类不清、难以看透的数据中推导出能解决问题、有意义的关键数据。

第三阶段 数据分析

这就是最关键的一步了,这里给大家介绍5种分析法:


1.漏斗图分析法


漏斗图主要提供用户在活动中的转化率和流失率,也能揭示各种活动在各个渠道受欢迎的程度。唯一的缺陷是单一漏斗图无法评价活动中某个关键流程中步骤转化率的好坏,但是通过前后对比或者不同活动、不同用户群的漏斗图对比,就能发现其中所存在的问题。



2.矩阵关联分析法


关联矩阵法是常用的系统综合评价法,它主要是用矩阵形式来表示每个替代方案有关评价指标及其重要度和方案关于具体指标的价值评定量之间的关系。


3.对比分析法


常见的如完成值与目标值的差距,这个月与上个月的对比,同公司间各部门的对比,竞争对手行业内对比,这里要注意的是计算范围计算方法要一致,对象要一致,指标类型要一致。


4.交叉分析法


这种分析法主要用于分析两个变量(字段)之间的关系,即同时将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量成为不同变量的交叉节点,形成交叉表,从而分析交叉表中变量之间的关系,所以也叫交叉表分析法。spss是这种分析法高频使用软件。


交叉表还有二维以上的,维度越多,交叉表会越复杂,所以选择几个维度的时候需要根据分析的目的决定。


5.杜邦分析法


杜邦分析法利用各个主要财务比率之间的内在联系,建立财务比率分析的综合模型,来综合地分析和评价企业财务状况和经营业绩的方法。采用杜邦分析图将有关分析指标按内在联系加以排列,从而直观地反映出企业的财务状况和经营成果的总体面貌。


根据不同需求使用最快捷的分析法,有效得到数据反馈信息就是该阶段的目的。

数据展现

根据数据关系选择图表:


  • 成分:饼图、柱形图、条形图、瀑布图

  • 排序:柱形图、条形图、气泡图、帕累托图

  • 时间序列:折线图、柱形图

  • 相关性:散点图、柱形图、对称条形图(旋风图)、散点图、气泡图

  • 多重数据比较:雷达图

图表注意事项:


  • 信息完整:图表标题、单位、图例、脚注、来源

  • 避免无意义的图表

  • 一表反映一个观点

  • 只选对的不选复杂的图表

  • 标题一句话阐述清楚反映观点


该阶段是在前三个阶段的基础上做出成果展示,清晰明了的展示出数据所反馈的信息。

报告撰写

报告指的是对社会经济现象的某一方面或某一问题进行专门研究的一种数据分析报告,数据分析报告的作用:展示分析结果、验证分析质量、提供决策依据。


报告类型:

  • 综合分析报告


概念:能够全面评价一个地区、单位、部门业务或其他方面发展情况的一种数据分析报告

特性:全面性、联系性


  • 日常数据通报

概念:以定期数据分析报表为依据,反映计划的执行情况,并分析其影响和形成原因的一种数据分析报告。

特性:进度性 规范性 时效性


  • 数据分析报告结构


标题类型:解析基本观点 概括主要内容 交代分析主题 提出问题

标题要求:直接 确切 简洁 

报告目录

前言

分析背景:为何开展此次分析?有何意义?

分析目的:通过此次分析要解决什么问题?达到何种目的?

分析思路:如何开展此次分析?主要通过哪几方面开展?


正文

是报告最长的主体部分,包含所有数据分析事实和观点,通过数据图表和相关的文字结合分析,正文各部分具有逻辑关系


结论和建议  


感谢大家的耐心阅读。对零基础学习数据分析感兴趣的童鞋可以点击【阅读原文】报名参加我的试听课哦!建议大家平时多在意细节,毕竟数据分析本身就是个又慢又费脑的细致活,希望这篇分享对大家有用。


可加入北风网零基础学习数据分析交流群,领取干货,相互交流学习。好了,今天我的分享就到此结束了。


快加入我们吧

此处插播一条有诚意有心意的硬广:

北风网双12活动优惠详情通告


12月6-8日期间报名任一就业课程:888代金券+1880北风VIP6最高会员+价值500元以上配套教材+500元北风限量学习卡

12月9-12日期间报名任一就业课程,666代金券+1880北风VIP6最高会员+价值500元以上配套教材+500元北风限量学习卡。


点击【阅读原文】报名试听课程,申请试学课程后可入学习交流群获取45个公开数据网站以及部分国内外权威的数据统计网站一切从获取数据开始。

阅读原文