第一阶段:Excel
每一位数据分析师都脱离不开Excel。这一阶段主要就是学习Excel的透视表、函数等等操作,能够使用excel进行简单的数据分析与可视化报告。
第二阶段:SQL数据库语言
作为数据分析人员,我们首先要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,因此你可以不会R,不会python,但是你不能不会SQL。主要了解数据库查询语言,where,因此你可以不会R,不会python,但是你不能不会SQL。主要了解数据库查询语言,where,limit,and和or的逻辑,时间转换函数等。
推荐书籍:《MYSQL必知必会》
第三阶段:数据可视化
数据分析界有一句经典名言,字不如表,表不如图。实际上除掉数据挖掘这类高级分析,不少数据分析就是监控数据和观察数据。除此此外,数据分析的大多时候都是要兜售自己的观点和结论的,而兜售的最好方式就是做出观点清晰数据详实的PPT和报表给老板看。
可视化的工具有很多,这里我推荐Tableau(国外)或者FineBI(国内),FineBI是国产的用起来方便点。这两款都不要编程功底,实现起来简单,功能强大。
推荐书籍:《用图表说话》-麦肯锡
第四阶段:数理统计学
这里我们需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(T检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。
推荐书籍:《从零进阶 数据分析的统计基础》-曹正凤
第五阶段:SPSS
SPSS是统计分析入门软件,如果你想快速入门而又不想学习编程,我推荐使用SPSS。学习SPSS的重点并不在于软件本身,而是相关的统计学知识,这也是在前面建议你铺垫的,也就是你要学会怎样去分析“输入数据后,软件给你呈现的结果”。
推荐书籍:《如虎添翼 数据处理的SPSS/SAS EG实现》-徐筱刚
第六阶段:数据挖掘
学习算法模型包括线性回归、逻辑回归、主成分分析、因子分析、聚类、关联规则、决策树、随机森林、支持向量机、贝叶斯、神经网络等,建议选择一门编程语言来学习。
Python或者R语言,这一点是必备项也是加分项,在数据挖掘方向是必备项,语言相比较工具更加灵活也更加实用。
推荐书籍:《笨方法学Python》《像计算机科学家一样思考》《Python数据科学手册》《利用Python进行数据分析》《数据科学入门》
第七阶段:数据分析行业应用和数据分析思维
对于数据分析师来说,业务的了解比数据方法论更重要。当然很遗憾,业务学习没有捷径。平时可以多看一些行业报告,熟悉行业的业务和商业模式,对你有好处。
推荐书籍:《增长黑客》;《精益数据分析》
当前有不少计算机专业的同学会从事数据分析岗位,相比于传统的开发岗位来说,数据分析岗位有三个优势,其一是岗位附加值相对比较高,其二是职业生命周期预期相对比较长,其三是行业覆盖面比较广,选择空间比较大。
对于计算机专业的同学来说,如果要从事数据分析岗位,一定要做好发展规划,除了要重视技术积累之外,更重要的是要注重行业知识的积累,毕竟数据分析与行业场景的关系非常紧密。
从产业互联网发展的大趋势来看,未来数据分析岗位的发展前景还是非常广阔的,一方面数据分析是大数据进行数据价值化的主要方式之一,另一方面在数字孪生等新兴技术领域,数据分析岗位同样有非常重要的地位。
数据分析岗位早期对于计算机专业的同学并不算太友好,计算机专业的同学在竞争数据分析岗位时,往往也要面对数学、统计学、金融学等专业同学给予的竞争压力,但是近几年数据分析岗位对于计算机专业的同学正在变得友好。
之所以数据分析岗位对于计算机专业同学逐渐变得友好,原因主要有三个方面,其一是数据分析方式的变革,其二是数据分析技术平台的变革,其三是产业互联网的推动。
从技术发展的大趋势来看,未来计算机大类专业的同学,要想在数据分析领域走得更远,一定要充分发挥自己的专业特点,要懂得借助数据分析平台的力量,同时要重视机器学习和深度学习相关知识的运用。
相对于统计学的数据分析方式来说,机器学习的数据分析方式是相对“暴力”的,但是机器学习的数据分析方式往往更适合以物联网数据为主的“低价值数据密度”时代。
我目前就在给计算机专业研一的同学上数据分析这门课,这门课也是目前我仅保留的两门授课任务之一,还有一门课是机器学习,实际上这两门课程之间也有比较紧密的联系。
本文来自投稿,不代表DoDo生活网立场,如若转载,请注明出处:http://www.77dodo.com/aiwen/47179.html