766培训网
电脑培训
数据分析师会哪些工具

数据分析师会哪些工具

发布时间 :2021-02-03 11:30:35 浏览量:567 收藏
导读:

工欲善其事,必先利其器。想要成为一名优秀的数据分析师,一款顺手的数据分析工具是必不可少的。那么数据分析师会哪些工具呢?现在就来看看吧。

数据分析师会哪些工具

数据分析师工作中经常用到哪些工具

1、EXCEL数据分析工具

这个工具对于我们来说并不陌生,在我们平日的工作中经常会遇到,EXCEL工具具有强大的功能。

学习知识点:学习EXCEL的各种应用函数:Vlookup、sum,count,sumif,countif,find,if,left/right,时间日期函数、文本函数。

EXCEL数据透视表相关应用的学习,Execl多年来拥有很多强大的功能,但是对于数据分析而言,透视表功能则是在数据分析领域的强项,之前我们说过没有完美的软件,但是我们在选择软件的时候一定要选择这个软件的有点,一个适合自身工作的用途,所以在这里我们向数据分析师推荐Excel透视表功能。

如果数据分析师掌握了数据透视表功能是非常实用的,对数据分析工作可以提高很大的工作效率。

掌握了Excel的透视表功能可以让一个数据分析初学者很快的领悟到数据分析的思路,可以更深入的对数据分析有着概念性的理解。

2、数据可视化工具的选择

现今数据可视化有很多种,我们最常用到的可视化工具有Excel、PowerBi这两个可视化工具在数据分析领域已经很有代表性,完全可以满足数据分析师在工作中所需要的一些功能,可以大大的提高数据分析师的工作效率。

3、其他软件

1 数据采集:作为一个CPDA数据分析师来说,数据采集是必不可少的一个步骤,得到准确的数据才是为今后的数据分析工作打好基础,最终的数据分析得出来的结论越准确,数据分析师对于数据采集经常会用到一些辅助语言,目前比较流行的语言:Python我们利用Python来编写网络爬虫,从而从网络中得到更多的数据,这也是作为CPDA数据分析师要掌握的一门语言。

SPSS统计分析软件这个软件可以很好的对我们的数据进行聚类分析统计,通过我们制定的数据规则,为我们的数据进行初期的简单统计分析,给我们一个大概的数据结构,以上是数据分析师应该掌握的一些基本软件。

4、 数据分析师线上数据分析Datahoop平台

不仅提供日常学习和考试练习的环境,更能帮助您在工作当中有效的提高工作效率;当您成为CPDA学员时,您便获得了Datahoop平台为广大CPDA学员提供长期且免费基础功能服务。

数据分析师需要会什么

1、Excel

让我们一起面对它吧,即使在高水平语言辈出的年代,Excel工具仍旧被很多人所认可。调查发现59%的数据科学家和分析师使用 Excel 工具,这个数据几乎年年如此,少有变化。Excel 是经过检验的可靠的数据分析工具,它广泛存在,非程序人员也能便捷操作,所以大多数企业即使也使用其他工具,但 Excel 工具还是他们的不二选择。

2、R语言

R语言主要适用于EDA(探索性数据分析),也就是你与数据之间的对话,是通过作图来找寻单变量,双变量或者多变量之间的关系,进而发现其相关性。

他的学习也不是很难,掌握了基本操作,要掌握核心的几个包(package),然后经常性的练习,善于借助帮助文档,所谓熟能生巧,就是这个道理。

3、Python

人生苦短,我用Python。

Python语言是一门功能非常强大,实用型非常强的语言,Web编程,网络爬虫。

数据分析自然少不了要掌握pandas和numpy两个包,如果用到数据可视化(后面会讲到),肯定要用matplotlib包,这三个包基本上就是Python进行数据分析的半壁江山以上了,好好掌握,不能将就。

4、Google Refine

Google Refine。用户在电脑上运行这个应用程序后就可以通过浏览器访问之。这个东西的主要功能是帮用户整理数据,接下来的演示视频效果非常好:用户下载了一个 CSV 文件,但是同一个栏中的同一个属性有多种写法:全称,缩写,后面加了空格的,单数复数格式不一的。。。但是这些其实都代表了同一个属性,Google Refine 的作用就是帮你把这些不规范的写法迅速统一起来。

数据分析师需要什么技能

具有Hive/Pig/Spark等大数据分析工具相关使用经验:hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。

熟练使用SAS、5PSS、R、Excel等相关工具,并具有较好的报告呈现和数据解读能力:其中SAS (Statistical Analysis System)是一个模块化、集成化的大型应用软件系统。它由数十个专用模块构成,功能包括数据访问、数据储存及管理、应用开发、图形处理、数据分析、报告编制、运筹学方法、计量经济学与预测等等。SAS系统基本上可以分为四大部分:SAS数据库部分;SAS分析核心;SAS开发呈现工具;SAS对分布处理模式的支持及其数据仓库设计。

熟悉MySQL等关系型数据库:MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,目前属于 Oracle 旗下产品。MySQL 是比较流的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是比较的 RDBMS (Relational Database Management System,关系数据库管理系统) 应用软件。

熟悉至少一种脚本语言(Shell,Python等),能独立完成相关的数据处理工作:Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中,有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。