第一:统计学知识。(推荐学习:Python视频教程)
这是很大一部分大数据分析师的短板。当然这里说的不是简单的一些统计而已。而是包括均值、中位数、标准差、方差、概率、假设检验等等具有时间、空间、数据本身。差不多应该是理工科的高等数学的知识,甚至还高一点儿。要能够建模,要不然你分析出来的结果离实际相差十万八千里的话,估计要不了几天,你就会被卷铺盖走人了。当然,做个一般的大数据分析师,就不会涉及到很深的高等数学知识了,但要做一个牛B的大数据分析师,还是要学习学习再学习。
第二:很多人想不到的,你还是把EXCEL玩熟悉吧。
当然不需要掌握的高大全,也得要掌握常用的函数,比如重点包括但不限于sum,count,sumif,countif,find,if,left/right,时间转换,透视表,各种图表做法等之类的。如果数据量不算是特别大的话,Excel能够解决很多问题。比如,筛选部分赃数据,排序,挑选满足条件的数据等等。
第三:分析思维的练习。
比如结构化思维、思维导图、或百度脑图、麦肯锡式分析,了解一些smart、5W2H、SWOT等等那就更好了。不一定要掌握多深多全,但一定要了解一些。
第四:数据库知识。
大数据大数据,就是数据量很多,Excel就解决不了这么大数据量的时候,就得使用数据库。如果是关系型数据库,比如Oracle、mysql、sqlserver等等,你还得要学习使用SQL语句,筛选排序,汇总等等。非关系型数据库也得要学习,比如:Cassandra、Mongodb、CouchDB、Redis、 Riak、Membase、Neo4j 和 HBase等等,起码常用的了解一两个,比如Hbase,Mongodb,redis等。
第五:业务学习。
其实对于大数据分析师来说,了解业务比了解数据更重要。对于行业业务是怎么走的对于数据的分析有着非常重要的作用,不了解业务,可能你分析的结果不是别人想要的。
第六:开发工具及环境。
比如:Linux OS、Hadoop(存储HDFS,计算Yarn)、Spark、或另外一些中间件。目前用得多的开发工具python等等语言工具。
总之,要做一个高级或总监级的大数据分析师那是相当的烧脑的。要学习了解的东西如果只是单纯的数据方面的话,那业务和统计知识的学习是必不可少的。如果是实用型的大数据分析师可能只掌握某些部分就可以。大数据开发工程师的话,基本就是掌握开发环境、开发语言以及各种图表的应用,也是可以满足的。毕竟,一个公司要团队协作,一人懂一部分就可以搞出分析产品出来了。认定一项事情就去干!越干越轻松,越干越牛B!
更多Python相关技术文章,请访问Python教程栏目进行学习!
以上就是python数据分析师需要学什么的详细内容,更多请关注其它相关文章!