数据结构论坛

注册

 

发新话题 回复该主题

数据分析你学废了嘛 [复制链接]

1#
关爱青少年儿童白癜风 https://m.39.net/disease/a_6301825.html

作为一种通用技能,数据分析将会进入越来越多的不同工作。毕竟,技多不压身,机会总是眷顾有准备的人。掌握数据分析一方面可以提高相应的业务能力,另一方面可以建立数据驱动的视角来思考各种问题。

作为工科生,自己也是刚刚接触数据分析半年,但已经能独立处理简单的实战项目,对于数据分析的基础学习,还可以算的上颇有心得。在此分享自己学习数据分析的历程,希望能对想入门或者开始学习数据分析的学习者有一点点帮助与借鉴作用。

数学理论

统计学是在数据分析的基础上,研究如何测定、收集、整理、归纳和分析反映数据,以便给出正确消息的科学。如果要学习数据分析,那么扎实的数学基础知识是必备的,尤其是统计学部分。

理工科学生通常会在大学一年级学习概率论和数理统计。从数据分析的角度来看,这就足够了。然而,那些真正从头开始或对知识不熟悉的人,不仅可以参考大学课本,还可以学习《深入浅出统计学》这本书。

在学习数学的基础部分,这本书可以说是每个数据人的必读之作,适合任何没有基础的小白。这年头,凡是本书都想跟”数据“沾点边,却很少有书能真正说明白有数据到底能干嘛。这本书用了大量的图片和对话,让统计学理论的学习变得更加生动有趣。

而且个人认为,入门统计学,最重要的一点就是浅显易懂,尤其是面对着枯燥的数学概念和公式时,这本书在这方面就做的很好,虽然书还挺厚的,但翻起来很快,学起来也很轻松。

其中还有很多知识介绍对后续的学习也具有一定的借鉴意义,在案例中应用散点图,将多个散点图组合在9个宫格中,形成对比图,非常直观和凸面,区分好组和坏组,可以应用于人力效率、网页、组合方式、多店等多种水平绩效评价。

Excel

提到Excel,估计绝大部分求职者都不会陌生,毕竟一大票人都会在简历上写着”熟练使用Excel“。

自己在学习过程中,往往忽视掉对Excel的学习,觉得Excel在数据分析中的作用价值并不是很大,学了别的语言也一样可以代替,以至于后来不得不返回来专门补课。

我当时补课Excel是听了小破站王佩丰老师的Excel基础课程,从Excel基础功能、函数(sumifs、countifs、if、vlookup)、数据透视表都有详细说明。

比如在求多组数据的平均数、标准差、计数等多个指标时,Excel中的数据透视表便是很好的分组工具,对于简单数据处理,比大多数编程工具要更为便捷。只需要将要求的数据拖到对应的行和列,就可以得到结果。

SQL

如果是在互联网上做数据分析,那么SQL肯定是必要的,大量的数据存储在数据库中,不知道怎么取数量,没有统计的数据做分析会很困难。

首先需要了解SQL的语法基础,初学的时候如果对抽象概念不太懂,可以对比着Excel学习,比如where相当于Excel的筛选,order相当于Excel的升序降序排列。

其次,要紧紧抓住函数和数据库(关系型数据库和非关系型数据库)两点,从这两个方面入手更容易理解和消化。学习数据库的时候可以通过概念、优缺点比较来学。

SQL的入门其实是相对简单的,个人认为,只要找一本到两本靠谱专业的书,完完整整地看下来,基本就可以掌握的。

个人是比较推荐来自日本工程师MICK的《SQL基础教程》,绝对的白痴教程,每个步骤都很详细,而且整个的排版风格也很简约,很符合日本人严谨的风格。

当然,学习中还是得多多练习,可以在牛客网、leetcode力扣、Hackerrank、SQL50题都可以练习,一天练个两三道就行,要不真的就是学着忘着,都扔给老师了。

Python

作为一种代表着简单主义思想的语言,Python给我的感觉就像是读英语一样,更多的是专注于解决问题,而不是搞明白语言本身。

刚开始学习Python,难免有一种畏难情绪,尤其是在接触完C语言和数据结构以后,我感觉我再也不想见到编程了,直到后来我看到了一个有趣的报导,说是Python工程师比Java工程师的秃头率低很多,当然,这个真实性是无从考究的。

人们往往将Python戏称为”胶水语言“,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。

常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。

初学Python我不建议直接买一本书,抱着啃,这样还没开始就容易放弃;也不要选择+集的课程,15分钟大概就能睡着。最好是跟随系统性的课程学习。

我自己是跟着小破站里小甲鱼的零基础入门Python学习的,总体分为三步:变量语法、编程设计、项目演练。每天坚持边敲边学,遇到不会的就搜索。

数据分析系统课程

在拥有扎实的基础数据分析知识后,此时的知识还是碎片化、零散的,需要进入系统课程的学习,才能将知识串联在一起。自己在选择课程的时候,也是慎重再慎重,想花最少的时间get到数据分析的技能。

自己也是看了很多平台上的数据分析入门贴,还问了学过数据分析的学长学姐,发现贪心AI的口碑还算不错,自己就抱着试一试的心态,报名了贪心AI与腾讯课堂联合的数据分析课程。

之所以说是系统化,还得从贪心AI课程内容谈起。课程从一开始的数据分析概念的介绍,一直到后来对简历制作及面试技巧的普及,中间还涵盖对Excel、Python及SQL的应用,还有多个实战项目的锻炼。

这门课程可以说将前面的基础知识完整地串联成了体系,并在此基础上进行了提升。可以说,通过它,我才真正地学会了将知识运用起来,开始逐步独立地解决实战项目。

根据教学安排,教学时长总共有十周,其实,如果前面的基础打好,要不了十周就学完了,剩下的时间还可以多多拿实战项目来练习。

课程采取的是线上形式,可以随时随地学习,还可以倍速播放,更适合于时间自由度不高的上班族或学生,足不出户便可完成学习任务,但高自由度也对应着高自律性,不过,要没有足够的自律性,我觉得也根本不会进行到这个步骤。

授课方式是PPT与讲解共同结合,叶鹏飞老师和周景阳老师共同授课,还建立有专门的编程平台,也不用另外再下载编程软件了。

作为数据分析师的最基本技能,撰写数据分析报告是呈现给他人最好的形式。贪心AI里对数据分析报告的讲解很让我心仪,因为了解过的很多课程里都没有关于这一点的叙述,到了写的时候就不得不套用模板,生搬硬套又往往不能得到他人的认可。

叶鹏飞老师在讲到这里的时候,已经到了课程的后半段,所以对前面讲过的业务逻辑进行了简单的回顾:数据报表(数据源)→用户画像(数据分析)→数据化运营(决策指导)→商业分析(宏观判断)→分析报告(结论梳理)。

老师在这里特别强调了用户画像的分析方法,因为通常我们获取到的都是用户数据,并结合之前讲过的亚马逊的实战项目,可以了解到自己的商品情况,还能够分析到不同品牌的销售情况,二者互相对比,从而避免了管理时的唯业绩论或者唯品牌论的尴尬之处。

老师从数据报告的分类入手,共分为三类,分别是日常型、调研型、展示型,所有报告均可以通过后台下载,讲解的重点还是放在了概念的理解,尤其是擅于通过举例比喻来对专业名词与具体步骤记忆把握。

以调研型数据报告为例,先简要描述了其组成、目标和形式,再以中国服饰数字化零售研究报告为实战项目作为说明,这也是老师最熟悉的领域。

老师用了一个很有趣的比喻,将服装行业比作炒菜,一个人一个口味,又与电脑、快消品牌进行对比,说明服饰行业的垄断性不强,这样具象化的说明,提高了学习的兴趣,也让我一下子就记住了。

提升学习

严格来说,数据分析和机器学习是两个方向的东西,前者侧重于统计分析的业务问题,而后者则是与算法工程紧密相关的技术问题。

如果之后更侧重于业务岗,应该多多阅读相关书籍,很少有系统性的课再提升能力了。如果之后更侧重于技术岗,像我一样,可以给大家推荐我近期学习的吴恩达machinelearning(ML)课程,可以说是国内外最火的机器学习课程。

这门课程,是偏理论的教程,广泛的介绍了机器学习、统计和数据挖掘,主要包括监督学习、无监督学习和一些机器学习的实例,没有过于复杂的公式推导,可以很快速地对整个机器的知识点有完整的认识,而且还是免费获得,性价比可以说是超高。相信我,在学习的过程中,绝对有相见恨晚的感觉。

这门课的定位是零基础的入门课程,可是在学习的过程中其实还需要一定的数学与编程基础,要不然可能每周的作业都难以完成。

吴恩达教授在语言和解释概念方面尤其突出严谨。例如,在课程中提出,监督学习不会超越多维曲线拟合过程,而理解这种方法的其他方式,如模拟人类神经系统,实际上并不那么严格。

最后的最后,学好数据分析,切忌这山望着那山高,要带有目的地去学习,不要今天看个几页书,明天又去报个培训班。

虽然网上的经验贴很多,但自己也要学会找到适合自己的学习之路,实在分辨不清的,可以多看看招聘公告,给自己的学习目标多多参考。

希望我们都可以在数据分析方面取得进步~

分享 转发
TOP
发新话题 回复该主题