数据结构论坛

首页 » 分类 » 常识 » 全栈数据科学家技能树
TUhjnbcbe - 2021/3/10 0:34:00
北京治疗白癜风那家医院好 http://m.39.net/pf/bdfyy/bjzkbdfyy/

本文可以看做是诚实预告版的《如何成为一名全栈数据科学家》,有感于湾区日报推荐的一篇文章《全栈数据科学家》,并探索如何正确点亮“数据科学家”的技能树以及Python在这棵技能树中的位置。

机器学习、大数据、数据挖掘这些红到碰不得的词碰撞出“数据科学家”、“数据工程师”这样的新兴职位,《全栈数据科学家》一文中作者提出了一个典型的数据科学部门的组成结构:

数据科学家:统计学家中代码写得最好的与工程师中统计学最好的“思考者”;

数据工程师:给数据科学家喂食、将他们的想法落地实现的“行动者”;

基础工程师:维护数据的“工人”。

这里不再重复作者对于职能分配等方面的讨论,有兴趣可以去阅读一下原文。首先需要说明,和Wb开发领域的“全栈工程师”类似,全栈不是“物美价廉”的代名词,也不是“难以沟通,喜欢单打独斗”找的借口,而是对这个领域的所有环节都充满兴趣,对于从无到有的创造过程充满激情,更是能够理解彼此的需求,让团队沟通协作更加顺畅的润滑剂,所以每个领域都存在也需要更多的全栈!好了,干了这碗鸡汤,回归正题。我分别去Quora和蛤乎进行搜索,找到两张广义上数据科学家的技能图谱:

总的来说分为下面几个分支:

数学,统计,机器学习;

数据采集、分析、挖掘;

数据库、大数据处理;

结果报告、可视化。

在这些分支中,除了核心的数学能力、对数据的敏感以及创造性思维等,其余大部分要依赖编程语言或相关的工具来完成,并且同时可能存在多个竞争语言可供选择,下面我们就逐一讨论Python在这些领域中的应用:

1
查看完整版本: 全栈数据科学家技能树