这是一个用数据说话的时代,也是一个依靠数据竞争的时代。各大互联网公司都在不断完善自己的数据分析团队,数据分析师的薪酬也是水涨船高。业内人士透露,应届毕业生的平均薪资大概在6K左右,1至3年经验的大概在10K到20K之间,5至10年经验的大概在25K以上。薪资还是十分诱人的,那么,如何快速成长为一名年薪百万的数据分析师呢?快来看看,以下30道数据分析相关面试题,你会多少?
1、分析数据还要写java代码是不是效率有点低?
2、成为一名数据分析师需要具备哪些技能?
要成为一名数据分析师,需要掌握丰富的报告软件包(BusinessObjects),编程语言(XML,Javascript或ETL框架),数据库(SQL,SQLite等);能够准确分析、组织、收集或传播数据;掌握数据库设计,数据模型,数据挖掘等方面的技术知识以及分析大型数据集(SAS,Excel,SPSS等)的统计软件包知识。
3、分析项目的各个步骤是什么?
分析项目的各个步骤包括:
·问题定义
·数据挖掘
数据准备
模型化
数据认证
实施跟踪
4、分析的结果数据特别大,在线请求这些结果数据扛不住了,咋搞?
5、列出数据清理的最佳实践?
一些数据清理的最佳实践包括:
按不同的属性排序数据
对于大数据集,逐步清理并改进数据,直到获得良好的数据质量
对大型数据集,可以先将其分解为小数据集,使用更少的数据将增加迭代速度
要处理常见的清理任务,请创建一组实用程序函数/工具/脚本。它可能包括基于CSV文件或SQL数据库重映射值,或者正则表达式搜索和替换,消除所有不匹配正则表达式的值
如果在数据清理方面存在问题,请按照估计的频率进行安排并解决问题
分析每列的汇总统计数据(标准差,均值,缺失值的数量)
保持对每一个清理操作的跟踪,以便可以根据需要更改或删除操作
6、海量日志数据,提取出某日访问百度次数最多的那个IP。
7、可用于数据分析的一些最佳工具清单有什么?
Tableau
RapidMiner
OpenRefine
KNIME
GoogleSearchOperators
Solver
NodeXL
io
WolframAlpha’s
GoogleFusiontables
8、数据挖掘和数据分析之间的区别是什么?
数据挖掘和数据分析之间的区别在于:
数据分析:针对个别属性的实例分析。提供有关属性的各种信息,如值范围,离散值及其频率,空值的发生,数据类型,长度等。
数据挖掘:重点