数据结构论坛

首页 » 分类 » 灌水 » 自助式BI,全面提升你的数据分析能力
TUhjnbcbe - 2020/6/5 20:01:00

概述

重新整理了与PowerBI相关的基础知识,将陆续发布到“知识体系-入门必读”栏目下,本文是这个系列的第一篇,从BI说起。

BI是什么

BI即商业智能,泛指用于业务分析的技术和工具,通过获取、处理原始数据,将其转化为有价值的信息指导商业行动。Gartner把BI定义为一个概括性的术语(umbrellaterm),其中包括应用程序、基础设施和工具,通过获取数据、分析信息以改进并优化决策和绩效,形成一套最佳的商业实践。

BI的本质是技术和工具的集合,通过处理原始数据,产出对商业行为有价值的洞察。

BI技术为商业运营提供基于历史、当下和未来的分析视角。

BI对商业决策的支持涵盖了从运营到战略的每个层面。基础运营决策包括产品定位或定价,战略业务决策包括最广泛层面的优先事项,目标和方向。BI的有效性在于将多个来源的数据进行整合。例如公司经营领域的市场数据(外部数据)和公司内部财务、运营数据(内部数据)的结合,这种结合可以更完整的反映公司经营的全貌。

从这个意义上来讲,基于单表或单一数据源的分析都不能称作真正的BI,还有一种常见情形是企业没有完整的BI产品线,靠手工操作汇总多个数据源,复制粘贴到一个Excel表中再进行分析,虽然满足了多来源,但汇总和分析过程都靠人肉,也不是真正的BI。

传统BI

在自助式BI出现之前,BI产品面向的是有IT技术背景的研发人员和数据科学家,他们多集中在企业的技术部门,通常也称为企业级BI。

这类BI产品有几个缺点:

部署周期长

报表非常刚性

开发新需求耗时长

IT部门负担重

这是一个大数据的时代,数据量日益膨胀,业务人员的分析需求不断增加,如果完全依赖于传统BI,分析所需的时间会越来越长,无法满足需求,用户需要在控制和敏捷之间找到一个新的平衡。可以预见,由于自助式BI的出现,未来对传统BI的需求增长很可能会放缓或停滞。

但企业BI的时代并没有结束,在某些方面仍有优势:可以稳定的为企业提供日常报表;具备实现复杂运算的能力。而且对于一个企业来讲,如果全部采取业务人员自助式分析,很可能没有一个部门拥有全部数据控制权,这意味着无法看到数据的全貌,进而错过关键信息、得到错误的分析结果。

自助式BI

自助式BI(又称作敏捷BI)面向的是不具备IT背景的业务分析人员,与传统BI相比,它更灵活且易于使用,而且一定程度上摆脱了对IT部门的依赖,自助式BI的出现标志着商业智能分析正在从“IT主导的报表模式”向“业务主导的自助分析模式”转变。

自助BI包含以下特征:

友好的用户界面

支持多种数据源,不仅是IT提供的数据库,还包括一些非传统的数据源(例如WEB数据)

支持交互分析的可视化展现

便于在企业内部共享和查看报表

面向业务人员的BI工具的一个最显著的优势是,当我们在面对一个个具体的业务问题时,例如:“是什么原因导致这个地区第三季度利润率下降?”;“产品A何时可以盈利?”;“我们的库存成本是否会影响到去年的毛利?”;“公司的业务正在发生何种变化?”这类问题是典型的商务智能探索的核心,解决它们需要的不仅仅是提供一个数字,还需要理解背后的商业原因。由于数据库和查询技术的进步,在自助BI工具的帮助下,业务人员凭借自己的专业知识,可以对各种可能的情况进行探索,最终得出结论。如果按照传统BI的方式,向IT部门提出分析需求,由技术人员实现,解决问题的时间可能延长到数周甚至数月,早已错过了最佳窗口期。

自助式BI是否会取代传统BI?

就像在企业BI结尾中提到的,自助BI不会使传统的数据库管理或数据科学家失效。这些由专业人士提供的洞察是复杂的,它们对大多数组织仍然具有很高的价值。(PowerBI的建模工具与微软SSAS表格模式使用相同的xVelocity引擎,使其在这方面具备超过同类BI软件的分析能力)

业务用户通常不了解数据准备的复杂性和错误所涉及的风险。如果没有统一部门管理的数据治理(datagovernance),他们可能使用错误的数据,得出错误的结论,。事实上,良好的数据治理至关重要。例如,如果多个业务用户正在创建自己的报告和仪表板,那么数据的民主化(democratizationofdata)可能带来分析混乱的风险。

自助式BIVS电子表格

MicrosoftExcel和其他电子表格已经存在了几十年,拥有数量最大的用户群。虽然电子表格易于上手,但把它当做BI工具使用,在以下场景会受到限制:

需要对包含多个工作表或数据库的混合数据源开展分析时

多人同时对一张电子表格进行维护和协作时

数据量达到上限或包含非结构化数据让可视化变得困难

使用复杂的公式降低了查询性能时

需要交互式分析和数据探索时

需要定时刷新时

虽然电子表格和自助BI工具都使用表格,但它们实际上是在不同的场合中扮演不同的目的。电子表格首先是一种存储和显示计算的方法。BI表格中的数据使用各种算法进行压缩,不像Excel那样直接使用行和列的编号来定位。虽然电子表格可以创建复杂的数学公式,比如Excel的分析工具库,但它们的核心是数学公式而不是模型。

而自助式BI虽然功能更加强大,看起来在很多场景下可以代替电子表格,但却很难真正取而代之。价格因素、安装成本、能否像电子表格一样易用都是需要考虑的因素,而电子表格拥有的巨大用户量无疑成了一笔财富。

如果基于电子表格直接开发一款BI工具,两者合二为一,想必是一个完美的解决方案。而且最好是原生形态的嵌入,因为以插件形式嵌入还是需要额外安装,而且兼容性、功能上也会受到限制。微软从Excel版本开始尝试,在上完成了对PowerPivot和PowerQuery(版本以插件形式出现)的嵌入,两个BI工具从插件转为了内置功能,虽然目前功能没有完全稳定(PowerPivot目前仍存在bug),但可以发挥的能量已经十分惊人,完全颠覆对电子表格功能的传统认识(可以想象成AK47装上了榴弹发射器)。而且微软正在以每月一次的频率持续迭代,这对其他自助BI工具是个相当大的挑战。

自助式BIVSPythonR

Python和R通常是具有IT背景和编程知识的技术人员掌握的技能,这类编程语言可以独立完成数据分析的整个流程,但是相比自助BI工具,缺少通过交互式筛选进行可视化探索的能力。相比之下,自助式BI界面化的操作更容易掌握,而且也能胜任大部分分析任务。值得注意的是,目前微软和Tableau的敏捷BI产品都支持编程语言进行二次开发,PowerBI支持R、Tableau支持Python和R,两款软件都在尝试将编程语言模块(聚类、决策树等)封装到软件里直接调用,加强分析和可视化的能力,未来的趋势将很可能是工具和语言的融合。对于业务分析师,在已经掌握了敏捷BI产品的基础上,学会一门语言可以拓展数据分析能力,但需要衡量为此付出的时间成本;如果是二选一,首先掌握一个BI软件是性价比较高的选择。

题外话

经济增长模式分为两种,一种是数量型增长,一种是效率型增长。数量型增长依靠增加资本投入拉动,效率型增长依靠技术创新拉动。由于边际收益递减的规律,依靠资源投入的数量型增长会逐渐停滞,而依靠技术创新的效率型增长不会碰到边际收益递减的问题,未来的增长模式是从资本驱动的数量型增长转向技术驱动的效率型增长。

“转型需要专注而执着的笨人,不需要聪明人,不要盲目跟随时髦的概念和流行的口号”,对数据分析师,这个命题同样成立,分析工具和语言有很多,找到一个能解决问题的,踏踏实实的掌握最重要。

效率型增长需要精细化的运营,面对瞬息万变的市场、日益膨胀的数据量和数据维度,业务人员必须参与其中,或抽丝剥茧,或大浪淘沙,从海量数据中快速获取有价值的洞察,自助式BI工具契合了这一需求,会逐渐被越来越多的分析人员所接受。

入门必读系列文章(陆续更新)

自助式BI,全面提升你的数据分析能力

当我们谈论PowerBI的时候,我们在谈论什么

从0开始学习PowerBI,可能遇到哪些问题

全面了解PowerQuery

PowerQuery的优势与短板

全面认识DAX知识体系

内容转载自

1
查看完整版本: 自助式BI,全面提升你的数据分析能力