“小李,帮我分析一下我们的贷款业务增长趋势如何?哪个分支行的表现最好?新开设的线上理财产品的销售额是多少?马上给我一个分析报告”,某大型银行的副总经理王先生,对李经理提出了这样的数据分析需求。为了完成这个任务,李经理需要从银行的数据平台中获取和分析数据,以回答领导的问题。然而,这可能涉及到一些复杂的数据操作,如连接不同的数据源(例如贷款数据库和理财产品数据库)、过滤和聚合数据、创建数据可视化图表等。
以上,只是一个业务人员进行数据分析的模拟场景。事实上,随着各行各业数字化转型升级的持续推进,类似的数据分析场景已经遍布各个领域。随着数据驱动决策在全球范围内的广泛应用,数据分析的价值日益凸显。然而,传统的数据分析方法往往需要深厚的技术知识和专业技能,这在一定程度上限制了其在更广泛的场景中的应用。随着科技的发展,数据分析的交互方式也在不断演进。从早期的编程语言和SQL查询,到拖拉拽的数据分析工具,我们可以看到一种明显的趋势,那就是让数据分析变得更加直观和易用。那么,我们能否更进一步呢?
在7月14日举办的Kyligence“释放数智生产力”用户大会上,笔者见证了一种全新的可能——基于大模型的自然语言交互方式,来实现数据分析。接下来,我们将探讨数据分析方式的演进逻辑,分析Kyligence如何将指标平台、数据分析与大模型融合,实现基于自然语言的指标数据分析,为数据分析的未来描绘一幅可能的蓝图。
更自然的人机交互,是永恒的追求
数据分析交互方式的演进,可以视作是一场寻求更佳人机交互方式、降低分析门槛的持久探索。从早期的编程语言和SQL查询,到拖拉拽的数据分析工具,再到基于大模型的自然语言交互方式,我们不断在推进数据分析的普及化和易用性。
早期,数据分析主要依赖于编程语言,比如Python、R等。这类语言通常包含专门用于数据分析的库和工具,如Python的Pandas、NumPy、SciPy等,使得程序员可以通过编写代码来处理和分析数据。然而,这类方式的明显短板在于门槛较高。一方面,用户需要掌握编程知识,包括语法、数据结构和算法等;另一方面,还需了解专门的数据处理库和工具。这样的要求使得非技术背景的用户难以应对。
随着SQL的诞生和流行,数据查询与处理的门槛降低了一些。SQL为结构化的数据提供了一种更为高效和直观的查询方式,其语句近似自然语言,比如“SELECT*FROMtableWHEREcondition”,直观且易学。然而,SQL仍然需要用户掌握一定的语法知识,而且对于复杂的查询和分析任务,SQL的语句可能会变得冗长且难以理解。此外,SQL主要用于结构化数据,对于非结构化数据,其处理能力有限。
为了进一步降低使用门槛,一种新型的数据分析工具应运而生,即所谓的拖拉拽式数据分析工具,如Tableau、PowerBI等。这些工具通过可视化的界面,让用户可以直观地选择和操作数据,创建数据可视化图表。这种方式相比编程语言和SQL,大大降低了数据分析的门槛,使得非技术用户也能够进行数据分析。
然而,拖拉拽的数据分析交互方式在易用性方面还存在一些问题,主要表现在以下三个方面:
首先,尽管拖拉拽工具相对直观,但用户仍需要花费时间学习如何使用它们。例如,用户需要知道如何添加和删除数据源、如何选择正确的图表类型、如何应用和理解不同的数据操作(如筛选、排序、聚合等)。这些功能和概念,尤其是一些高级的数据操作和分析功能,对于没有数据分析背景的用户来说,可能仍然需要一段时间去理解和掌握。
其次,拖拉拽工具的操作可能会变得相当复杂,特别是对于一些高级的数据操作和分析任务。例如,用户可能需要通过多次拖拉拽和选择操作,才能创建一个复杂的数据仪表板或执行一次复杂的数据分析。对于一些更复杂的需求,例如需要联结多个数据源或需要进行复杂的数据预处理,拖拉拽工具可能无法满足,或者操作起来非常复杂和困难。
最后,尽管拖拉拽工具通常提供了丰富的数据操作和可视化功能,但用户仍需要对数据和数据分析有一定的理解,才能有效地使用这些工具。例如,用户需要知道哪些数据是相关的,哪些数据是可以比较的,哪种图表可以有效地表达某种数据关系等。如果用户对数据分析的基本概念和方法没有足够的理解,他们可能会感到困惑,不知道如何选择和使用这些功能。
因此,拖拉拽的数据分析方式,门槛还是不够低,交互方式还是不够自然。那么什么才是最自然的人机交互方式呢?回想一下,人类平时是用什么交流的?——自然语言。既然人与人之间可以用自然语言交流,那为什么不能用自然语言来进行人机“交流”呢?如果能够实现基于自然语言的数据分析交互,那在易用性上必然会更进一步。
Kyligence就是按照这个思路,来变革数据分析交互体验的。
基于大模型,构建基于自然语言的数据分析方式
依据Kyligence的实践经验,要做好这个事情,关键的有三个方面:基于大语言模型来准确理解用户数据分析需求;联通指标平台来进行数据计算和分析,给出分析结果;打通各个SaaS系统,以分析结果推动业务流程改善,提升管理与经营效率,实现组织协同。
首先,基于大语言模型来准确理解用户数据分析需求。大语言模型如ChatGPT,通过训练大量的文本数据,它们可以理解和生成自然语言,使得人机交互更加自然、便捷。在数据分析场景下,用户可以用自然语言描述他们的数据需求,例如“我想知道上个季度的销售额”或者“请告诉我我们最畅销的产品是什么”。大语言模型可以解析这些需求,转化为可以执行的数据查询和分析任务。这大大降低了数据分析的门槛,让非技术用户也可以轻松地进行数据分析。
其次,联通指标平台进行数据计算和分析。指标平台是一个专门为数据分析设计的系统,它可以处理各种数据,包括结构化和非结构化数据,进行复杂的数据计算和分析。在理解用户需求后,我们需要依赖指标平台来执行具体的数据操作,例如数据查询、筛选、排序、聚合等,并生成分析结果。这一步是数据分析的核心环节,它决定了数据分析的质量和效率。
最后,打通各个SaaS系统,以分析结果推动业务流程改善。数据分析的目标不仅仅是获取数据洞察,更重要的是,根据这些洞察来改善业务流程,提升管理与经营效率。因此,我们需要将数据分析结果反馈到各个业务系统中,例如CRM、ERP等,以支持业务决策和操作。例如,如果我们发现某个产品的销售额下降,我们可以通过CRM系统调整销售策略;如果我们发现某个供应商的供货速度太慢,我们可以通过ERP系统调整采购计划。这样,我们可以实现数据驱动的业务流程改善,提升整个组织的运营效率。
需要指出的是,Kyligence并不是推出了一个“PPT产品”,而是可供客户使用的商用版本。接下来,我们就以KyligenceCopilot这一产品,来看看基于自然语言的数据分析交互方式到底是怎样一种体验。
据了解,KyligenceCopilotAI数智助理是基于KyligenceZen一站式指标平台的AI数智助理,结合大语言模型能力,帮助用户通过自然语言对话完成围绕业务指标的分析和洞察,大幅降低业务人员用数的门槛、提升工作效率。
从上面的演示我们可以看到,用户可以直接问KyligenceCopilot“公司最近利润情况如何?”,系统会推荐净利润、净利润月环比、净利润月累计等指标,用户选定之后,KyligenceCopilot会给出分析结果。在此基础上,KyligenceCopilot基于数据给出结论和建议,比如哪一个月利润高、哪一个月利润低,净利润的整体趋势是怎样的。
进一步的,KyligenceCopilot还会对更深入的数据分析给出建议,比如“可以进一步分析各个地区、商品类别的净利润情况,找出优势区域和商品,进一步优化经营策略”,用户可以依据建议一步步进行更深入的数据探索。最终,可以把这些所有的数据分析生成仪表盘,来直观的展现数据分析结果。
对于企业管理者而言,数据分析只是手段,目的是通过数据分析找到业务上的问题,进而通过优化管理和业务流程,来提升经营效率。因而,在KyligenceCopilot的数据分析基础上,作出管理和业务决策,并将这些决策通过打通飞书、钉钉、企业