澎湃Logo
下载客户端

登录

  • +1

大模型+数据分析,改变人类使用数据的习惯

2023-07-15 11:12
来源:澎湃新闻·澎湃号·湃客
字号

“小李,帮我分析一下我们的贷款业务增长趋势如何?哪个分支行的表现最好?新开设的线上理财产品的销售额是多少?马上给我一个分析报告”,某大型银行的副总经理王先生,对李经理提出了这样的数据分析需求。为了完成这个任务,李经理需要从银行的数据平台中获取和分析数据,以回答领导的问题。然而,这可能涉及到一些复杂的数据操作,如连接不同的数据源(例如贷款数据库和理财产品数据库)、过滤和聚合数据、创建数据可视化图表等。

以上,只是一个业务人员进行数据分析的模拟场景。事实上,随着各行各业数字化转型升级的持续推进,类似的数据分析场景已经遍布各个领域。随着数据驱动决策在全球范围内的广泛应用,数据分析的价值日益凸显。然而,传统的数据分析方法往往需要深厚的技术知识和专业技能,这在一定程度上限制了其在更广泛的场景中的应用。随着科技的发展,数据分析的交互方式也在不断演进。从早期的编程语言和SQL查询,到拖拉拽的数据分析工具,我们可以看到一种明显的趋势,那就是让数据分析变得更加直观和易用。那么,我们能否更进一步呢?

在7月14日举办的2023 Kyligence “释放数智生产力”用户大会上,笔者见证了一种全新的可能——基于大模型的自然语言交互方式,来实现数据分析。接下来,我们将探讨数据分析方式的演进逻辑,分析Kyligence如何将指标平台、数据分析与大模型融合,实现基于自然语言的指标数据分析,为数据分析的未来描绘一幅可能的蓝图。

更自然的人机交互,是永恒的追求

数据分析交互方式的演进,可以视作是一场寻求更佳人机交互方式、降低分析门槛的持久探索。从早期的编程语言和SQL查询,到拖拉拽的数据分析工具,再到基于大模型的自然语言交互方式,我们不断在推进数据分析的普及化和易用性。

早期,数据分析主要依赖于编程语言,比如Python、R等。这类语言通常包含专门用于数据分析的库和工具,如Python的Pandas、NumPy、SciPy等,使得程序员可以通过编写代码来处理和分析数据。然而,这类方式的明显短板在于门槛较高。一方面,用户需要掌握编程知识,包括语法、数据结构和算法等;另一方面,还需了解专门的数据处理库和工具。这样的要求使得非技术背景的用户难以应对。

随着SQL的诞生和流行,数据查询与处理的门槛降低了一些。SQL为结构化的数据提供了一种更为高效和直观的查询方式,其语句近似自然语言,比如“SELECT * FROM table WHERE condition”,直观且易学。然而,SQL仍然需要用户掌握一定的语法知识,而且对于复杂的查询和分析任务,SQL的语句可能会变得冗长且难以理解。此外,SQL主要用于结构化数据,对于非结构化数据,其处理能力有限。

为了进一步降低使用门槛,一种新型的数据分析工具应运而生,即所谓的拖拉拽式数据分析工具,如Tableau、PowerBI等。这些工具通过可视化的界面,让用户可以直观地选择和操作数据,创建数据可视化图表。这种方式相比编程语言和SQL,大大降低了数据分析的门槛,使得非技术用户也能够进行数据分析。

然而,拖拉拽的数据分析交互方式在易用性方面还存在一些问题,主要表现在以下三个方面:

首先,尽管拖拉拽工具相对直观,但用户仍需要花费时间学习如何使用它们。例如,用户需要知道如何添加和删除数据源、如何选择正确的图表类型、如何应用和理解不同的数据操作(如筛选、排序、聚合等)。这些功能和概念,尤其是一些高级的数据操作和分析功能,对于没有数据分析背景的用户来说,可能仍然需要一段时间去理解和掌握。

其次,拖拉拽工具的操作可能会变得相当复杂,特别是对于一些高级的数据操作和分析任务。例如,用户可能需要通过多次拖拉拽和选择操作,才能创建一个复杂的数据仪表板或执行一次复杂的数据分析。对于一些更复杂的需求,例如需要联结多个数据源或需要进行复杂的数据预处理,拖拉拽工具可能无法满足,或者操作起来非常复杂和困难。

最后,尽管拖拉拽工具通常提供了丰富的数据操作和可视化功能,但用户仍需要对数据和数据分析有一定的理解,才能有效地使用这些工具。例如,用户需要知道哪些数据是相关的,哪些数据是可以比较的,哪种图表可以有效地表达某种数据关系等。如果用户对数据分析的基本概念和方法没有足够的理解,他们可能会感到困惑,不知道如何选择和使用这些功能。

因此,拖拉拽的数据分析方式,门槛还是不够低,交互方式还是不够自然。那么什么才是最自然的人机交互方式呢?回想一下,人类平时是用什么交流的?——自然语言。既然人与人之间可以用自然语言交流,那为什么不能用自然语言来进行人机“交流”呢?如果能够实现基于自然语言的数据分析交互,那在易用性上必然会更进一步。

Kyligence就是按照这个思路,来变革数据分析交互体验的。

基于大模型,构建基于自然语言的数据分析方式

依据Kyligence的实践经验,要做好这个事情,关键的有三个方面:基于大语言模型来准确理解用户数据分析需求;联通指标平台来进行数据计算和分析,给出分析结果;打通各个SaaS系统,以分析结果推动业务流程改善,提升管理与经营效率,实现组织协同。

首先,基于大语言模型来准确理解用户数据分析需求。大语言模型如ChatGPT,通过训练大量的文本数据,它们可以理解和生成自然语言,使得人机交互更加自然、便捷。在数据分析场景下,用户可以用自然语言描述他们的数据需求,例如“我想知道上个季度的销售额”或者“请告诉我我们最畅销的产品是什么”。大语言模型可以解析这些需求,转化为可以执行的数据查询和分析任务。这大大降低了数据分析的门槛,让非技术用户也可以轻松地进行数据分析。

其次,联通指标平台进行数据计算和分析。指标平台是一个专门为数据分析设计的系统,它可以处理各种数据,包括结构化和非结构化数据,进行复杂的数据计算和分析。在理解用户需求后,我们需要依赖指标平台来执行具体的数据操作,例如数据查询、筛选、排序、聚合等,并生成分析结果。这一步是数据分析的核心环节,它决定了数据分析的质量和效率。

最后,打通各个SaaS系统,以分析结果推动业务流程改善。数据分析的目标不仅仅是获取数据洞察,更重要的是,根据这些洞察来改善业务流程,提升管理与经营效率。因此,我们需要将数据分析结果反馈到各个业务系统中,例如CRM、ERP等,以支持业务决策和操作。例如,如果我们发现某个产品的销售额下降,我们可以通过CRM系统调整销售策略;如果我们发现某个供应商的供货速度太慢,我们可以通过ERP系统调整采购计划。这样,我们可以实现数据驱动的业务流程改善,提升整个组织的运营效率。

需要指出的是,Kyligence并不是推出了一个“PPT产品”,而是可供客户使用的商用版本。接下来,我们就以Kyligence Copilot这一产品,来看看基于自然语言的数据分析交互方式到底是怎样一种体验。

据了解,Kyligence Copilot AI 数智助理是基于 Kyligence Zen 一站式指标平台的 AI 数智助理,结合大语言模型能力,帮助用户通过自然语言对话完成围绕业务指标的分析和洞察,大幅降低业务人员用数的门槛、提升工作效率。

从上面的演示我们可以看到,用户可以直接问Kyligence Copilot“公司最近利润情况如何?”,系统会推荐净利润、净利润月环比、净利润月累计等指标,用户选定之后,Kyligence Copilot会给出分析结果。在此基础上,Kyligence Copilot基于数据给出结论和建议,比如哪一个月利润高、哪一个月利润低,净利润的整体趋势是怎样的。

进一步的,Kyligence Copilot还会对更深入的数据分析给出建议,比如“可以进一步分析各个地区、商品类别的净利润情况,找出优势区域和商品,进一步优化经营策略”,用户可以依据建议一步步进行更深入的数据探索。最终,可以把这些所有的数据分析生成仪表盘,来直观的展现数据分析结果。

对于企业管理者而言,数据分析只是手段,目的是通过数据分析找到业务上的问题,进而通过优化管理和业务流程,来提升经营效率。因而,在Kyligence Copilot的数据分析基础上,作出管理和业务决策,并将这些决策通过打通飞书、钉钉、企业微信等系统,嵌入到整个组织的管理和业务流程中,让数据分析的结果反馈到经营管理体系当中。

这是一条刚刚开始的征途

需要指出的是,尽管基于大模型的自然语言交互方式在理解用户数据分析需求方面已经展现出了强大的潜力,但变革才刚刚开始,我们还需要努力解决一些挑战,不断提升能力和用户体验。

例如,需要优化大模型与指标平台、数据分析平台的对接方式。大模型理解并生成的是自然语言,而指标平台通常接受的是具体的数据查询和操作指令。我们需要一个转换器,将大模型的输出转化为指标平台可以理解和执行的指令。这可能涉及到一些技术难题,如自然语言到SQL的转换,以及如何将复杂的数据分析需求分解为一系列可以执行的数据操作。

此外,大模型的准确性和稳定性也是一大挑战。虽然大模型可以理解和生成自然语言,但是在一些复杂和模糊的场景下,它的理解可能并不准确,或者产生的结果可能有多种可能。我们需要提供足够的反馈机制,以及在必要时提供人工干预,确保数据分析的结果准确和可靠。而且,数据分析通常涉及到大量的敏感数据,如用户信息、交易数据等,我们需要确保大模型在处理这些数据时,可以充分保护数据的安全和用户的隐私。

当然,虽然还存在一些挑战,但这条路有异常广阔的应用前景。将大模型与指标平台和数据分析平台融合,实现以自然语言进行数据分析,是数据科技领域的一次重大创新,它将深刻改变数据分析的面貌,推动各行业的数字化转型,带来广泛而深远的影响。

对于个人而言,将大大降低数据分析门槛,提升分析效率。传统的数据分析需要学习和理解复杂的查询语言和工具,而基于自然语言的数据分析只需要用户用他们熟悉的语言描述他们的需求。这意味着任何人,无论他们的技术背景如何,都可以进行数据分析,实现真正的普惠数据分析。其次,这将显著提高数据分析的效率和效果。传统的数据分析往往需要大量的数据操作和计算,而基于自然语言的数据分析可以直接从用户需求出发,自动进行数据查询和分析,提供直接的数据洞察。这使得数据分析更加快速和准确,更能满足用户的实际需求。

对于企业而言,将加快决策速度和精准度,提升经营管理效率和业务创新能力。自然语言的交互方式,大大加快数据分析的速度,使得决策者可以更快地得到数据洞察,更快地做出决策。而且,基于大模型的自然语言理解,可以处理复杂的数据分析需求,如比较分析、因果分析、预测分析等。这将大大增强数据分析的深度和精度,使得决策者可以得到更深入、更准确的数据洞察,做出更好的决策。管理者不仅可以快速获取业务洞察,还可以根据洞察调整业务流程,甚至是与其他SaaS系统的集成,这将极大地提高企业的业务效率和运营效率。数据分析是数字化转型的关键环节,它可以帮助企业理解和利用他们的数据,创新产品和服务。

对于社会而言,将推动社会数字化转型。基于自然语言的数据分析,可以让更多的企业和个人参与到数据分析中来,进一步推动各行业的数字化转型。数据分析可以帮助我们理解和解决各种社会问题,如公共卫生、环境保护、教育公平等。基于自然语言的数据分析,可以让更多的人参与到这些工作中来,共同推动社会的进步。可以预见,随着数据分析的普及和深入,社会将有更多的机会发现新的业务模式、新的市场机会、新的社会需求。

想象一下,当这种数据分析方式大规模推广后,我们将会看到一个全新的数据分析生态。在这个生态中,任何人都可以轻松地进行数据分析,找到他们需要的答案和洞察。各行各业都可以充分利用他们的数据,优化业务,提高效率,创新产品。我们的社会也会因此变得更加公正、更加高效、更加创新。这将是一个美好的未来,值得我们共同期待和努力。

文:月满西楼 / 数据猿

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈