贡献分析概览
本文档可帮助您了解贡献分析应用场景,以及在 BigQuery ML 中执行贡献分析的选项。
什么是贡献分析?
贡献分析(也称为关键驱动因素分析)是一种用于生成有关多维数据中关键指标变化的分析洞见的方法。例如,您可以使用贡献分析来查看哪些数据促成了两个季度的收入数字变化,或者比较两组训练数据以了解机器学习模型性能的变化。
贡献分析是一种增强型分析,即使用人工智能 (AI) 来增强和自动化数据分析和理解。贡献分析实现了增强型分析的一个关键目标,即帮助用户在数据中发现模式。
使用 BigQuery ML 进行贡献分析
如需在 BigQuery ML 中使用贡献分析,请使用 CREATE MODEL
语句创建贡献分析模型。
贡献分析模型会将一组测试数据与一组控制数据进行比较,从而检测出在给定指标上显示变化的数据细分。例如,您可以将 2023 年底拍摄的销售数据表快照用作测试数据,将 2022 年底拍摄的表快照用作对照数据,然后比较这两组数据,看看销售额随时间推移发生了哪些变化。贡献分析模型可以显示哪个数据细分(例如特定区域的线上客户)导致了销售额从一年到下一年的最大变化。
指标是贡献分析模型用来衡量和比较测试数据与对照数据之间的变化的数值。您可以使用贡献分析模型指定以下类型的指标:
- 可汇总:对您指定的指标列的值求和,然后确定每个数据段的总和。
- 可求和比率:对您指定的两个数值列的值求和,并确定每个数据段中这两个数值列之间的比率。
- 按类别求和:将数值列的值求和,然后除以分类列中不同值的数量。
细分是指由维度值的指定组合标识的数据切片。例如,对于基于 store_number
、customer_id
和 day
维度的贡献分析模型,这些维度值的每个唯一组合都代表一个细分。在下表中,每行代表一个不同的细分:
store_number |
customer_id |
day |
商店 1 | ||
商店 1 | 客户 1 | |
商店 1 | 客户 1 | 星期一 |
商店 1 | 客户 1 | 星期二 |
商店 1 | 客户 2 | |
商店 2 |
如需缩短模型创建时间,请指定一个 Apriori 支持阈值。借助 Apriori 支持阈值,您可以删减较小且不太相关的细分,以便模型仅使用规模最大且最相关的细分。
创建贡献分析模型后,您可以使用 ML.GET_INSIGHTS
函数检索模型计算的指标信息。模型输出包含多行分析洞见,每条分析洞见对应一个细分,并提供该细分对应的指标。
贡献分析用户体验历程
下表介绍了可与贡献分析模型搭配使用的语句和函数:
模型创建 | 特征预处理 | 生成分析洞见 | 教程 |
---|---|---|---|
CREATE MODEL |
手动预处理 | ML.GET_INSIGHTS |