机器学习模型的端到端用户体验历程

本文档介绍了在 BigQuery ML 中训练的机器学习 (ML) 模型的用户体验历程,包括可用于处理 ML 模型的语句和函数。BigQuery ML 提供以下类型的机器学习模型:

模型创建用户体验历程

下表介绍了可用于创建和调整模型的语句和函数:

模型类别 模型类型 模型创建 特征预处理 超参数调优1 模型权重 特征和训练信息 教程
监督式学习 线性回归和逻辑回归 CREATE MODEL 自动预处理

手动预处理
超参数调优

ML.TRIAL
_INFO
ML.WEIGHTS ML.FEATURE
_INFO


ML.TRAINING
_INFO
使用线性回归预测企鹅体重

使用逻辑回归模型执行分类
深度神经网络 (DNN) CREATE MODEL 自动预处理

手动预处理
超参数调优

ML.TRIAL
_INFO
不适用2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
不适用
Wide & Deep 网络 CREATE MODEL 自动预处理

手动预处理
超参数调优

ML.TRIAL
_INFO
不适用2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
不适用
提升树 CREATE MODEL 自动预处理

手动预处理
超参数调优

ML.TRIAL
_INFO
不适用2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
使用提升树模型执行分类
随机森林 CREATE MODEL 自动预处理

手动预处理
超参数调优

ML.TRIAL
_INFO
不适用2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
不适用
AutoML 分类和回归 CREATE MODEL AutoML 会自动执行特征工程 AutoML 会自动执行超参数调优 不适用2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
不适用
非监督式学习 K-means CREATE MODEL 自动预处理

手动预处理
超参数调优

ML.TRIAL
_INFO
ML.CENTROIDS ML.FEATURE
_INFO


ML.TRAINING
_INFO
在自行车站点数据中查找聚类
矩阵分解 CREATE MODEL 不适用 超参数调优

ML.TRIAL
_INFO
ML.WEIGHTS ML.FEATURE
_INFO


ML.TRAINING
_INFO
使用显式反馈生成影片推荐

使用隐式反馈生成内容推荐
主成分分析 (PCA) CREATE MODEL 自动预处理

手动预处理
不适用 ML.PRINCIPAL
_COMPONENTS


ML.PRINCIPAL
_COMPONENT
_INFO
ML.FEATURE
_INFO


ML.TRAINING
_INFO
不适用
自动编码器 CREATE MODEL 自动预处理

手动预处理
超参数调优

ML.TRIAL
_INFO
不适用2 ML.FEATURE
_INFO


ML.TRAINING
_INFO
不适用
仅转换 仅转换 CREATE MODEL 手动预处理 不适用 不适用 ML.FEATURE
_INFO
不适用

1如需查看有关使用超参数调优的分步示例,请参阅使用超参数调优提高模型性能

2BigQuery ML 未提供用于检索此模型权重的函数。如需查看模型的权重,您可以将模型从 BigQuery ML 导出到 Cloud Storage,然后使用 XGBoost 库或 TensorFlow 库直观呈现树模型的树状结构或神经网络的图结构。如需了解详情,请参阅 EXPORT MODEL导出 BigQuery ML 模型以进行在线预测

模型使用用户体验历程

下表介绍了可用于评估、解释模型并从模型获取预测结果的语句和函数:

模型类别 模型类型 评估 推断 AI 说明 模型监控
监督式学习 线性回归和逻辑回归 ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
深度神经网络 (DNN) ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
Wide & Deep 网络 ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.ADVANCED_WEIGHTS5
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
提升树 ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.FEATURE_IMPORTANCE4
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
随机森林 ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT

ML.TRANSFORM
ML.EXPLAIN_PREDICT3

ML.GLOBAL_EXPLAIN

ML.FEATURE_IMPORTANCE4
ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
AutoML 分类和回归 ML.EVALUATE

ML.CONFUSION
_MATRIX
1

ML.ROC_CURVE2
ML.PREDICT ML.GLOBAL_EXPLAIN ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
非监督式学习 K-means ML.EVALUATE ML.PREDICT
ML.DETECT
_ANOMALIES


ML.TRANSFORM
不适用 ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
矩阵分解 ML.EVALUATE ML.RECOMMEND

ML.GENERATE
_EMBEDDING
不适用 不适用
主成分分析 (PCA) ML.EVALUATE ML.PREDICT
ML.GENERATE
_EMBEDDING

ML.DETECT
_ANOMALIES


ML.TRANSFORM
不适用 ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
自动编码器 ML.EVALUATE ML.PREDICT

ML.GENERATE
_EMBEDDING

ML.DETECT
_ANOMALIES


ML.RECONSTRUCTION
_LOSS


ML.TRANSFORM
不适用 ML.DESCRIBE_DATA

ML.VALIDATE_DATA
_DRIFT


ML.VALIDATE_DATA
_SKEW


ML.TFDV_DESCRIBE

ML.TFDV_VALIDATE
仅转换 仅转换 不适用 ML.TRANSFORM 不适用 不适用

1ML.CONFUSION_MATRIX 仅适用于分类模型。

2ML.ROC_CURVE 仅适用于二元分类模型。

3ML.EXPLAIN_PREDICT 函数涵盖了 ML.PREDICT 函数,因为其输出是 ML.PREDICT 结果的超集。

4如需了解 ML.GLOBAL_EXPLAINML.FEATURE_IMPORTANCE 之间的区别,请参阅 Explainable AI 概览

5ML.ADVANCED_WEIGHTS 函数涵盖了 ML.WEIGHTS 函数,因为其输出是 ML.WEIGHTS 结果的超集。