予測の概要

予測とは、過去のデータを分析して将来の傾向を予測する手法です。たとえば、複数の店舗の過去の販売データを分析して、それらの店舗での将来の販売を予測するようなことが考えられます。BigQuery ML では、時系列データに対して予測を行います。

予測は次の方法で実行できます。

  • 組み込みの TimesFM モデルAI.FORECAST 関数を使用します。このアプローチは、単一の変数の将来の値を予測する必要がある場合に使用します。この方法では、モデルを作成して管理する必要はありません。
  • ARIMA_PLUS モデルML.FORECAST 関数を使用します。このアプローチは、ARIMA ベースのモデリング パイプラインを実行し、結果を説明するために時系列を複数のコンポーネントに分解する必要がある場合に使用します。この方法では、モデルを作成して管理する必要があります。
  • ARIMA_PLUS_XREG モデルML.FORECAST 関数を使用します。このアプローチは、複数の変数の将来の値を予測する必要がある場合に使用します。この方法では、モデルを作成して管理する必要があります。

予測に加えて、異常検出に ARIMA_PLUS モデルと ARIMA_PLUS_XREG モデルを使用できます。詳細については、次のドキュメントをご覧ください。

ARIMA_PLUS モデルと TimesFM モデルを比較する

次の表を使用して、ユースケースで TimesFM モデル、ARIMA_PLUS モデル、ARIMA_PLUS_XREG モデルのいずれを使用するかを判断します。

モデルタイプ ARIMA_PLUSARIMA_PLUS_XREG TimesFM
モデルの詳細 トレンド コンポーネントに ARIMA アルゴリズムを使用し、トレンド以外のコンポーネントにさまざまなアルゴリズムを使用する統計モデル。詳細については、時系列モデリング パイプラインと以下の公開情報をご覧ください。 Transformer ベースの基盤モデル。詳細については、次の行の刊行物をご覧ください。
刊行物 ARIMA_PLUS: Google BigQuery での大規模で正確かつ自動的で解釈可能なデータベース内時系列予測と異常検出 時系列予測用のデコーダ専用基盤モデル
トレーニングが必要 はい。各時系列に対して 1 つの ARIMA_PLUS モデルまたは ARIMA_PLUS_XREG モデルがトレーニングされます。 いいえ。TimesFM モデルは事前トレーニング済みです。
SQL の使いやすさ 高。CREATE MODEL ステートメントと関数呼び出しが必要。 非常に高い。1 回の関数呼び出しが必要。
使用されるデータ履歴 トレーニング データのすべての時点を使用。使用するタイムポイントを減らすようにカスタマイズ可能。 512 個のタイムポイントを使用。
精度 非常に高い。詳細については、前の行に記載されている刊行物をご覧ください。 非常に高い。詳細については、前の行に記載されている刊行物をご覧ください。
カスタマイズ 高。CREATE MODEL ステートメントには、次のような多くのモデル設定を調整できる引数が用意されています。
  • 季節性
  • 祝日効果
  • ステップの変化
  • トレンド
  • スパイクと低下の削除
  • 予測の上限と下限
低。
共変量をサポート はい(ARIMA_PLUS_XREG モデルを使用する場合)。 いいえ。
説明可能性 高。ML.EXPLAIN_FORECAST 関数を使用して、モデル コンポーネントを検査できます。 低。
最適なユースケース
  • カスタマイズを含めて、モデルを完全に制御する必要がある。
  • モデル出力の説明可能性が必要。
  • 最初にモデルを作成することなく、最小限の設定で予測を行う必要がある。

BigQuery ML のステートメントと関数のデフォルト設定を使用すると、ML の知識があまりなくても予測モデルを作成して使用できます。ただし、ML 開発、特に予測モデルに関する基本的な知識があれば、データとモデルの両方を最適化して、より良い結果を得るのに役立ちます。ML の手法とプロセスに習熟するために、次のリソースの活用をおすすめします。