Panoramica dell'analisi del contributo
Utilizza questo documento per comprendere il caso d'uso dell'analisi del contributo e le opzioni per eseguire l'analisi del contributo in BigQuery ML.
Che cos'è l'analisi del contributo?
L'analisi del contributo, chiamata anche analisi dei fattori chiave, è un metodo utilizzato per generare insight sulle modifiche alle metriche chiave nei dati multidimensionali. Ad esempio, puoi utilizzare l'analisi del contributo per vedere quali dati hanno contribuito a una variazione dei numeri di entrate in due trimestri o per confrontare due set di dati di addestramento per comprendere le variazioni nelle prestazioni di un modello di ML.
L'analisi del contributo è una forma di analisi aumentata, ovvero l'utilizzo dell'intelligenza artificiale (AI) per migliorare e automatizzare l' analisi e la comprensione dei dati. L'analisi del contributo raggiunge uno degli obiettivi chiave dell'analisi aumentata, ovvero aiutare gli utenti a trovare pattern nei loro dati.
Analisi del contributo con BigQuery ML
L'analisi del contributo rileva i segmenti di dati che mostrano variazioni in una determinata metrica confrontando un test set di dati con un set di dati di controllo. Ad esempio, puoi utilizzare uno snapshot della tabella dei dati di vendita acquisiti alla fine del 2023 come dati di test e uno snapshot della tabella acquisiti alla fine del 2022 come dati di controllo e confrontarli per vedere come sono cambiate le vendite nel tempo. L'analisi del contributo può mostrare quale segmento di dati, ad esempio i clienti online in una determinata regione, ha determinato la maggiore variazione delle vendite da un anno all'altro.
Una metrica è il valore numerico che i modelli di analisi del contributo utilizzano per misurare e confrontare le variazioni tra i dati di test e di controllo. Puoi specificare i seguenti tipi di metriche con un modello di analisi del contributo:
- Riassumibile: somma i valori di una colonna di metriche specificata e determina un totale per ogni segmento di dati.
- _Rapporto riassumibile_: somma i valori di due colonne numeriche specificate e determina il rapporto tra di esse per ogni segmento di dati.
- Riassumibile per categoria: somma il valore di una colonna numerica e lo divide per il numero di valori distinti di una colonna categorica.
Un segmento è una porzione dei dati identificata da una determinata combinazione di valori di dimensione. Ad esempio, per un modello di analisi del contributo basato sulle dimensioni store_number, customer_id e day, ogni combinazione univoca di questi valori di dimensione rappresenta un segmento. Nella tabella seguente, ogni riga rappresenta un segmento diverso:
store_number |
customer_id |
day |
| store 1 | ||
| store 1 | customer 1 | |
| store 1 | customer 1 | Monday |
| store 1 | customer 1 | Tuesday |
| store 1 | customer 2 | |
| store 2 |
Analizzare i dati senza un modello
Se hai meno di 12 dimensioni e utilizzi una metrica riassumibile, puoi
eseguire l'analisi del contributo utilizzando la
AI.KEY_DRIVERS TVF.
Per la maggior parte delle applicazioni, ti consigliamo di utilizzare la funzione AI.KEY_DRIVERS anziché creare un modello perché offre una sintassi semplificata, risultati più rapidi e potatura automatica. L'output della funzione è costituito da righe di insight, in cui ogni insight corrisponde a un segmento e fornisce le metriche corrispondenti del segmento.
Utilizzare un modello di analisi del contributo
Se hai bisogno di più di 12 dimensioni o di altri tipi
di metriche, puoi creare un modello di analisi del contributo con l'
CREATE MODEL istruzione.
Per ridurre il tempo di creazione del modello, specifica un soglia di supporto apriori. Una soglia di supporto apriori consente di potare i segmenti piccoli e meno pertinenti in modo che il modello utilizzi solo i segmenti più grandi e pertinenti.
Dopo aver creato un modello di analisi del contributo, puoi utilizzare la
ML.GET_INSIGHTS funzione
per recuperare le informazioni sulle metriche calcolate dal modello. L'output della funzione è costituito da righe di insight, in cui ogni insight corrisponde a un segmento e fornisce le metriche corrispondenti del segmento.
Percorso dell'utente dell'analisi del contributo
La tabella seguente descrive le istruzioni e le funzioni che puoi utilizzare con l'analisi del contributo:
| Istruzione o funzione | Pre-elaborazione delle caratteristiche | Generazione di insight | Tutorial |
|---|---|---|---|
AI.KEY_DRIVERS |
Pre-elaborazione manuale | N/D | Esempio di analisi del contributo sui dati di vendita di alcolici in Iowa |
CREATE MODEL |
Pre-elaborazione manuale | ML.GET_INSIGHTS |