Panoramica dell'analisi del contributo
Utilizza questo documento per comprendere lo scenario d'uso dell'analisi del contributo e le opzioni per eseguire l'analisi del contributo in BigQuery ML.
Che cos'è l'analisi del contributo?
L'analisi del contributo, chiamata anche analisi dei fattori chiave, è un metodo utilizzato per generare insight sulle modifiche alle metriche chiave nei dati multidimensionali. Ad esempio, puoi utilizzare l'analisi del contributo per vedere quali dati hanno contribuito a una variazione dei numeri di entrate in due trimestri o per confrontare due set di dati di addestramento per comprendere le variazioni nelle prestazioni di un modello di ML.
L'analisi del contributo è una forma di analisi aumentata, ovvero l'uso dell'intelligenza artificiale (AI) per migliorare e automatizzare l'analisi e la comprensione dei dati. L'analisi del contributo raggiunge uno degli obiettivi chiave dell'analisi aumentata, ovvero aiutare gli utenti a trovare pattern nei loro dati.
Analisi del contributo con BigQuery ML
Per utilizzare l'analisi del contributo in BigQuery ML, crea un modello di analisi del contributo con l'istruzione CREATE MODEL
.
Un modello di analisi del contributo rileva i segmenti di dati che mostrano variazioni in una determinata metrica confrontando un set di dati di test con un set di dati di controllo. Ad esempio, potresti utilizzare uno snapshot della tabella dei dati di vendita acquisiti alla fine del 2023 come dati di test e uno snapshot della tabella acquisito alla fine del 2022 come dati di controllo e confrontarli per vedere come sono cambiate le vendite nel tempo. Un modello di analisi del contributo potrebbe mostrare quale segmento di dati, ad esempio i clienti online in una determinata regione, ha determinato la variazione più significativa delle vendite da un anno all'altro.
Una metrica è il valore numerico utilizzato dai modelli di analisi del contributo per misurare e confrontare le variazioni tra i dati di test e di controllo. Puoi specificare i seguenti tipi di metriche con un modello di analisi del contributo:
- Sommabile: somma i valori di una colonna metrica specificata e poi determina un totale per ogni segmento dei dati.
- Rapporto sommabile: somma i valori di due colonne numeriche specificate e determina il rapporto tra loro per ogni segmento dei dati.
- Sommabile per categoria: somma il valore di una colonna numerica e lo divide per il numero di valori distinti di una colonna categorica.
Un segmento è una porzione dei dati identificata da una determinata combinazione di valori delle dimensioni. Ad esempio, per un modello di analisi del contributo basato sulle dimensioni
store_number
, customer_id
e day
, ogni combinazione univoca di
questi valori di dimensione rappresenta un segmento. Nella tabella seguente, ogni riga
rappresenta un segmento diverso:
store_number |
customer_id |
day |
negozio 1 | ||
negozio 1 | cliente 1 | |
negozio 1 | cliente 1 | Lunedì |
negozio 1 | cliente 1 | Martedì |
negozio 1 | cliente 2 | |
negozio 2 |
Per ridurre il tempo di creazione del modello, specifica una soglia di supporto a priori. Una soglia di supporto a priori consente di eliminare i segmenti piccoli e meno pertinenti in modo che il modello utilizzi solo i segmenti più grandi e pertinenti.
Dopo aver creato un modello di analisi di contributo, puoi utilizzare la
funzione ML.GET_INSIGHTS
per recuperare le informazioni sulla metrica calcolate dal modello. L'output del modello
è costituito da righe di approfondimenti, in cui ogni approfondimento corrisponde a un segmento e
fornisce le metriche corrispondenti del segmento.
Passaggi successivi
- Creare un modello di analisi del contributo
- Ottieni insight sui dati da un modello di analisi di contributo