Présentation du prétraitement des caractéristiques
Le prétraitement des caractéristiques est l'une des étapes les plus importantes du cycle de vie du machine learning. Il s'agit de créer des caractéristiques et de nettoyer les données d'entraînement. La création de caractéristiques est également appelée ingénierie des caractéristiques.
BigQuery ML fournit les techniques de prétraitement de caractéristiques suivantes :
Prétraitement automatique. BigQuery ML effectue un prétraitement automatique pendant l'entraînement. Pour en savoir plus, consultez la page Prétraitement automatique des caractéristiques.
Prétraitement manuel. Vous pouvez utiliser la clause
TRANSFORM
dans l'instructionCREATE MODEL
pour définir un prétraitement personnalisé à l'aide de fonctions de prétraitement manuel. Vous pouvez également utiliser ces fonctions en dehors de la clauseTRANSFORM
pour traiter les données d'entraînement avant de créer le modèle.
Obtenir des informations sur les caractéristiques
Vous pouvez utiliser la fonction ML.FEATURE_INFO
pour récupérer les statistiques de toutes les colonnes de caractéristiques d'entrée.
Connaissances recommandées
En utilisant les paramètres par défaut dans les instructions CREATE MODEL
et les fonctions d'inférence, vous pouvez créer et utiliser des modèles BigQuery ML même si vous n'avez pas beaucoup de connaissances en ML. Toutefois, des connaissances de base sur le cycle de vie du développement du ML, comme l'extraction de caractéristiques et l'entraînement des modèles, vous aident à optimiser à la fois vos données et votre modèle pour obtenir de meilleurs résultats. Nous vous recommandons d'utiliser les ressources suivantes pour vous familiariser avec les techniques et les processus de ML :
- Cours d'initiation au machine learning
- Présentation du machine learning
- Nettoyage des données
- Ingénierie des caractéristiques
- Machine learning intermédiaire
Étapes suivantes
Découvrez la publication de caractéristiques dans BigQuery ML.