Présentation du prétraitement des caractéristiques

Le prétraitement des caractéristiques est l'une des étapes les plus importantes du cycle de vie du machine learning. Il s'agit de créer des caractéristiques et de nettoyer les données d'entraînement. La création de caractéristiques est également appelée ingénierie des caractéristiques.

BigQuery ML fournit les techniques de prétraitement de caractéristiques suivantes :

  • Prétraitement automatique. BigQuery ML effectue un prétraitement automatique pendant l'entraînement. Pour en savoir plus, consultez la page Prétraitement automatique des caractéristiques.

  • Prétraitement manuel. Vous pouvez utiliser la clause TRANSFORM dans l'instruction CREATE MODEL pour définir un prétraitement personnalisé à l'aide de fonctions de prétraitement manuel. Vous pouvez également utiliser ces fonctions en dehors de la clause TRANSFORM pour traiter les données d'entraînement avant de créer le modèle.

Obtenir des informations sur les caractéristiques

Vous pouvez utiliser la fonction ML.FEATURE_INFO pour récupérer les statistiques de toutes les colonnes de caractéristiques d'entrée.

En utilisant les paramètres par défaut dans les instructions CREATE MODEL et les fonctions d'inférence, vous pouvez créer et utiliser des modèles BigQuery ML même si vous n'avez pas beaucoup de connaissances en ML. Toutefois, des connaissances de base sur le cycle de vie du développement du ML, comme l'extraction de caractéristiques et l'entraînement des modèles, vous aident à optimiser à la fois vos données et votre modèle pour obtenir de meilleurs résultats. Nous vous recommandons d'utiliser les ressources suivantes pour vous familiariser avec les techniques et les processus de ML :

Étapes suivantes

Découvrez la publication de caractéristiques dans BigQuery ML.