Présentation des ensembles de données
Cette page offre un aperçu des ensembles de données dans BigQuery.
Ensembles de données
Un ensemble de données est contenu dans un projet spécifique. Les ensembles de données sont des conteneurs de niveau supérieur utilisés pour organiser et contrôler l'accès à vos tables et vues. Une table ou une vue doit appartenir à un ensemble de données. Vous devez donc créer au moins un ensemble de données avant de charger des données dans BigQuery.
Utilisez le format projectname.datasetname
pour qualifier entièrement un nom d'ensemble de données lorsque vous utilisez GoogleSQL, ou le format projectname:datasetname
pour qualifier entièrement un nom d'ensemble de données lorsque vous utilisez l'outil de ligne de commande bq.
Emplacement
Lorsque vous créez un ensemble de données, vous spécifiez une zone pour stocker vos données BigQuery. Pour obtenir la liste des emplacements des ensembles de données BigQuery, consultez Emplacements BigQuery. Une fois que vous avez créé l'ensemble de données, l'emplacement ne peut plus être modifié.
BigQuery traite les requêtes dans le même emplacement que l'ensemble de données contenant les tables que vous interrogez. BigQuery stocke vos données dans la zone sélectionnée.
Conservation des données
Les ensembles de données utilisent la fonctionnalité temporelle conjointement avec la période de sécurité pour conserver les données supprimées et modifiées pendant une courte période, au cas où vous auriez besoin de les récupérer. Pour en savoir plus, consultez la page Conservation des données avec la fonctionnalité temporelle et de sécurité.
Ensembles de données externes
En plus des ensembles de données BigQuery, vous pouvez créer des ensembles de données externes, qui sont des liens vers des sources de données externes:
Notez que les ensembles de données externes sont également appelés ensembles de données fédérés. Les deux termes sont utilisés de manière interchangeable.
Une fois créés, les ensembles de données externes contiennent des tables provenant d'une source de données externe référencée. Les données de ces tables ne sont pas copiées dans BigQuery, mais interrogées chaque fois qu'elles sont utilisées. Pour en savoir plus, consultez la section Requêtes fédérées Spanner.
Limites
Les ensembles de données BigQuery sont soumis aux limitations suivantes :
- L'emplacement de l'ensemble de données ne peut être défini qu'au moment de la création. Une fois l'ensemble de données créé, l'emplacement ne peut plus être modifié.
- Toutes les tables référencées dans une requête doivent être stockées dans des ensembles de données situés au même emplacement.
Les ensembles de données externes ne sont pas compatibles avec l'expiration des tables, les réplicas, le voyage dans le temps, la collation par défaut, le mode d'arrondi par défaut ni l'option d'activation ou de désactivation de la casse des noms de tables.
Lorsque vous copiez une table, les ensembles de données contenant la table source et la table de destination doivent se trouver au même emplacement.
Les noms d'ensembles de données doivent être uniques pour chaque projet.
Quotas
Pour plus d'informations sur les quotas et les limites des ensembles de données, consultez la page Quotas et limites.
Sécurité
Pour savoir comment contrôler l'accès aux ensembles de données dans BigQuery, consultez la page Contrôler l'accès aux ensembles de données. Pour en savoir plus sur le chiffrement des données, consultez la page Chiffrement au repos.
Étapes suivantes
- Pour en savoir plus sur la création des ensembles de données, consultez la page Créer des ensembles de données.
- Pour en savoir plus sur l'attribution de contrôles d'accès aux ensembles de données, consultez la page Contrôler l'accès aux ensembles de données.