Descripción general de BigQuery

BigQuery es una plataforma de datos completamente administrada y lista para la IA que te ayuda a administrar y analizar tus datos con funciones integradas como el aprendizaje automático, la búsqueda, el análisis geoespacial y la inteligencia empresarial. La arquitectura sin servidores de BigQuery te permite usar lenguajes como SQL y Python para responder las preguntas más importantes de tu organización sin necesidad de administrar la infraestructura.

BigQuery proporciona una manera uniforme de trabajar con datos estructurados y no estructurados, y es compatible con formatos de tablas abiertas, como Apache Iceberg, Delta y Hudi. La transmisión de BigQuery admite la transferencia y el análisis continuos de datos, mientras que el motor de análisis distribuido y escalable de BigQuery te permite consultar terabytes en segundos y petabytes en minutos.

BigQuery ofrece capacidades de administración integradas que te permiten descubrir y seleccionar datos, y administrar metadatos y la calidad de los datos. Con funciones como la búsqueda semántica y el linaje de datos, puedes encontrar y validar datos relevantes para el análisis. Puedes compartir datos y recursos de IA en toda tu organización con los beneficios del control de acceso. Estas funciones se basan en Dataplex Universal Catalog, que es una solución de administración inteligente y unificada para los recursos de datos y de IA en Trusted Cloud.

La arquitectura de BigQuery consta de dos partes: una capa de almacenamiento que transfiere, almacena y optimiza datos, y una capa de procesamiento que proporciona capacidades de estadísticas. Estas capas de procesamiento y almacenamiento operan de forma independiente unas de otras gracias a la red de escala de petabytes de Google que permite la comunicación necesaria entre ellas.

Por lo general, las bases de datos heredadas deben compartir recursos entre las operaciones de lectura y escritura, y las operaciones analíticas. Esto puede generar conflictos de recursos y puede ralentizar las consultas mientras los datos se escriben o leen desde el almacenamiento. Los grupos de recursos compartidos pueden verse aún más entrenados cuando se necesitan recursos para las tareas de administración de bases de datos, como asignar o revocar permisos. La separación de las capas de procesamiento y almacenamiento de BigQuery permite que cada capa asigne recursos de forma dinámica sin afectar el rendimiento ni la disponibilidad de la otra.

La arquitectura de BigQuery separa los recursos con la red de petabytes.

Este principio de separación permite que BigQuery innove más rápido, ya que las mejoras de almacenamiento y procesamiento se pueden implementar de forma independiente, sin tiempo de inactividad ni impacto negativo en el rendimiento del sistema. También es esencial ofrecer un almacén de datos sin servidores completamente administrado en el que el equipo de ingeniería de BigQuery se encarga de las actualizaciones y el mantenimiento. Como resultado, no necesitas aprovisionar ni escalar de forma manual los recursos, lo que te permite enfocarte en entregar valor en lugar de las tareas tradicionales de administración de bases de datos.

Las interfaces de BigQuery incluyen la Trusted Cloud interfaz de la consola y la herramienta de línea de comandos de BigQuery. Los desarrolladores y científicos de datos pueden usar bibliotecas cliente con programación conocida, como Python, Java, JavaScript y Go, así como la API de REST y la API de RPC de BigQuery para transformar y administrar datos. Los controladores ODBC y JDBC proporcionan interacción con las aplicaciones existentes, incluidas las herramientas y las utilidades de terceros.

Como analista de datos, ingeniero de datos, administrador de almacenes de datos o científico de datos, BigQuery te ayuda a cargar, procesar y analizar datos para tomar decisiones empresariales críticas.

Primeros pasos con BigQuery

Puedes comenzar a explorar BigQuery en minutos. Aprovecha el nivel de uso gratuito de BigQuery o la zona de pruebas sin costo para comenzar a cargar y consultar datos.

  1. Zona de pruebas de BigQuery: Comienza a usar la zona de pruebas de BigQuery sin riesgo y sin costo.
  2. Trusted Cloud Guía de inicio rápido de la consola: Familiarízate con la potencia de BigQuery Studio.
  3. Conjuntos de datos públicos: Experimenta el rendimiento de BigQuery explorando datos grandes y reales del Programa de conjuntos de datos públicos.

Explorar BigQuery

La infraestructura sin servidores de BigQuery permite que te enfoques en los datos en lugar de la administración de recursos. BigQuery combina un almacén de datos basado en la nube y herramientas de análisis potentes.

Almacenamiento de BigQuery

BigQuery almacena datos mediante un formato de almacenamiento en columnas optimizado para consultas analíticas. BigQuery presenta datos en tablas, filas y columnas y proporciona compatibilidad total con la semántica de transacción de la base de datos (ACID). El almacenamiento de BigQuery se replica de forma automática en varias ubicaciones para proporcionar una alta disponibilidad.

Para obtener más información, consulta Descripción general del almacenamiento de BigQuery.

Estadísticas de BigQuery

Los usos descriptivos y prescriptivos del análisis incluyen inteligencia empresarial, análisis ad hoc, estadísticas geoespaciales y aprendizaje automático. Puedes consultar datos almacenados en BigQuery o ejecutar consultas sobre datos en su ubicación mediante tablas externas o consultas federadas, incluidas Cloud Storage, Bigtable, Spanner o Hojas de cálculo de Google almacenadas en Google Drive.

  • Consultas de SQL estándar ANSI (compatibilidad con SQL:2011), incluida la compatibilidad con uniones, campos anidados y repetidos, funciones analíticas y de agregación, consultas de varias instrucciones y una variedad de funciones espaciales con estadísticas geoespaciales: sistemas de información geográfica.
  • Crea vistas para compartir tu análisis.
  • Compatibilidad con herramientas de inteligencia empresarial, incluidas Hojas de cálculo de Google y herramientas de terceros, como Tableau y Power BI.
  • BigQuery ML proporciona aprendizaje automático y estadísticas predictivas.
  • BigQuery Studio (vista previa) ofrece funciones como los notebooks de Python y el control de versión para los notebooks y las consultas guardadas. Estas funciones te facilitan completar los análisis de datos y los flujos de trabajo de aprendizaje automático (AA) en BigQuery.
  • Consulta datos fuera de BigQuery con ytablas externas.

Para obtener más información, consulta Descripción general de las estadísticas de BigQuery.

Administración de BigQuery

BigQuery proporciona administración centralizada de recursos de datos y procesamiento, mientras que Identity and Access Management (IAM) te ayuda a proteger esos recursos con el modelo de acceso que se usa en todo Trusted Cloud by S3NS.

  • La introducción a la seguridad y administración de datos te ayuda a comprender la administración de datos y qué controles podrías necesitar para proteger los recursos de BigQuery.
  • Los trabajos son acciones que BigQuery ejecuta en tu nombre para cargar, exportar, consultar o copiar datos.
  • Las reservas te permiten cambiar entre precios según demanda y basados en capacidad.

Para obtener más información, consulta Introducción a la administración de BigQuery.

Recursos de BigQuery

Explora los recursos de BigQuery:

API, herramientas y referencias

Materiales de referencia para desarrolladores y analistas de BigQuery:

¿Qué sigue?