Resumen de BigQuery

BigQuery es una plataforma de datos totalmente gestionada y preparada para la IA que te ayuda a gestionar y analizar tus datos con funciones integradas como el aprendizaje automático, la búsqueda, el análisis geoespacial y la inteligencia empresarial. La arquitectura sin servidor de BigQuery te permite usar lenguajes como SQL y Python para responder a las preguntas más importantes de tu organización sin necesidad de gestionar la infraestructura.

BigQuery ofrece una forma uniforme de trabajar con datos estructurados y sin estructurar, y admite formatos de tabla abiertos como Apache Iceberg, Delta y Hudi. El streaming de BigQuery admite la ingestión y el análisis continuos de datos, mientras que el motor de análisis escalable y distribuido de BigQuery te permite consultar terabytes en segundos y petabytes en minutos.

BigQuery ofrece funciones de gobierno integradas que te permiten descubrir y organizar datos, así como gestionar metadatos y la calidad de los datos. Gracias a funciones como la búsqueda semántica y el linaje de datos, puede encontrar y validar datos relevantes para el análisis. Puedes compartir datos y recursos de IA en toda tu organización y disfrutar de las ventajas del control de acceso. Estas funciones se basan en Dataplex Universal Catalog, que es una solución de gobernanza unificada e inteligente para los recursos de datos y de IA en Trusted Cloud.

La arquitectura de BigQuery consta de dos partes: una capa de almacenamiento que ingiere, almacena y optimiza datos, y una capa de computación que proporciona funciones analíticas. Estas capas de computación y almacenamiento funcionan de forma eficiente e independiente entre sí gracias a la red a escala de petabits de Google, que permite la comunicación necesaria entre ellas.

Las bases de datos antiguas suelen tener que compartir recursos entre operaciones de lectura y escritura, así como operaciones analíticas. Esto puede provocar conflictos de recursos y ralentizar las consultas mientras se escriben o leen datos del almacenamiento. Los grupos de recursos compartidos pueden verse aún más presionados cuando se necesitan recursos para tareas de gestión de bases de datos, como asignar o revocar permisos. La separación de las capas de computación y almacenamiento de BigQuery permite que cada capa asigne recursos de forma dinámica sin que afecte al rendimiento ni a la disponibilidad de la otra.

La arquitectura de BigQuery separa los recursos con una red de petabits.

Este principio de separación permite a BigQuery innovar más rápido, ya que las mejoras de almacenamiento y de computación se pueden implementar de forma independiente, sin tiempo de inactividad ni repercusiones negativas en el rendimiento del sistema. También es fundamental para ofrecer un almacén de datos sin servidor totalmente gestionado en el que el equipo de ingeniería de BigQuery se encarga de las actualizaciones y el mantenimiento. De esta forma, no tendrás que aprovisionar ni escalar recursos manualmente, por lo que podrás centrarte en ofrecer valor en lugar de en las tareas tradicionales de gestión de bases de datos.

Las interfaces de BigQuery incluyen la interfaz de la consola y la herramienta de línea de comandos de BigQuery. Trusted Cloud Los desarrolladores y los científicos de datos pueden usar bibliotecas de cliente con lenguajes de programación conocidos, como Python, Java, JavaScript y Go, así como la API REST y la API RPC de BigQuery para transformar y gestionar datos. Los controladores ODBC y JDBC permiten interactuar con aplicaciones, herramientas y utilidades de terceros.

Si eres analista de datos, ingeniero de datos, administrador de almacén de datos o científico de datos, BigQuery te ayuda a cargar, procesar y analizar datos para tomar decisiones empresariales cruciales.

Empieza a usar BigQuery

Puedes empezar a explorar BigQuery en cuestión de minutos. Aprovecha el nivel de uso gratuito o el entorno aislado sin coste de BigQuery para empezar a cargar y consultar datos.

  1. Entorno aislado de BigQuery: empieza a usar el entorno aislado de BigQuery sin coste y sin riesgos.
  2. Trusted Cloud Guía de inicio rápido de la consola: familiarízate con las funciones de BigQuery Studio.
  3. Conjuntos de datos públicos: descubre el rendimiento de BigQuery explorando grandes conjuntos de datos reales del programa de conjuntos de datos públicos.

Descubrir BigQuery

La infraestructura sin servidor de BigQuery te permite centrarte en tus datos en lugar de en la gestión de recursos. BigQuery combina un almacén de datos basado en la nube con potentes herramientas analíticas.

Almacenamiento de BigQuery

BigQuery almacena los datos con un formato de almacenamiento en columnas optimizado para las consultas analíticas. BigQuery presenta los datos en tablas, filas y columnas, y ofrece compatibilidad total con la semántica de las transacciones de bases de datos (ACID). El almacenamiento de BigQuery se replica automáticamente en varias ubicaciones para ofrecer una alta disponibilidad.

Para obtener más información, consulta la información general sobre el almacenamiento de BigQuery.

Analíticas de BigQuery

Entre los usos del análisis descriptivo y prescriptivo se incluyen la inteligencia empresarial, el análisis ad hoc, la analítica geoespacial y el aprendizaje automático. Puede consultar los datos almacenados en BigQuery o ejecutar consultas sobre los datos allí donde se encuentren mediante tablas externas o consultas federadas, como Cloud Storage, Bigtable, Spanner u Hojas de cálculo de Google almacenadas en Google Drive.

  • Consultas SQL estándar ANSI (compatibilidad con SQL:2011), incluida la compatibilidad con combinaciones, campos anidados y repetidos, funciones analíticas y de agregación, consultas de varias instrucciones y una variedad de funciones espaciales con analíticas geoespaciales (sistemas de información geográfica).
  • Crea vistas para compartir tu análisis.
  • Compatibilidad con herramientas de inteligencia empresarial, como Hojas de cálculo de Google y herramientas de terceros, como Tableau y Power BI.
  • BigQuery ML proporciona aprendizaje automático y analíticas predictivas.
  • BigQuery Studio ofrece funciones como cuadernos de Python y control de versiones tanto para cuadernos como para consultas guardadas. Estas funciones te facilitan la realización de tus flujos de trabajo de análisis de datos y aprendizaje automático (ML) en BigQuery.
  • Consulta datos fuera de BigQuery con y tablas externas.

Para obtener más información, consulta la descripción general de las analíticas de BigQuery.

Administración de BigQuery

BigQuery ofrece una gestión centralizada de los recursos de datos y de computación, mientras que Gestión de Identidades y Accesos (IAM) te ayuda a proteger esos recursos con el modelo de acceso que se usa en todo Trusted Cloud by S3NS.

  • Introducción a la seguridad y el gobierno de datos te ayuda a entender el gobierno de datos y los controles que puedes necesitar para proteger los recursos de BigQuery.
  • Las tareas son acciones que BigQuery ejecuta en tu nombre para cargar, exportar, consultar o copiar datos.
  • Reservas te permite cambiar entre precios bajo demanda y precios basados en la capacidad.

Para obtener más información, consulta la introducción a la administración de BigQuery.

Recursos de BigQuery

Explorar recursos de BigQuery:

APIs, herramientas y referencias

Materiales de referencia para desarrolladores y analistas de BigQuery:

Siguientes pasos