Es posible que parte de la información de esta página (o toda) no se aplique a Trusted Cloud de S3NS.
Descripción general de la detección de anomalías
La detección de anomalías es una técnica de extracción de datos que puedes usar para identificar desviaciones de datos en un conjunto de datos determinado. Por ejemplo, si la tasa de devoluciones de un producto determinado aumenta significativamente con respecto al modelo de referencia de ese producto, podría indicar un defecto en el producto o un posible fraude. Puedes usar la detección de anomalías para detectar los incidentes críticos, como problemas técnicos, o las oportunidades, como cambios en el comportamiento de los consumidores.
Uno de los desafíos cuando se utiliza la detección de anomalías es determinar qué se cuenta como datos anómalos. Si tienes datos etiquetados que identifican anomalías, puedes realizar la detección de anomalías con la función ML.PREDICT
con uno de los siguientes modelos de aprendizaje automático supervisado:
Si no estás seguro de qué cuenta como datos anómalos o no tienes datos etiquetados para entrenar un modelo, puedes usar el aprendizaje automático no supervisado para realizar la detección de anomalías. Usa la función ML.DETECT_ANOMALIES
con uno de los siguientes modelos para detectar anomalías en los datos de entrenamiento o en los datos de entrega nuevos:
Conocimientos recomendados
Si usas la configuración predeterminada en las sentencias CREATE MODEL
y las
funciones de inferencia, puedes crear y usar un modelo de detección de anomalías
incluso sin mucho conocimiento de AA. Sin embargo, tener conocimientos básicos sobre
el desarrollo de AA te ayuda a optimizar tus datos y tu modelo para
obtener mejores resultados. Te recomendamos que uses los siguientes recursos para familiarizarte con las técnicas y los procesos de la IA:
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-08-17 (UTC)
[[["Fácil de comprender","easyToUnderstand","thumb-up"],["Resolvió mi problema","solvedMyProblem","thumb-up"],["Otro","otherUp","thumb-up"]],[["Falta la información que necesito","missingTheInformationINeed","thumb-down"],["Muy complicado o demasiados pasos","tooComplicatedTooManySteps","thumb-down"],["Desactualizado","outOfDate","thumb-down"],["Problema de traducción","translationIssue","thumb-down"],["Problema con las muestras o los códigos","samplesCodeIssue","thumb-down"],["Otro","otherDown","thumb-down"]],["Última actualización: 2025-08-17 (UTC)"],[[["\u003cp\u003eAnomaly detection is a data mining technique used to identify deviations in datasets, which can signal product defects, fraud, or changes in consumer behavior.\u003c/p\u003e\n"],["\u003cp\u003eIf you have labeled data, supervised machine learning models like linear regression, boosted trees, random forest, DNN, Wide & Deep, and AutoML models can be used with the \u003ccode\u003eML.PREDICT\u003c/code\u003e function for anomaly detection.\u003c/p\u003e\n"],["\u003cp\u003eWhen you lack labeled data or are uncertain about what constitutes anomalous data, unsupervised machine learning can be employed with the \u003ccode\u003eML.DETECT_ANOMALIES\u003c/code\u003e function.\u003c/p\u003e\n"],["\u003cp\u003eThe \u003ccode\u003eML.DETECT_ANOMALIES\u003c/code\u003e function supports various model types, including ARIMA_PLUS, ARIMA_PLUS_XREG, K-means, Autoencoder, and PCA, each suited for different data types such as time series or independent and identically distributed random variables.\u003c/p\u003e\n"],["\u003cp\u003eBasic knowledge of ML can enhance anomaly detection results, and resources such as the Machine Learning Crash Course, Intro to Machine Learning, and Intermediate Machine Learning are recommended to develop this knowledge.\u003c/p\u003e\n"]]],[],null,["# Anomaly detection overview\n==========================\n\nAnomaly detection is a data mining technique that you can use to identify data\ndeviations in a given dataset. For example, if the return rate for a given\nproduct increases substantially from the baseline for that product, that might\nindicate a product defect or potential fraud. You can use anomaly detection to\ndetect critical incidents, such as technical issues, or opportunities, such as\nchanges in consumer behavior.\n\nOne challenge when you use anomaly detection is determining what counts as\nanomalous data. If you have labeled data that identifies anomalies, you can\nperform anomaly detection by using the\n[`ML.PREDICT` function](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-predict)\nwith one of the following supervised machine learning models:\n\n- [Linear and logistic regression models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-glm)\n- [Boosted trees models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-boosted-tree)\n- [Random forest models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-random-forest)\n- [Deep neural network (DNN) models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-dnn-models)\n- [Wide \\& Deep models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-wnd-models)\n- [AutoML models](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-create-automl)\n\nIf you aren't certain what counts as anomalous data, or you don't have labeled\ndata to train a model on, you can use unsupervised machine learning to perform\nanomaly detection. Use the\n[`ML.DETECT_ANOMALIES` function](/bigquery/docs/reference/standard-sql/bigqueryml-syntax-detect-anomalies)\nwith one of the following models to detect anomalies in training data or new\nserving data:\n\nRecommended knowledge\n---------------------\n\nBy using the default settings in the `CREATE MODEL` statements and the\ninference functions, you can create and use an anomaly detection\nmodel even without much ML knowledge. However, having basic knowledge about\nML development helps you optimize both your data and your model to\ndeliver better results. We recommend using the following resources to develop\nfamiliarity with ML techniques and processes:\n\n- [Machine Learning Crash Course](https://developers.google.com/machine-learning/crash-course)\n- [Intro to Machine Learning](https://www.kaggle.com/learn/intro-to-machine-learning)\n- [Intermediate Machine Learning](https://www.kaggle.com/learn/intermediate-machine-learning)"]]