이 페이지의 일부 또는 모든 정보는 S3NS의 Cloud de Confiance에 적용되지 않을 수 있습니다. 자세한 내용은 Google Cloud와의 차이점을 참조하세요.

클러스터링 개요

클러스터링은 비슷한 레코드를 함께 그룹화하는 데 사용할 수 있는 비지도 머신러닝 기법입니다. 데이터에 어떤 그룹이나 클러스터가 있는지 파악하고 싶지만 모델을 학습할 라벨 지정 데이터가 없을 때 유용한 접근 방식입니다. 예를 들어 지하철 티켓 구매에 관한 라벨이 지정되지 않은 데이터가 있는 경우 티켓 구매 시간별로 데이터를 클러스터링하여 지하철 사용이 가장 많은 기간을 더 잘 파악할 수 있습니다. 자세한 내용은 클러스터링이란 무엇인가요?를 참고하세요.

K-평균 모델은 클러스터링을 수행하는 데 널리 사용됩니다. ML.PREDICT 함수와 함께 k-평균 모델을 사용하여 데이터를 클러스터링하거나 ML.DETECT_ANOMALIES 함수와 함께 사용하여 이상 감지를 실행할 수 있습니다.

K-평균 모델은 중심 기반 클러스터링을 사용하여 데이터를 클러스터로 구성합니다. k-평균 모델의 중심에 관한 정보를 가져오려면 ML.CENTROIDS 함수를 사용하면 됩니다.

클러스터링 개요

추천 지식