AI人工智能 聚类概述
无监督机器学习算法无需任何监督者提供指导,这也是这类算法与人们口中的真正人工智能高度契合的原因。
在无监督学习中,不存在既定的正确答案,也没有可供参考的指导依据,算法需要自主从数据中发现有价值的规律来完成学习过程。
什么是聚类?
聚类本质上是一种无监督学习方法,也是多个领域中常用的统计数据分析技术。聚类的核心任务是将一组观测数据划分为若干个子集(即簇),使得同一簇内的观测数据在某种维度上具有相似性,而不同簇间的观测数据则具有明显的差异性。
简单来说,聚类的最终目标是依据数据的相似性与差异性对其进行分组。
例如,下图展示了不同簇中聚集的同类数据,不同簇间的特征差异显著: (注:原文对应聚类效果示意图,核心为不同簇的同类数据聚集分布)
