【读书笔记】算法漫步 第19章
2023-07-30 23:24:55
来源:哔哩哔哩
问题16聚类
(相关资料图)
聚类是要将若干对象划分为几组,称每一组为一个类别。
也就是说,聚类本无类,只是根据对象之间的某种相似性,将它们分组。
聚类是一个无监督的学习过程,其目的就是把相似的数据聚合(划分)到一起。
设计分类算法的目的就是实现一个“分类器”。分类器的实现通常都是基于一批已知类别的数据,形成某些规则,来做未知类别对象的类别判断。
为了聚类,对象之间、类之间的相似性(或距离)含义和定义是基础。
如果用计算机来做聚类,也涉及距离的定义和计算。
本章介绍了
层次聚类和K-means(K均值)算法
【作者感受】
计算机来做聚类,如何设定对象的特征标准化和维度,如何根据对象的特征属性按照一定的规则计算相似性,都是很有挑战的事情,决定了聚类算法的实现难度,和聚类结果有意义的程度。
标签: