Code Blog

谱聚类

来源: 刘建平Pinard 谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一。下面我们就对谱聚类的算法原理做一个总结。 1. 谱聚类概述 谱聚类是从图论中演化出来的...

PCA 算法 数学

参考: 知乎 PCA(Principal Component Analysis) 是一种常见的数据分析方式,常用于高维数据的降维,可用于提取数据的主要特征分量。 PCA 的数学推导可以从最大可分型和最近重构性两方面进行,前者的优化条件为划分后方差最大,后者的优化条件为点到划分平面距离最小,这里我将从最大可分性的角度进行证明。 向量表示与基变换 我们先来介绍些线性代数的基本知识。 内积...

奇异值分解

参考:漫漫成长 以下内容来自刘建平Pinard的学习笔记,总结如下: 奇异值分解(Singular Value Decomposition,以下简称 SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域。是很多机器学习算法的基石。本文就对 SVD 的原理做一个总结,并讨论在在PCA降维算法中是如何运用运用 SVD 的。 1...