我正在学习线性代数(最近开始),很想知道它在机器学习中的应用,我在哪里可以读到这个
谢谢
线性代数为大多数机器学习算法提供计算引擎.
例如,ML的最显着和最频繁的应用可能是推荐引擎.
除了数据检索之外,这些算法的真正关键通常是"重建"用作这些引擎的输入的可笑稀疏数据.提供给Amazon.com基于用户的R/E的原始数据(可能)是一个海量数据矩阵,其中用户是行,其产品在列中表示.因此,为了有机地填充这个矩阵,每个客户都必须购买Amazon.com销售的每个产品.这里使用基于线性代数的技术.
当前使用的所有技术都涉及某种类型的矩阵分解,一类基本的线性代数技术(例如,非负矩阵近似,以及 正 - 最大 - 边缘 - 矩阵近似(警告链接到pdf!)可能是两者最常见的)
其次,许多(如果不是大多数)ML技术依赖于数值优化技术.例如,大多数受监督的ML算法涉及通过最小化由新生分类器计算的值与来自训练数据的实际值之间的差来创建训练的分类器/回归器.这可以迭代地或使用线性代数技术来完成.如果是后者,则该技术通常是SVD或某些变体.
第三,基于频谱的分解 --PCA(主成分分析)和内核PCA - 可能是最常用的降维技术,通常应用于数据流中ML算法之前的预处理步骤,例如,PCA经常在Kohonen Map中用于初始化晶格.在这些技术之下的主要见解是协方差矩阵的特征向量(从原始数据矩阵准备的在主对角线下方具有零的正方形对称矩阵)是单位长度并且彼此正交.