偏最小二乘法pls中控制变量的处理

偏最小二乘回归≈多元线性回归分析+典型相关分析+主成分分析。

偏最小二乘回归是多元线性回归的推广,不需要这些数据约束。

在偏最小二乘回归中,预测方程将由从矩阵Y'XX'Y中提取的因子来描述;为了更具代表性,提取的预测方程的数量可以大于变量x和y的最大数量

简而言之,偏最小二乘回归可能是所有多元校正方法中约束最少的方法,这使得它适用于许多传统多元校正方法不适用的场合,比如当一些观测数据小于预测变量时。而且,偏最小二乘回归可以作为一种探索性的分析工具。在使用传统的线性回归模型之前,预测合适的变量个数,并去除噪声干扰。

偏最小二乘回归作为一种多元线性回归方法,主要目的是建立一个线性模型:Y=XB+E,其中Y是一个有m个变量和n个样本点的响应矩阵,X是一个有p个变量和n个样本点的预测矩阵,b是一个回归系数矩阵,E是一个噪声校正模型,与Y具有相同的维数,一般情况下,变量X和Y在用于计算之前是标准化的,即减去它们的平均值,再除以标准差。

简单来说,PLS是一种预测方法,得到的值就是用这种方法得到的预测值。