相关性分析处理变量之间的关系。 相关系数是两个变量之间的线性关联的度量。相关系数的值总是在-1和+1之间。 SAS提供过程PROC CORR以找到数据集中的一对变量之间的相关系数。
语法
在SAS中应用PROC CORR的基本语法是:
PROC CORR DATA = dataset options; VAR variable;
以下是使用的参数的描述:
- Dataset是数据集的名称。
- 选项是附加选项,其中包括绘制矩阵等过程。
- 变量是用于查找相关性的数据集的变量名称。
例
数据集中可用的一对变量之间的相关系数可以通过在VAR语句中使用它们的名称来获得。 在下面的例子中,我们使用数据集CARS1并得到显示马力和重量之间的相关系数的结果。
PROC sql; create table CARS1 as SELECT invoice,horsepower,length,weight FROM SASHELP.CARS WHERE make in ('Audi','BMW') ; RUN; proc corr data=cars1 ; VAR horsepower weight ; BY make; run;
当执行上面的代码中,我们得到以下结果:
所有变量之间的相关性
通过简单地应用具有数据集名称的过程,可以获得数据集中可用的所有变量之间的相关系数。
例
在下面的例子中,我们使用数据集CARS1并获得显示每对变量之间的相关系数的结果。
proc corr data=cars1 ; run;
当执行上面的代码中,我们得到以下结果:
相关矩阵
我们可以通过在PROC语句中选择绘制矩阵的选项来获得变量之间的散点图矩阵。
例
在下面的例子中,我们得到马力和重量之间的矩阵。
proc corr data=cars1 plots=matrix ; VAR horsepower weight ; run;
当执行上面的代码中,我们得到以下结果: