codecamp

SAS频率分布

频率分布是示出数据集中的数据点的频率的表。 表中的每个条目包含特定组或间隔内的值的出现频率或计数,并且以这种方式,表概括了样本中的值的分布。

SAS提供了一个称为PROC FREQ的过程来计算数据集中数据点的频率分布。

语法

SAS中计算频率分布的基本语法是:

PROC FREQ DATA = Dataset ;
TABLES Variable_1 ;
BY Variable_2 ;

以下是使用的参数的描述:

  • Dataset是数据集的名称。
  • Variables_1是需要计算其频率分布的数据集的变量名称。
  • Variables_2是对频率分布结果进行分类的变量。

单变量频率分布

我们可以使用PROC FREQ确定单个变量的频率分布。 在这种情况下,结果将显示变量的每个值的频率。 结果还显示百分比分布,累积频率和累积百分比。

在下面的例子中,我们找到名为CARS1的数据集的变量马力的频率分布,该数据集是从库SASHELP.CARS创建的。 我们可以看到结果分为两类结果。 一个为汽车的每一个。

PROC SQL;
create table CARS1 as
SELECT make,model,type,invoice,horsepower,length,weight
 FROM 
SASHELP.CARS
WHERE make in ('Audi','BMW')
;
RUN;

proc FREQ data=CARS1 ;
tables horsepower; 
by make;
run;

当执行上面的代码中,我们得到以下结果:

多变量频率分布

我们可以找到多个变量的频率分布,将它们分组成所有可能的组合。

在下面的例子中,我们计算按汽车类型分组的汽车制造的频率分布,以及按每种制造分组的每种类型汽车的频率分布。

proc FREQ data=CARS1 ;
tables make type; 
run;

当执行上面的代码中,我们得到以下结果:

频率分布与重量

使用权重选项,我们可以计算用变量的权重偏置的频率分布。 这里,变量的值被取为观察值的数量,而不是值的计数。

在下面的例子中,我们计算变量make和type的频率分布,分配给马力的权重。

proc FREQ data=CARS1 ;
tables make type; 
weight horsepower;
run;

当执行上面的代码中,我们得到以下结果:


SAS单因素方差分析
SAS假设检验
温馨提示
下载编程狮App,免费阅读超1000+编程语言教程
取消
确定
目录

关闭

MIP.setData({ 'pageTheme' : getCookie('pageTheme') || {'day':true, 'night':false}, 'pageFontSize' : getCookie('pageFontSize') || 20 }); MIP.watch('pageTheme', function(newValue){ setCookie('pageTheme', JSON.stringify(newValue)) }); MIP.watch('pageFontSize', function(newValue){ setCookie('pageFontSize', newValue) }); function setCookie(name, value){ var days = 1; var exp = new Date(); exp.setTime(exp.getTime() + days*24*60*60*1000); document.cookie = name + '=' + value + ';expires=' + exp.toUTCString(); } function getCookie(name){ var reg = new RegExp('(^| )' + name + '=([^;]*)(;|$)'); return document.cookie.match(reg) ? JSON.parse(document.cookie.match(reg)[2]) : null; }