'variance'에 해당되는 글 1건

  1. 2015.08.15 stddev, variance function

평균의 신뢰도를 파악하기 위해 분산//혹은 표준편차를 구한다.

 

관련한 오라클 함수는 아래와 같다.

 

variance(=var_samp) : 표본분산

stddev(=stddev_samp) : 표본표준편차

 

 

var_pop : 모집단 분산

stddev_pop : 모집단 표준편차

 

 salary(도수)  편차  편차제곱  모집단분산  샘플분산
4400 -4375 19140625  30429875  32031447.37
13000 4225 17850625  sum(c2:c21)/20  sum(c2:c21)/20
6000 -2775 7700625    
12000 3225 10400625  모집단표준편차  샘플표준편차
8300 -475 225625  5516.328036  5659.633148
24000 15225 231800625  30429875^(1/2)  32031447.37^(1/2)
17000 8225 67650625    
17000 8225 67650625    
9000 225 50625    
6000 -2775 7700625    
4200 -4575 20930625    
5800 -2975 8850625    
3500 -5275 27825625    
3100 -5675 32205625    
2600 -6175 38130625    
2500 -6275 39375625    
10500 1725 2975625    
11000 2225 4950625    
8600 -175 30625    
7000 -1775 3150625    

 

분산을 먼저 구하고 표준편차를 구함

사례수가 20이고 평균이 8775 이며, 편차들의 제곱의 합은 608597500 이다.

 

모집단(전체) 분산과 모집단(전체) 표준편차

- 모집단 분산: 편차의 제곱의 합을 사례수로 나눈다. => 608597500/20 = 30429875

- 모집단 표준편차: 모집단분산을 제곱근한다. => 30429875^(1/2) = 5516.328036

 

 

표본(샘플)분산과 표본(샘플)표준편차

- 표본 분산: 편차의 제곱의 합을 사례수-1로 나눈다. => 608597500/19 = 32031447.37

- 표본 표준편차: 표본분산을 제곱근한다. => 32031447.37^(1/2)=5659.633148

 

 

샘플분산과 샘풀표준편차는 만약 이 사례수가 200명 중 20명을 샘플로 추출한 것이라면 20이 아닌 '자유도' 즉 N-1 개념이 들어가야 한다. 통계개념.

'Knowledge > SQL' 카테고리의 다른 글

cube, rollup to grouping sets  (0) 2015.08.29
constraints deferred  (0) 2015.08.21
Posted by neo-orcl
,