평균의 신뢰도를 파악하기 위해 분산//혹은 표준편차를 구한다.
관련한 오라클 함수는 아래와 같다.
variance(=var_samp) : 표본분산
stddev(=stddev_samp) : 표본표준편차
var_pop : 모집단 분산
stddev_pop : 모집단 표준편차
salary(도수) | 편차 | 편차제곱 | 모집단분산 | 샘플분산 |
4400 | -4375 | 19140625 | 30429875 | 32031447.37 |
13000 | 4225 | 17850625 | sum(c2:c21)/20 | sum(c2:c21)/20 |
6000 | -2775 | 7700625 | ||
12000 | 3225 | 10400625 | 모집단표준편차 | 샘플표준편차 |
8300 | -475 | 225625 | 5516.328036 | 5659.633148 |
24000 | 15225 | 231800625 | 30429875^(1/2) | 32031447.37^(1/2) |
17000 | 8225 | 67650625 | ||
17000 | 8225 | 67650625 | ||
9000 | 225 | 50625 | ||
6000 | -2775 | 7700625 | ||
4200 | -4575 | 20930625 | ||
5800 | -2975 | 8850625 | ||
3500 | -5275 | 27825625 | ||
3100 | -5675 | 32205625 | ||
2600 | -6175 | 38130625 | ||
2500 | -6275 | 39375625 | ||
10500 | 1725 | 2975625 | ||
11000 | 2225 | 4950625 | ||
8600 | -175 | 30625 | ||
7000 | -1775 | 3150625 |
분산을 먼저 구하고 표준편차를 구함
사례수가 20이고 평균이 8775 이며, 편차들의 제곱의 합은 608597500 이다.
모집단(전체) 분산과 모집단(전체) 표준편차
- 모집단 분산: 편차의 제곱의 합을 사례수로 나눈다. => 608597500/20 = 30429875
- 모집단 표준편차: 모집단분산을 제곱근한다. => 30429875^(1/2) = 5516.328036
표본(샘플)분산과 표본(샘플)표준편차
- 표본 분산: 편차의 제곱의 합을 사례수-1로 나눈다. => 608597500/19 = 32031447.37
- 표본 표준편차: 표본분산을 제곱근한다. => 32031447.37^(1/2)=5659.633148
샘플분산과 샘풀표준편차는 만약 이 사례수가 200명 중 20명을 샘플로 추출한 것이라면 20이 아닌 '자유도' 즉 N-1 개념이 들어가야 한다. 통계개념.
'Knowledge > SQL' 카테고리의 다른 글
cube, rollup to grouping sets (0) | 2015.08.29 |
---|---|
constraints deferred (0) | 2015.08.21 |