예제: 일원 분산분석
fullfact 함수를 사용하여 실험을 설계하고
anova 함수를 사용하여 실험 결과를 분석합니다.
1. 새 합성섬유의 강도에 면섬유 함유량이 미치는 효과를 검사하는 실험의 인수 개수를 정의합니다.
2. 실험에 사용되는 면(cotton) 함유량 설정을 정의합니다.
3. length 함수를 사용하여 인수의 레벨 수를 정의합니다.
4. fullfact 함수를 호출하여 실험과 그 실행(Run)을 나타내는 전체 계승 설계 행렬을 만듭니다.
설계 행렬 X에서 A는 면 인수를 나타내고 그 레벨은 다음과 같이 코드화된 형식으로 표시됩니다.
A의 코드화된 값 | A의 실제 값 |
---|
0 | 15% |
1 | 20% |
2 | 25% |
3 | 30% |
4 | 35% |
5. 면섬유의 무게가 15%를 차지하도록 하여 실행한 첫 번째 실험의 함성섬유 강도를 측정합니다.
6. 다른 네 번의 실행에 대한 측정치도 구합니다.
8. randomize 함수로 결정한 순서에 따라 측정치를 복제합니다.
제어되지 않는 변수의 영향을 제거하려면 실험을 여러 번 반복하여 더 확실한 평균을 구하는 것이 좋습니다. 실험을 반복하기 전에 randomize 함수를 호출하면 실행 순서에 따라 입력 인수 사이에 존재할 수 있는 상관 관계를 줄이는 데 도움이 됩니다.
9. 원하는 모든 반복측정치에 대해 7-8단계를 되풀이합니다. 모든 측정값을 행렬 Y에 기록합니다.
각 열에는 반복측정치 하나의 데이터가 포함되고 각 행에는 특정 실행에서 얻은 데이터가 포함됩니다.
10. boxplot 함수를 호출하여 각 실행별로 상자가 하나씩 표시되는 상자 도표의 데이터를 준비합니다.
행렬 Y를 전치합니다. 각 실행의 결과는 행렬 행에 기록되지만 boxplot에 입력할 데이터 집합은 행렬 열이어야 하기 때문입니다.
12. 상자 도표를 만듭니다.
a. boxplotgraph 함수의 출력을 도표화합니다.
b. 각 인수의 레이블이 포함된 텍스트 영역을 만듭니다.
상자 도표를 보면 면이 차지하는 무게의 백분율이 섬유의 인장 강도에 영향을 주는 것으로 판단할 수 있습니다. 섬유의 인장 강도는 면의 무게가 섬유 무게의 약 30%를 차지할 때 최대치에 도달합니다.
13. anova 함수를 호출하여 면의 무게 백분율이 인장 강도에 영향을 주는지 검사합니다.
14. r을 실행 횟수로 정의하고 x를 반복측정치 횟수로 정의한 다음 SSE 열에서 제곱합을 계산합니다.
15. N을 측정값의 총 수로 정의한 다음 df 열에서 자유도를 계산합니다.
16. MSE 열에서 평균 제곱을 계산합니다.
17. 인수 A의 F-value를 계산합니다.
P 열의 P-value가 0.05보다 작습니다. 이는 인수 A가 유효하다는 의미입니다.
18. F-value를 사용하여 A가 유효 인수라는 가정을 검증합니다. 유의 수준 5%에 대해 임계 F 값을 구합니다.
인수 A에 대한 F-value가 임계 F 값보다 큽니다. 따라서 면의 무게 백분율이 섬유의 인장 강도에 실제로 영향을 준다는 사실을 다시 한 번 확인할 수 있습니다.
참조
D. C. Montgomery, Design and Analysis of Experiments, 제5판, John Wiley & Sons, New York, 2001년. 62.