예제: 세로 막대, 정규 확률 및 상자 도표
세로 막대 도표, 정규 확률 도표 및 상자 도표를 사용하여 실험 결과를 검토할 수 있습니다.
1. 실리콘 웨이퍼의 산화 공정을 조사한 연구를 설명하는 데이터 집합을 정의합니다. 행렬 Data에는 두 개의 열이 있습니다. 그 중 하나는 확산로(furnace) 번호를 나타내고, 다른 하나는 옹스트롬 단위로 측정한 산화물 두께를 나타냅니다.
2. 벡터 Thick의 두께 데이터를 추출합니다.
3.
histogram 함수를 호출하여 데이터를 20개의 빈(bin)으로 구분하여 나눕니다.
4. 빈으로 구분한 데이터를 도표화하고 그래프선 유형을 세로 막대형으로 변경합니다. 세로 막대 각각에 대해 X축에 두께 범위가 표시되고 Y축에 실험 횟수가 표시됩니다.
5.
mean 및
Stdev 함수를 호출하여 데이터의 평균과 표준 편차를 계산합니다. 이 통계를 바탕으로
dnorm 함수를 호출하여 데이터가 정규 분포일 때의 각 빈에 대한 예상 결과를 구합니다.
6. 벡터 Norm을 도표화하기 위한 Y축 식을 추가합니다. 정규 분포를 보려면 해당 Y축 식의 단위 자리 표시자에 배율 인수로 1000을 추가하여 히스토그램의 크기를 줄입니다.
7.
qqplot 함수를 호출하여
Data의 변위치를 정규 분포의 변위치와 비교합니다.
8. 서로를 기준으로 각 변위치를 도표화합니다. 그래프선 스타일을 변경하여 산점도를 만듭니다. 기호 목록에서 십자선을 선택한 다음 선 스타일 목록에서 없음을 선택하면 됩니다.
9.
boxplot 함수를 호출하여 세 개의 변위치, 최소값과 최대값 및 데이터 집합의 이상치를 계산합니다.
10. B의 전치를 도표화하고 그래프선 유형을 상자 도표형으로 변경하여 앞서 구한 통계를 상자 도표로 표시합니다.
세로 막대 도표와 정규 확률 도표에는 정규 분포가 측정 두께에 대한 적정 근사치인 것으로 표시됩니다. 상자 도표를 보면 이상치가 한 개뿐이고 이상치와 데이터 집합의 나머지 요소 사이의 차이가 상대적으로 작다고 해석할 수 있습니다.
11.
vlookup 함수를 호출하여 각 확산로에 대한 두께 측정치를 추출합니다.
12.
augment 함수를 호출하여 벡터
F1,
F2,
F3 및
F4를 한 개의 행렬로 결합합니다. 이때 행렬의 각 열에 확산로별 결과가 포함됩니다.
13. boxplot 함수를 호출하여 각 데이터 집합에 대한 통계를 구합니다.
14. 확산로 레이블로 이루어진 벡터를 정의합니다.
15. 데이터 집합을 표시할 상자 도표를 만듭니다. Y축 식의 행렬에는 한 행에 하나의 데이터 집합을 포함하도록 하고 데이터 집합에 동일한 수의 이상치가 없으면 NaN도 포함합니다. 데이터 집합별로 상자 도표가 한 개씩 생성됩니다.
상자 도표를 보면 각 확산로별로는 두께 측정치에 상당한 수준의 변동이 있지만 확산로 사이의 분산은 작은 것으로 해석할 수 있습니다.
참조
NIST, Engineering Statistics Handbook(엔지니어링 통계 핸드북)