본문 바로가기
수학.통계

명목척도, 순위척도, 등간척도, 비율척도 / 양적데이터, 질적데이터, 횡단데이터, 종단데이터

by 지식편집자 2023. 10. 4.

 

<비전공자를 위한 통계방법론| 양혁승 지음| 출판사 오래> 의 내용을 발췌하여 작성하였습니다.  

 

 

척도 

(1) 명목척도(nominal scale)

(2) 순위척도(ordinal scale)

(3) 등간척도(interval scale)

(4) 비율척도(ratio scale)

데이터

(1) 양적 데이터(quantitative data)

(2) 질적 데이터 (qualitative data)

(3) 횡단 데이터(cross-sectional data)

(4) 종단 데이터 (longitudinal data)

척도의 종류 

(1) 명목척도(nominal scale) : 측정대상의 특성을 단순하게 구분할 목적으로 숫자를 부여하는 척도이다. 범주 척도라고 부르기도 한다. 예를 들어, 성별을 나타낼 때 남성이면 1, 여성이면 0으로 표시한다고 할 때 이를 명목척도라고 한다. 명목척도를 사용하여 얻은 데이터는 숫자의 형식을 띠지만 본래 숫자가 담고 있는 '양'이 아닌, 단순하게 대상을 구분하기 위한 숫자표시로 이해해야 한다.

 

(2) 순위척도(ordinal scale) : 측정대상의 순위를 나타내기 위해 숫자를 사용하는 척도이다. 학급에서 등수 (1등, 2등, 3등), 선호도 순위(1순위, 2순위, 3순위), 소득계층(1분위, 2분위, 3분위) 등이 순위척도에 해당한다. 명목척도를 사용하여 얻은 데이터의 용도처럼 사물을 구분할 수 있는 정보를 담고 있을 뿐만 아니라, 더 나아가 순위까지 정할 수 있는 정보를 담고 있다. 그러나, 측정대상들 간 정도 차이 혹은 크기 차이가 얼마나 되는지 알 수 있는 정보를 담고 있지는 않다. 

 

(3) 등간척도(interval scale) : 측정 대상이 보유하고 있는 속성의 정도나 크기를 측정할 수 있는 동일한 가격을 부여한 척도를 의미한다. 일반적으로 태도나 만족도 등을 파악하기 위한 설문조사에서 사용하는 5점 척도 등은 엄밀한 의미에서 일정한 간격을 갖는다고 보기는 어렵지만 (예를 들어, 2점과 3점 간 만족도 차이와 4점과 5점 간 만족도 차이를 동일하다고 간주하기 어렵다.) 통상 등간척도로 간주되어 사용한다. 등간척도는 분류에 필요한 정보나 순위를 결정할 수 있는 정보를 모두 가지고 있으며, 더 나아가 두 대상 사이의 보유 속성의 양적 차이가 어느 정도인지도 알 수 있는 정보를 가지고 있다.

 

(4) 비율척도(ratio scale)  : 측정대상 보유속성의 양적 차이를 알 수 있게 해주는 등간척도의 특성에 더하여 측정대상의 보유 속성 사이의 비율 계산까지 가능케 하는 척도이다. 길이를 재는 자나 무게를 재는 저울 등에서 사용하는 숫자가 바로 비율척도에 해당한다. 비율척도로 측정한 데이터에서 두 측정대상 간 2배 차이가 난다면 정확하게 2배만큼 차이가 존재한다고 할 수 있다. 예를 들어서 몸무게가 50kg인 사람과 100kg인 사람은 두 배 차이가 난다. 비율척도를 사용한 데이터는 사칙연산으로 계산이 가능하다. 

 

 

데이터의 종류 

 

(1)양적 데이터(quantitative data):  키, 몸무게, 가족 수, 기업 매출량, 월 소득, 이직률 등 양의 많고 적음을 나타내는 숫자들로 구성된 데이터를 가리킨다. 양이 많고 적음을 나타내는 데이터이다.

(2)질적 데이터(qualitative data): 성별, 직업, 취향, 결혼여부 등과 같이 질적 특성을 나타내는 값들을 질적 데이터로 한다. 양이 많고 적음을 나타내지 않고 질적 특성을 구분해주는 특성을 갖는다.

(3)횡단 데이터(cross-sectional data) : 데이터를 측정하는 시점에 따라서 횡단 데이터와 종단 데이터로 구분된다. 횡단 데이터는 관심의 대상이 되는 변수들을 동일 시점으로 볼 수 있는 시기에 측정하여 얻은 값들로 구성된 데이터를 가리킨다. 횡단데이터를 사용하여 그 데이터에 포함된 두 변수 사이의 관계를 규명할 경우 해당되는 두 변수 사이에 어느 것이 선이고 어느 것이 후인지 알 수 없기 때문에 엄밀한 인과관계를 규명하기 어렵다. 

(4)종단 데이터(longitudinal data): 종단 데이터는 관심의 대상이 되는 변수들을 일정 시차를 두고 관측하여 얻은 값들로 구성된 데이터를 가르킨다. 특정 변수를 시간의 순서에 딸 일정 기간 동안 관측하여 얻은 값들로 구성된 시계열 데이터(time series data)나 동일한 개체들을 대상으로 일부 변수들(원인변수들)과 또 따른 변수들(결과변수들)읙 관측 시점을 달리하여 얻은 데이터 등이 종단데이터로 분류된다. 원인변수들의 측정 시점과 결과변수들의 측정 시점을 달리하여 얻은 종단데이터는 시간의 선후가 명확하기 대때문에 변수들 간의 인과관계를 규명하는 데 유용하다.