<비전공자를 위한 통계방법론| 양혁승 지음| 출판사 오래> 의 내용을 발췌하여 작성하였습니다.
통계학은 데이터를 활용하여 사물이나 현상의 본질과 특성을 이해함으로써 올바른 판단과 의사결정을 할 수 있도록 돕기 위해 개발된 데이터분석 방법론이다. 우리는 주변에서 일어나는 여러 가지 현상들에 대한 데이터를 수집하여 분석함으로써 그 현상에 대해 보다 더 정확한 현황을 파악하고, 문제점 및 원인을 규명하며 해결책을 찾아나간다. 데이터에 기반한 분석을 하지 않은 채 개인적으로 경험하거나 관찰한 바에 근거하여 어떠한 결론을 내리게 되면 그 판단에 오류가 발생하게 되고, 결과저긍로 효과적인 의사결정을 내리지 못하기 때문에 데이터에 활용한 의사결정의 중요성은 매우 크다.
통계분석은 그 목적에 따라 기술통계(descriptive statistics)와 추리통계(inferential statistics)로 구분된다.
기술통계(descriptive statistics) 란 주어진 데이터를 통계량이나 그래프 등을 활용하여 분석함으로써 그 데이터 속에 들어있는 특정 사물의 현상을 요약적으로 정리하는 데 초점이 맞춰져 있다. 예컨대, 주어진 데이터로부터 평균값(mean), 중위수(median), 최빈수(mode), 최대값, 최소값, 범위(range), 분산(variance), 표준편차(standard deviation) 등과 같은 통계량이나 도수분포(frequency distribution), 상대도수분포(relative frequency distribution), 산포도(scatter plot) 등과 같은 그래프를 그려서 그 데이터에 숨겨진 특성들을 요약적으로 이해하는 것이 이에 해당한다.
반면에 추리통계(inferential stastics)란 연구자가 관심을 가지고 있는 어떤 모집단(population)의 특성을 규명하는 데 초점이 맞춰져 있는데, 이를 위하여 그 모집단의 부분집합을 표본(sample)으로 추출하여 그 표본으로부터 얻은 데이터를 근거로 해당 모집단의 특성을 추정하는 것이다. 특별히 모집단을 구성하고 있는 개체 수가 너무 많아 모든 개체들을 조사하여 모집단 데이터를 얻기가 현실적으로 어려울 경우 해당 모집단을 대표할 수 있는 표본을 추출하여 그 표본에서 얻은 결과를 가지고 모집단에 속한 개체들의 특성을 유추하게 된다. 추리통계의 경우 표본으로부터 얻은 데이터를 가지고 모집단의 특성을 추정하기 때문에 모집단과 표본을 명확하게 구분하는 것이 매우 중요하며, 표본 데이터를 가지고 모집단 데이터에서 얻을 수 있는 결과를 추정하는 통계적 기법들이 추리통계의 핵심주제가 된다.
통계방법론에서 핵심으로 다뤄지는 것은 추리통계이며, 기술통계는 추리통계를 위한 기초작업을 수행하기 위한 과정이라고 이해하면 된다.
통계학을 어렵게 생각하는 주원인 중 하나는 바로 기술통계와 추리통계를 혼동하거나, 추리통계와 관련된 개념들을 명확하게 통합적으로 이해하지 못하는 데 있다.
'수학.통계' 카테고리의 다른 글
상관분석(correlation analysis) : 공분산, 상관계수, 산포도 (1) | 2023.09.27 |
---|---|
[책 리뷰] 미적분의 힘 / 스티븐 스트로가츠 지음 / 해나무 (0) | 2023.08.30 |
[책 리뷰] 복잡한 세계 숨겨진 패턴 / 닐 존슨 지음 / 바다출판사 (0) | 2023.08.26 |
[책 리뷰] 미적분의 쓸모 / 한화택 지음 / 더퀘스트 (0) | 2023.08.26 |
분산과(Variance) 공분산(Covariance) (0) | 2023.08.19 |