본문 바로가기

통계3

명목척도, 순위척도, 등간척도, 비율척도 / 양적데이터, 질적데이터, 횡단데이터, 종단데이터 의 내용을 발췌하여 작성하였습니다. 척도 (1) 명목척도(nominal scale) (2) 순위척도(ordinal scale) (3) 등간척도(interval scale) (4) 비율척도(ratio scale) 데이터 (1) 양적 데이터(quantitative data) (2) 질적 데이터 (qualitative data) (3) 횡단 데이터(cross-sectional data) (4) 종단 데이터 (longitudinal data) 척도의 종류 (1) 명목척도(nominal scale) : 측정대상의 특성을 단순하게 구분할 목적으로 숫자를 부여하는 척도이다. 범주 척도라고 부르기도 한다. 예를 들어, 성별을 나타낼 때 남성이면 1, 여성이면 0으로 표시한다고 할 때 이를 명목척도라고 한다. 명목척도를.. 2023. 10. 4.
데이터 과학자가 되기 위해 필요한 역량 1. 데이터 과학자로서 필요할 역량은 통계학, 선형대수학, (약간의) 프로그래밍(파이썬 혹은 R), 그리고 특정 산업에 대한 이해도 입니다. 통계, 선형대수학, 프로그래밍은 (쉽지는 않지만) 노력으로 극복할 수 있습니다. 그런데 특정 산업 도메인에 대한 이해는 실무 경험 없이 습득하는데 한계가 있습니다. 그러므로 통계학이나 컴퓨터공학을 전공하지 않았다고 열등감을 갖을 필요가 전혀 없습니다. 특정 산업의 현업 전문가가 계량적 분석 도구(통계, 수학, 프로그래밍)에 대한 이해도를 갖춘다면 천하무적이 될 것입니다. 2. 아래 사진의 책 순서대로 학습하면 데이터 과학자로서 요구되는 데이터 마이닝Data Mining 역량을 갖출 수 있습니다. 그것도 상당히 높은 수준의 역량을 말입니다. 처음부터 욕심 낼 필요 없.. 2023. 10. 4.
분산과(Variance) 공분산(Covariance) , 에서 참고 및 발췌하여 작성했습니다. 하나의 확률변수가 흩어진 정도를 측정하는 측도로서 분산(Variance)을 생각했다면, 두 확률 변수 X와 Y 사이의 흩어진 관계를 측정하는 측도로서 다음과 같이 정의되는 공분산(Covariance)을 생각할 수 있다 확률변수 X의 변동을 타나내는 측도로서 X가 평균 E(X)로부터 흩어져 있는(또는 밀집된) 정도를 다음과 같이 g(X) = [X-E(X)]2에 대한 기댓값으로 측정하고 분산(Variance)이라고 정의한다. 이 때 X가 그의 평균 E(X)로부터 멀리 떨어져 있는 경향이 많을수록 [X-E(X)]2의 값도 커지는 경향이 있는데, 그런 경우 자연히 분산도 커지게 된다. 편의상 확률변수 .. 2023. 8. 19.