[통계의 이해]01.기초통계량_평균, 분산, 표준편차, 표준화, 공분산, 상관계수
본문 바로가기
IT/통계의 이해

[통계의 이해]01.기초통계량_평균, 분산, 표준편차, 표준화, 공분산, 상관계수

by 삼봉님 2022. 8. 18.
반응형

평균

□ 정의

여러 수나 같은 종류의 양의 중간값을 갖는 수.

어떤 값들의 집합에서 특징을 나타내거나 요약하는 대표값으로 유의미한 결과를 표시하는 역할을 한다.

 

 

□ 종류

  - 산술평균

    : 일반적으로 생각하는 평균의 종류, 변량들의 합을 총 개수로 나눈 값

      ex) 3반 학생들의 평균 키, 00학과 졸업생들의 평균연봉 등

  - 기하평균

    : 변량들 곱의 n제곱근, 크기/확대/비율 등의 평균을 구할 때 사용

      ex) 연평균 경제성장률, 연평균 이자율 등

 

 

 

분산(Variance)

□ 정의

변량이 평균으로부터 떨어져 있는 정도를 나타내는 값

변수의 흩어진 정도를 계산하는 지표

 

□ 계산식

  - 편차(표본-평균) 제곱의 평균

  - 제곱을 하지 않는 경우 편차의 평균은 항상 '0'이 되므로 제곱을 통해 부호를 제거해주는 과정을 거침

 

 

 

표준편차(Stnadard Deviation)

□ 정의

분산의 제곱근, 분산과 마찬가지로 변수의 흩어진 정도를 계산하는 지표

통계에서 가장 중요한 지표 중 하나로 추론통계를 하는데 기초자료로 활용

 

□ 계산식

  - 편차(표본-평균) 제곱 평균의 제곱근

  - 제곱을 하지 않는 경우 편차의 평균은 항상 '0'이 되므로 제곱을 통해 부호를 제거해주는 과정을 거침

 

 

 

정규분포

□ 정의

데이터가 수 많이 있다고 가정하고 이를 그래프상에 면으로 표시할 때의 그래프 

평균이 m이고 표준편차가 σ인 연속분포

평균 m에 대하여 좌우 대칭이며 위로 볼록한 곡선의 형태라는 성질이 있음.

σ이 커지면 곡선이 양쪽으로 퍼지고 σ가 작아지면 평균값 기준으로 뽀족하게 올라오는 모양의 띔

 

 

 

표준화

□ 정의

다른 정규분포 및 특정 정규분포의 통계적 추정을 위해 정규분포를 평균을 0, 표준편차를 1인 표준정규분포로 만드는 절차

 

□ 계산식

  - 변수 a,b,c...에 대하여 (a,b,c... - m)/σ 과정을 거치면 결과적으로 표준정규분포가 됨

 

 

 

공분산(Covariance)

□ 정의

두 변수의 관계를 나타내는 값

 

□ 계산식

  - An의 편차(변수-평균) × Bn의 편차(변수-평균) 들의 합

 

□ 특징

  - 공분산 결과값이 0보다 크면 양의 상관관계가 있음

  - 공분산 결과값이 0보다 작으면 음의 상관관계가 있음

  - 공분산 결과값이 0이면 양도 음도 아닌 상관관계

 

 

 

상관계수(Correlation Coefficient) ★

□ 정의

두 변수 사이의 상관관계의 정도를 나타내는 수치

 

□ 계산식

  - (표준화된 데이터 An 변수 × 표준화된 데이터 Bn 변수 들의 합) / (n-1)

 

□ 특징

  - '-1'에 가까울 수록 음(-)의 상관관계가 큼

  - '+1'에 가까울수록 양(+)의 상관관계가 큼

반응형

댓글


TOP

TEL. 02.1234.5678 / 경기 성남시 분당구 판교역로