본문 바로가기
certification/ADsP

통계분석의 이해

by LaEARN 2023. 9. 13.
반응형

<통계>

- 특정집단을 대상으로 수행한 조사나 실험을 통해 나온 결과에 대한 요약된 형태의 표현

- 조사대상에 따라 총조사(Census)와 표본조사(Sampling)으로 구분

 

<총 조사/전수 조사(Census)> ex. 인구주택 총 조사 등

 

<표본조사(Sampling)>

- 모집단에서 샘플을 추출하여 진행하는 조사

  • 모집단(Population) : 조사하고자 하는 대상 집단 전체
  • 원소(Element) : 모집단을 구성하는 개체
  • 표본(Sample) : 추출한 모집단 일부 원소
  • 모수(Parameter) : 모집단에 대한 정보

<표본오차>

- 표본에서 얻은 자료를 통해 모집단 전체의 특성을 추론 함으로써 생기는 오차

- 모집단을 대표할수 있는 표본단위들이 조사대상으로 추출되지 못하면 발생

 

<비표본오차>

- 표본오차를 제외한 조사의 전체 과정에서 발생할 수 있는 모든 오차

 

<표본편의>

- 표본추출방법에서 기인하는 오차

 

<표본추출방법>

단순랜덤 추출법
(Simple Random Sampling)
각 샘플에 번호를 부여하여 임의의 n개를 추출하는 방법으로,
각 샘플은 선택될 확률이 동일하다
계통추출법
(Systematic Sampling)
단순랜덤 추출법의 변형된 방식
번호를 부여한 샘플을 나열하여 K개씩(K=N/n) n개의 구간으로 나누고
첫 구간에서 하나를 임의로 선택한 후에 K개씩 띄어서 n개의 표본을 선택한다. 

집락추출법
(Cluster Random Sampling)
집을 구분하고 군집렬로 단순랜덤 추출법을 수행한 후,
모든 자료를 활용하거나 샘플링하는 방법
층화추출법
(Stratified Random Sampling)
이질적인 원소들로 구성된 모집단에서 각 계층을 고루 대표할 수 있도록
표본을 추출하는 방법 ex.연령별

<자료형 분류>

범주형자료 명목형 ex. 혈액형
순서형 ex. 차량, 대중소
양적자료 이산형 ex. 동전던지기 횟수
순서형 ex. 키, 몸무게
구간형 ex. 10도, 30도, 연도
비율형 ex. 길이, 양

<측정방법>

질적척도
(범주형 자료, 숫자들의 크기  차이가 계산되지 않는 척도)
명목척도 어느 '집단' 속하는지 분류 ex. 혈액형, 성별, 출신지
순서척도 서열관계를 관측하는 척도 ex. 만족도, 학년, 등급
양적척도
(수치형 자료, 숫자들의 크기 차이를 계산할 수 있는 척도)
구간척도(등간척도) 속성의 양을 측정, 구간이나 구간 사이 간격이 의미있는자료 ex. 온도, 지수
비율척도 간격(차이)에 대한 비율이 의미 가있음, 절대적기준 0이 존재함, 사칙연산 가능 ex. 무게, 나이, 거리, 시간

 

반응형

'certification > ADsP' 카테고리의 다른 글

기초분석 및 데이터관리  (0) 2023.09.12