기술 통계치(Descriptive Statistics)




바이올린 플롯

추리 통계치(Inferential Statistics)
효과적인 샘플링(표본 추출)
단순 임의 샘플링(Simple Random Sampling) : 전체 데이터에서 무작위로 추출

계통추출법(Systematic Sampling) : 1에서 n까지 모든 데이터에 번호를 매겨서 일정 간격마다 하나씩 데이터 추출. 주로 시계열 데이터 대표값 샘플링에 이용.

층화임의추출법(Stratified Random Sampling) : 모집단을 몇 개의 그룹으로 나누어 각 그룹에서 무작위로 추출.

군집/집락추출방법(Cluster Sampling) : 전체 자료를 군집이라는 부분 집단으로 분할하고, 몇 개의 샘플 집단을 무작위로 추출해서 군집 내 데이터 전수 조사.
가설 검정
표본 평균의 표준 오차(Standard Error of the Sample Mean)

T 검정(Student T-test)
귀무가설 설정 (null hypothesis)
대안가설 설정 (alternative hypothesis)
신뢰도 설정 (confidence lelve)
모수가 신뢰구간 안에 포함될 확률(보통 95, 99%)
신뢰도 95%의 의미.
→ 모수가 신뢰 구간 안에 포함될 확률이 95%
→ 귀무가설이 틀렸지만 우연히 성립할 확률이 5%

p값을 확인
이후 p값을 바탕으로 가설에 대해 결론 내림
p값 기준
단측 검정과 양측 검정
이표본 T검정