21년 3월 12일 

코드스테이츠 부트캠프 9일차

Week2 Statistics

 


오늘의 나를 뒤돌아보며,

 

 


9일차

Hypothesis Test 2

 

키워드

  • chi square test (카이제곱 검정)

어제 8일차에 배운 t-test는 그룹의 평균값에 대해서 비교하는 가설검정방법이다.

 

chi square test (카이제곱 검정)

카이제곱 검정은 교차분석이라고 불리며 두 범주형 변수에서 관찰된 빈도가 기대빈도와 의미있게 다른지 검증하기 위해 사용된다. 즉, 두 범주형 변수가 종속 사건인지 독립사건인지 판별하는 것이다.

 

두 변수가 종속사건일 경우 (chi²) 값이 크고 중요한 feature를 의미한다.

 

귀무가설 : 두 변수는 연관성이 없다 ( 두 변수가 독립사건이다. )

대안가설 : 두 변수는 연관성이 있다 ( 두 변수가 종속사건이다. )

p value > 0.05  : 귀무가설 채택

 

카이제곱 검정을 통해 p value를 얻게 된다.

자유도는 n-1, 자유도가 클수록 카이제곱 분포는 정규분포에 유사해진다.

one-sample chi-square test

1
2
3
4
import  numpy as np
from scipy.stats import chisquare 
 
chisquare(df_sum,axis=None)
cs

 

 
two-sample chi-square test
1
2
from scipy.stats import chi2_contingency
chi2_contingency(df,correction=False)  # correction 에 True와 False 사용의 차이를 알아보자
cs

기억하고 넘어가야 하는 것

 

'개발 관련자료' 카테고리의 다른 글

Bayesian 베이즈 정리  (0) 2021.04.01
Confidence Interval (신뢰구간)  (0) 2021.04.01
Hypothesis Test (가설검정)  (0) 2021.03.22
Data Visualize (데이터시각화)  (0) 2021.03.21
Data Manipulation  (0) 2021.03.21

+ Recent posts