21년 3월 12일
코드스테이츠 부트캠프 9일차
Week2 Statistics
오늘의 나를 뒤돌아보며,
9일차
Hypothesis Test 2
키워드
- chi square test (카이제곱 검정)
어제 8일차에 배운 t-test는 그룹의 평균값에 대해서 비교하는 가설검정방법이다.
chi square test (카이제곱 검정)
카이제곱 검정은 교차분석이라고 불리며 두 범주형 변수에서 관찰된 빈도가 기대빈도와 의미있게 다른지 검증하기 위해 사용된다. 즉, 두 범주형 변수가 종속 사건인지 독립사건인지 판별하는 것이다.
두 변수가 종속사건일 경우 x²(chi²) 값이 크고 중요한 feature를 의미한다.
귀무가설 : 두 변수는 연관성이 없다 ( 두 변수가 독립사건이다. )
대안가설 : 두 변수는 연관성이 있다 ( 두 변수가 종속사건이다. )
p value > 0.05 : 귀무가설 채택
카이제곱 검정을 통해 p value를 얻게 된다.
자유도는 n-1, 자유도가 클수록 카이제곱 분포는 정규분포에 유사해진다.
one-sample chi-square test
1
2
3
4
|
import numpy as np
from scipy.stats import chisquare
chisquare(df_sum,axis=None)
|
cs |
two-sample chi-square test
1
2
|
from scipy.stats import chi2_contingency
chi2_contingency(df,correction=False) # correction 에 True와 False 사용의 차이를 알아보자
|
cs |
꼭 기억하고 넘어가야 하는 것
★
'개발 관련자료' 카테고리의 다른 글
Bayesian 베이즈 정리 (0) | 2021.04.01 |
---|---|
Confidence Interval (신뢰구간) (0) | 2021.04.01 |
Hypothesis Test (가설검정) (0) | 2021.03.22 |
Data Visualize (데이터시각화) (0) | 2021.03.21 |
Data Manipulation (0) | 2021.03.21 |