카테고리 없음

[파이썬] 전진선택법과 F-Test 의미

FDG 2025. 4. 12. 00:20

출처 : 여러 AI.

 

OLS_F_test.ipynb
0.01MB

 

F-검정의 의미 (OLS에서)

OLS 회귀에서의 F-검정은 다음과 같은 **귀무가설(H₀)**과 **대립가설(H₁)**을 테스트합니다:

  • H₀ (귀무가설): 모든 설명변수의 회귀계수는 0이다.β1=β2=⋯=βk=0\beta_1 = \beta_2 = \dots = \beta_k = 0
  • H₁ (대립가설): 적어도 하나 이상의 회귀계수는 0이 아니다.∃ βj≠0\exists \, \beta_j \ne 0

즉,

**"이 모델에 포함된 변수들이 전혀 도움이 안 되는가?"**를 검정하는 겁니다.

 

왜 F-검정이 필요할까?

회귀계수에 대한 개별 t-검정은 각 변수의 영향력을 따로 평가합니다.
하지만 F-검정은 모델 전체가 통계적으로 의미 있는지 한꺼번에 보는 방식이에요.

 

 

전진선택법에서 F검정을 사용하는 이유

전진선택법은 회귀 모델을 구축할 때 독립 변수를 하나씩 추가하며 모델의 성능을 개선하는 방법입니다. 이 과정에서 F검정은 다음과 같은 이유로 사용됩니다:

  1. 변수의 유의성 평가: F검정은 추가된 독립 변수가 모델의 설명력을 유의미하게 증가시키는지 평가합니다. 이를 통해 불필요한 변수를 배제하고, 모델의 간결성과 해석력을 높일 수 있습니다15.
  2. 모델 비교: F검정은 현재 모델과 새로 추가된 변수로 확장된 모델 간의 분산비를 비교하여, 새로운 변수가 통계적으로 유의미한지 판단합니다5.
  3. 전체 모델 평가: F검정은 단일 변수뿐만 아니라 전체 모델에 대한 검정을 수행하여 모든 변수가 유의미한지 확인하는 데도 사용됩니다5.

✅ 해석 방법

  • F값이 크다 → 설명력이 높고, 모델이 유의미할 가능성이 높음.
  • p-value가 작다 (ex: < 0.05) → 귀무가설 기각 → 적어도 하나의 설명변수는 의미 있음.
  • p-value가 크다 (ex: > 0.05) → 설명변수들이 유의미하지 않음 → 모델의 유용성에 의문.