Adjusted R-Square: Măsura reală a eficienței modelului
- Value Vectors
- 20 mai 2024
- 2 min de citit
Actualizată în: 8 iun. 2024

Adjusted R-Square (R-pătrat ajustat) este o versiune modificată a coeficientului de determinare R-Square (R²), care ajustează numărul de predictori din modelul de regresie. Acesta este folosit pentru a evalua cât de bine sunt explicate variațiile unei variabile dependente de către variabilele independente, ținând cont și de complexitatea modelului.
De ce este important Adjusted R-Square?
R-Square simplu măsoară proporția variabilității totale a variabilei dependente explicată de variabilele independente din model. Cu toate acestea, R² crește automat pe măsură ce se adaugă mai mulți predictori, chiar dacă aceștia nu contribuie semnificativ la model. Adjusted R-Squared contracarează acest efect prin penalizarea adăugării de predictori care nu îmbunătățesc semnificativ modelul.
Formula Adjusted R-Squared
Adjusted R-Squared este calculat după formula:
Unde:
R² este coeficientul de determinare simplu.
n este numărul total de observații.
k este numărul de predictori din model.
Interpretare
Valori mari ale Adjusted R-Squared: Indică faptul că modelul explică bine variabilitatea datelor și că adăugarea de predictori suplimentari este justificată.
Valori mici ale Adjusted R-Squared: Sugerează că modelul nu explică bine variabilitatea datelor sau că predictori suplimentari nu contribuie semnificativ la model.
Exemplu
Să presupunem că dorim să prezicem prețul caselor (Y) pe baza suprafeței locuinței (X1) și a numărului de camere (X2). Folosim două modele de regresie:
Model 1: Prețul caselor pe baza suprafeței (X1).
Model 2: Prețul caselor pe baza suprafeței (X1) și a numărului de camere (X2).
Model 1: Regressia simplă (Prețul pe baza suprafeței)
R² = 0.963
Adjusted R² = 0.958
Model 2: Regressia multiplă (Prețul pe baza suprafeței și a numărului de camere)
R² = 0.965
Adjusted R² = 0.955
Modelul 2 are un R² puțin mai mare (0.965), dar Adjusted R² este mai mic decât cel al modelului 1 (0.955). Aceasta sugerează faptul că adăugarea numărului de camere nu aduce o îmbunătățire semnificativă în explicarea variabilității prețului caselor, iar modelul este penalizat pentru complexitate suplimentară.
În concluzie, deși modelul 2 are un R² ușor mai mare, ajustarea pentru complexitate arată faptul că modelul 1, mai simplu, ar putea fi la fel de eficient sau chiar mai eficient în practică. Astfel, suprafața locuinței este un predictor suficient de puternic pentru prețul caselor, iar adăugarea numărului de camere nu aduce un beneficiu semnificativ.
Comments