Çoklu Doğrusal Regresyon Nedir?
Çoklu doğrusal regresyon, tek bir bağımlı değişkeni birden fazla bağımsız değişkenle açıklamaya çalışan parametrik bir istatistiksel yöntemdir. Sosyal bilimlerden tıbba, eğitimden psikolojiye kadar geniş bir alanda kullanılır ve tez çalışmalarında en sık başvurulan analiz yöntemleri arasındadır.
Temel mantık şudur: her bağımsız değişkenin bağımlı değişken üzerindeki etkisini, diğer değişkenlerin etkisi sabit tutularak ayrı ayrı tahmin etmek.
Model Kurma
R'da çoklu doğrusal regresyon lm() fonksiyonuyla kurulur. Formül sözdizimi sezgiseldir: sol tarafta bağımlı, sağ tarafta bağımsız değişkenler yer alır.
# Gerekli paketler
library(car) # VIF ve varsayım testleri
library(lmtest) # Breusch-Pagan testi
library(broom) # Düzenli çıktı
# Model kurma
model <- lm(akademik_basari ~ calisma_suresi + motivasyon +
sosyoekonomik_durum + cinsiyet,
data = veri)
# Özet
summary(model)summary() çıktısı dört temel bilgi verir: katsayılar ve anlamlılık düzeyleri, modelin genel F testi, R² ve düzeltilmiş R² değerleri, artık (residual) istatistikleri.
Varsayım Kontrolleri
Regresyon sonuçlarına güvenebilmek için dört temel varsayımın sınanması zorunludur. Bu varsayımlar sağlanmadan elde edilen bulgular, hakemlerin soru işareti koyacağı bir metodolojik zayıflığa dönüşür.
1. Normallik
Artıkların (residuals) normal dağılım göstermesi beklenir. Shapiro-Wilk testi küçük örneklemlerde (n < 50), Q-Q grafiği ise daha büyük örneklemlerde tercih edilir:
# Shapiro-Wilk testi
shapiro.test(residuals(model))
# p > .05 ise normallik varsayımı sağlanmıştır
# Q-Q grafiği
qqnorm(residuals(model))
qqline(residuals(model), col = "red")2. Çoklu Doğrusallık (Multicollinearity)
Bağımsız değişkenler arasında yüksek korelasyon varsa katsayılar güvenilmez hale gelir. VIF (Variance Inflation Factor) değerleri 10'un altında olmalıdır; 5'in üzerindeki değerler de dikkatle değerlendirilmelidir:
vif(model)
# Her değişken için VIF < 10 olmalı3. Otokorelasyon
Özellikle zaman serisi veya tekrarlı ölçüm verilerinde artıklar arasında korelasyon oluşabilir. Durbin-Watson testi 2'ye yakın değer veriyorsa otokorelasyon sorun değildir:
durbinWatsonTest(model)
# DW istatistiği 1.5–2.5 arasında olmalı4. Değişen Varyans (Heteroskedastisite)
Artıkların varyansı tüm tahmin değerleri için sabit olmalıdır. Breusch-Pagan testi bunu sayısal olarak sınar:
bptest(model)
# p > .05 ise sabit varyans (homoskedastisite) varsayımı sağlanmıştırDört varsayım testi için aynı anda grafik almak da mümkündür:
par(mfrow = c(2, 2))
plot(model)
par(mfrow = c(1, 1))Sonuçları Yorumlama
tidy(model, conf.int = TRUE)
glance(model)Çıktıdaki temel göstergeler:
- **B katsayısı:** Diğer değişkenler sabit tutulduğunda, ilgili bağımsız değişkendeki 1 birimlik artışın bağımlı değişkende yarattığı değişim.
- **β (standartlaştırılmış katsayı):** Farklı ölçek birimlerindeki değişkenleri karşılaştırmak için kullanılır. Mutlak değeri büyük olan değişken daha güçlü etkiye sahiptir.
- **R²:** Modelin bağımlı değişkendeki varyansı açıklama oranı. Sosyal bilimlerde .30 kabul edilebilir, .50 iyi, .70 üzeri güçlü sayılır.
- **Düzeltilmiş R²:** Modeldeki değişken sayısını hesaba katar; farklı model karşılaştırmalarında kullanılır.
APA 7 Formatında Raporlama
Yöntem bölümünde hangi varsayımların sınanıp sağlandığını kısaca belirtin. Bulgular bölümünde ise hem modelin genel anlamlılığını hem de bireysel katsayıları raporlayın:
*"Çalışma süresi, motivasyon, sosyoekonomik durum ve cinsiyetin akademik başarıyı yordayıp yordamadığını belirlemek amacıyla çoklu doğrusal regresyon analizi uygulanmıştır. Model öncesi normallik (Shapiro-Wilk), çoklu doğrusallık (VIF < 5) ve değişen varyans (Breusch-Pagan) varsayımları sınanmış, tüm varsayımların karşılandığı görülmüştür."*
*"Analiz sonucunda model istatistiksel olarak anlamlı bulunmuştur, F(4, 115) = 18.43, p < .001, R² = .39. Çalışma süresi (B = 0.42, SE = 0.08, β = .38, p < .001) ve motivasyon (B = 0.31, SE = 0.09, β = .27, p = .001) akademik başarının anlamlı yordayıcıları olarak belirlenmiştir."*
Kaynaklar
- Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5th ed.). Sage.
- R Core Team. lm() fonksiyonu dokümantasyonu. https://www.r-project.org
- APA Publication Manual (7th ed.). https://apastyle.apa.org
Bu analizi tezinizde kullanmakta zorlanıyor musunuz?
Veri setinizi paylaşın, teorik gerekçesiyle birlikte APA 7 formatında analiz edip raporlayalım.