← Blog'a Dön
R10 dk okuma2026-05-20

R ile Çoklu Doğrusal Regresyon Analizi

Çoklu Doğrusal Regresyon Nedir?

Çoklu doğrusal regresyon, tek bir bağımlı değişkeni birden fazla bağımsız değişkenle açıklamaya çalışan parametrik bir istatistiksel yöntemdir. Sosyal bilimlerden tıbba, eğitimden psikolojiye kadar geniş bir alanda kullanılır ve tez çalışmalarında en sık başvurulan analiz yöntemleri arasındadır.

Temel mantık şudur: her bağımsız değişkenin bağımlı değişken üzerindeki etkisini, diğer değişkenlerin etkisi sabit tutularak ayrı ayrı tahmin etmek.

Model Kurma

R'da çoklu doğrusal regresyon lm() fonksiyonuyla kurulur. Formül sözdizimi sezgiseldir: sol tarafta bağımlı, sağ tarafta bağımsız değişkenler yer alır.

r
# Gerekli paketler
library(car)       # VIF ve varsayım testleri
library(lmtest)    # Breusch-Pagan testi
library(broom)     # Düzenli çıktı

# Model kurma
model <- lm(akademik_basari ~ calisma_suresi + motivasyon +
              sosyoekonomik_durum + cinsiyet,
            data = veri)

# Özet
summary(model)

summary() çıktısı dört temel bilgi verir: katsayılar ve anlamlılık düzeyleri, modelin genel F testi, R² ve düzeltilmiş R² değerleri, artık (residual) istatistikleri.

Varsayım Kontrolleri

Regresyon sonuçlarına güvenebilmek için dört temel varsayımın sınanması zorunludur. Bu varsayımlar sağlanmadan elde edilen bulgular, hakemlerin soru işareti koyacağı bir metodolojik zayıflığa dönüşür.

1. Normallik

Artıkların (residuals) normal dağılım göstermesi beklenir. Shapiro-Wilk testi küçük örneklemlerde (n < 50), Q-Q grafiği ise daha büyük örneklemlerde tercih edilir:

r
# Shapiro-Wilk testi
shapiro.test(residuals(model))
# p > .05 ise normallik varsayımı sağlanmıştır

# Q-Q grafiği
qqnorm(residuals(model))
qqline(residuals(model), col = "red")

2. Çoklu Doğrusallık (Multicollinearity)

Bağımsız değişkenler arasında yüksek korelasyon varsa katsayılar güvenilmez hale gelir. VIF (Variance Inflation Factor) değerleri 10'un altında olmalıdır; 5'in üzerindeki değerler de dikkatle değerlendirilmelidir:

r
vif(model)
# Her değişken için VIF < 10 olmalı

3. Otokorelasyon

Özellikle zaman serisi veya tekrarlı ölçüm verilerinde artıklar arasında korelasyon oluşabilir. Durbin-Watson testi 2'ye yakın değer veriyorsa otokorelasyon sorun değildir:

r
durbinWatsonTest(model)
# DW istatistiği 1.5–2.5 arasında olmalı

4. Değişen Varyans (Heteroskedastisite)

Artıkların varyansı tüm tahmin değerleri için sabit olmalıdır. Breusch-Pagan testi bunu sayısal olarak sınar:

r
bptest(model)
# p > .05 ise sabit varyans (homoskedastisite) varsayımı sağlanmıştır

Dört varsayım testi için aynı anda grafik almak da mümkündür:

r
par(mfrow = c(2, 2))
plot(model)
par(mfrow = c(1, 1))

Sonuçları Yorumlama

r
tidy(model, conf.int = TRUE)
glance(model)

Çıktıdaki temel göstergeler:

  • **B katsayısı:** Diğer değişkenler sabit tutulduğunda, ilgili bağımsız değişkendeki 1 birimlik artışın bağımlı değişkende yarattığı değişim.
  • **β (standartlaştırılmış katsayı):** Farklı ölçek birimlerindeki değişkenleri karşılaştırmak için kullanılır. Mutlak değeri büyük olan değişken daha güçlü etkiye sahiptir.
  • **R²:** Modelin bağımlı değişkendeki varyansı açıklama oranı. Sosyal bilimlerde .30 kabul edilebilir, .50 iyi, .70 üzeri güçlü sayılır.
  • **Düzeltilmiş R²:** Modeldeki değişken sayısını hesaba katar; farklı model karşılaştırmalarında kullanılır.

APA 7 Formatında Raporlama

Yöntem bölümünde hangi varsayımların sınanıp sağlandığını kısaca belirtin. Bulgular bölümünde ise hem modelin genel anlamlılığını hem de bireysel katsayıları raporlayın:

*"Çalışma süresi, motivasyon, sosyoekonomik durum ve cinsiyetin akademik başarıyı yordayıp yordamadığını belirlemek amacıyla çoklu doğrusal regresyon analizi uygulanmıştır. Model öncesi normallik (Shapiro-Wilk), çoklu doğrusallık (VIF < 5) ve değişen varyans (Breusch-Pagan) varsayımları sınanmış, tüm varsayımların karşılandığı görülmüştür."*

*"Analiz sonucunda model istatistiksel olarak anlamlı bulunmuştur, F(4, 115) = 18.43, p < .001, R² = .39. Çalışma süresi (B = 0.42, SE = 0.08, β = .38, p < .001) ve motivasyon (B = 0.31, SE = 0.09, β = .27, p = .001) akademik başarının anlamlı yordayıcıları olarak belirlenmiştir."*

Kaynaklar

  • Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5th ed.). Sage.
  • R Core Team. lm() fonksiyonu dokümantasyonu. https://www.r-project.org
  • APA Publication Manual (7th ed.). https://apastyle.apa.org

Bu analizi tezinizde kullanmakta zorlanıyor musunuz?

Veri setinizi paylaşın, teorik gerekçesiyle birlikte APA 7 formatında analiz edip raporlayalım.

Proje Talebi Oluştur →

Başlayalım

Projenizi doğru temelde kuralım.

  • Teorik gerekçesiyle birlikte analiz
  • APA 7 uyumlu rapor ve R/Python kodu
  • 48 saat içinde ilk yanıt

%100 uzaktan · Türkiye genelinde