Tez için istatistik analizi ne kadar sürer?

Proje kapsamına göre 24–72 saat arasında değişir. Teslim tarihi proje başında netleştirilir.

Hangi istatistik yazılımları kullanılıyor?

Tüm analizler R ve Python ile yürütülür. Talep edilirse SPSS çıktı formatında tablo ve şekil teslim edilebilir.

Verilerimin gizliliği nasıl sağlanıyor?

Paylaşılan veri seti ve bulgular yalnızca projeniz için kullanılır. Proje tesliminin ardından verileriniz kalıcı olarak silinir. Talep edilmesi durumunda Gizlilik Sözleşmesi imzalanabilir.

Danışman revizyonu talep ederse ek ücret alınır mı?

Danışman kaynaklı istatistik revizyonları kapsama dahildir, ek ücret alınmaz.

APA 7 formatında rapor teslim ediliyor mu?

Evet. Tüm tablolar, şekiller ve metin içi istatistikler APA 7 formatına uygun olarak hazırlanır.

R ile Çoklu Doğrusal Regresyon Analizi

Çoklu Doğrusal Regresyon Nedir?

Çoklu doğrusal regresyon, tek bir bağımlı değişkeni birden fazla bağımsız değişkenle açıklamaya çalışan parametrik bir istatistiksel yöntemdir. Sosyal bilimlerden tıbba, eğitimden psikolojiye kadar geniş bir alanda kullanılır ve tez çalışmalarında en sık başvurulan analiz yöntemleri arasındadır.

Temel mantık şudur: her bağımsız değişkenin bağımlı değişken üzerindeki etkisini, diğer değişkenlerin etkisi sabit tutularak ayrı ayrı tahmin etmek.

Model Kurma

R'da çoklu doğrusal regresyon lm() fonksiyonuyla kurulur. Formül sözdizimi sezgiseldir: sol tarafta bağımlı, sağ tarafta bağımsız değişkenler yer alır.

# Gerekli paketler
library(car)       # VIF ve varsayım testleri
library(lmtest)    # Breusch-Pagan testi
library(broom)     # Düzenli çıktı

# Model kurma
model <- lm(akademik_basari ~ calisma_suresi + motivasyon +
              sosyoekonomik_durum + cinsiyet,
            data = veri)

# Özet
summary(model)

summary() çıktısı dört temel bilgi verir: katsayılar ve anlamlılık düzeyleri, modelin genel F testi, R² ve düzeltilmiş R² değerleri, artık (residual) istatistikleri.

Varsayım Kontrolleri

Regresyon sonuçlarına güvenebilmek için dört temel varsayımın sınanması zorunludur. Bu varsayımlar sağlanmadan elde edilen bulgular, hakemlerin soru işareti koyacağı bir metodolojik zayıflığa dönüşür.

1. Normallik

Artıkların (residuals) normal dağılım göstermesi beklenir. Shapiro-Wilk testi küçük örneklemlerde (n < 50), Q-Q grafiği ise daha büyük örneklemlerde tercih edilir:

# Shapiro-Wilk testi
shapiro.test(residuals(model))
# p > .05 ise normallik varsayımı sağlanmıştır

# Q-Q grafiği
qqnorm(residuals(model))
qqline(residuals(model), col = "red")

2. Çoklu Doğrusallık (Multicollinearity)

Bağımsız değişkenler arasında yüksek korelasyon varsa katsayılar güvenilmez hale gelir. VIF (Variance Inflation Factor) değerleri 10'un altında olmalıdır; 5'in üzerindeki değerler de dikkatle değerlendirilmelidir:

vif(model)
# Her değişken için VIF < 10 olmalı

3. Otokorelasyon

Özellikle zaman serisi veya tekrarlı ölçüm verilerinde artıklar arasında korelasyon oluşabilir. Durbin-Watson testi 2'ye yakın değer veriyorsa otokorelasyon sorun değildir:

durbinWatsonTest(model)
# DW istatistiği 1.5–2.5 arasında olmalı

4. Değişen Varyans (Heteroskedastisite)

Artıkların varyansı tüm tahmin değerleri için sabit olmalıdır. Breusch-Pagan testi bunu sayısal olarak sınar:

bptest(model)
# p > .05 ise sabit varyans (homoskedastisite) varsayımı sağlanmıştır

Dört varsayım testi için aynı anda grafik almak da mümkündür:

par(mfrow = c(2, 2))
plot(model)
par(mfrow = c(1, 1))

Sonuçları Yorumlama

tidy(model, conf.int = TRUE)
glance(model)

Çıktıdaki temel göstergeler:

**B katsayısı:** Diğer değişkenler sabit tutulduğunda, ilgili bağımsız değişkendeki 1 birimlik artışın bağımlı değişkende yarattığı değişim.
**β (standartlaştırılmış katsayı):** Farklı ölçek birimlerindeki değişkenleri karşılaştırmak için kullanılır. Mutlak değeri büyük olan değişken daha güçlü etkiye sahiptir.
**R²:** Modelin bağımlı değişkendeki varyansı açıklama oranı. Sosyal bilimlerde .30 kabul edilebilir, .50 iyi, .70 üzeri güçlü sayılır.
**Düzeltilmiş R²:** Modeldeki değişken sayısını hesaba katar; farklı model karşılaştırmalarında kullanılır.

APA 7 Formatında Raporlama

Yöntem bölümünde hangi varsayımların sınanıp sağlandığını kısaca belirtin. Bulgular bölümünde ise hem modelin genel anlamlılığını hem de bireysel katsayıları raporlayın:

*"Çalışma süresi, motivasyon, sosyoekonomik durum ve cinsiyetin akademik başarıyı yordayıp yordamadığını belirlemek amacıyla çoklu doğrusal regresyon analizi uygulanmıştır. Model öncesi normallik (Shapiro-Wilk), çoklu doğrusallık (VIF < 5) ve değişen varyans (Breusch-Pagan) varsayımları sınanmış, tüm varsayımların karşılandığı görülmüştür."*

*"Analiz sonucunda model istatistiksel olarak anlamlı bulunmuştur, F(4, 115) = 18.43, p < .001, R² = .39. Çalışma süresi (B = 0.42, SE = 0.08, β = .38, p < .001) ve motivasyon (B = 0.31, SE = 0.09, β = .27, p = .001) akademik başarının anlamlı yordayıcıları olarak belirlenmiştir."*

Kaynaklar

Field, A. (2018). Discovering Statistics Using IBM SPSS Statistics (5th ed.). Sage.
R Core Team. lm() fonksiyonu dokümantasyonu. https://www.r-project.org
APA Publication Manual (7th ed.). https://apastyle.apa.org