← Blog'a Dön
İstatistik Teorisi9 dk okuma2026-05-28

Bayes Teoremi: Akademik Araştırmada Koşullu Olasılık

Koşullu Olasılık Nedir ve Neden Önemlidir?

Pek çok araştırma sorusu doğası gereği koşulludur: "Bu semptom görülen birinin hasta olma olasılığı nedir?" veya "Müdahale grubundaki iyileşme, kontrol grubunun varlığı göz önünde bulundurulduğunda ne anlama gelir?" Bu soruların doğru yanıtlanması koşullu olasılık (conditional probability) kavramına dayanır.

P(B)>0P(B) > 0 koşulunda A'nın B koşulundaki olasılığı şöyle tanımlanır:

P(A mid B) = rac{P(A cap B)}{P(B)}

Bu formülün sezgisel anlamı şudur: B'nin gerçekleştiğini bildiğimizde, yalnızca B'nin gerçekleştiği uzayı referans alırız ve A'nın bu uzaydaki payını hesaplarız.

Toplam Olasılık Yasası

Gerçek araştırma problemlerinde doğrudan P(A) hesaplamak çoğu zaman mümkün değildir. Bunun yerine A'yı, birbirini dışlayan ve örneklem uzayını tam kaplayan B_1, B_2, ..., B_k koşullarına göre ayrıştırırız:

P(A)=sumi=1nP(AmidBi),P(Bi)P(A) = sum_{i=1}^{n} P(A mid B_i), P(B_i)

Bu yasa, bir olayın olasılığını farklı senaryolar üzerinden ayrıştırarak hesaplamamıza olanak tanır. Epidemiyolojide hastalık prevalansı, kalite kontrolde hata oranı, eğitim araştırmalarında başarı olasılığı gibi hesaplamalarda temel araçtır.

Bayes Teoremi

Bayes Teoremi, koşullu olasılığı "ters yönde" hesaplamamıza olanak tanır. Bir testi uyguladınız ve sonucu pozitif çıktı. Peki kişinin gerçekten hasta olma olasılığı nedir?

P(B_i mid A) = rac{P(A mid B_i),P(B_i)}{P(A)}

Payda Toplam Olasılık Yasasıyla hesaplanır:

P(B_i mid A) = rac{P(A mid B_i),P(B_i)}{displaystylesum_{k} P(A mid B_k),P(B_k)}

Temel Terimler

  • P(B_i): Ön olasılık (prior) — veriden önce bildiğimiz olasılık (örn. hastalık prevalansı)
  • P(A | B_i): Olabilirlik (likelihood) — koşulun doğru olduğu durumda gözlemin olasılığı (örn. testin duyarlılığı)
  • P(B_i | A): Son olasılık (posterior) — gözlemi gördükten sonra güncellenen olasılık

Tıbbi Test Örneği: Neden Pozitif Test Yanıltıcı Olabilir?

Nadir bir hastalığı tespit eden bir test ele alalım:

  • Hastalık prevalansı: P(hasta) = 0.01 (1 kişide 1)
  • Testin duyarlılığı (sensitivity): P(pozitif | hasta) = 0.95
  • Testin özgüllüğü (specificity): P(negatif | sağlıklı) = 0.90

Pozitif test sonucu alan birinin gerçekten hasta olma olasılığı:

r
# Parametreler
prevalans   <- 0.01
duyarlilik  <- 0.95   # P(+ | hasta)
ozgulluk    <- 0.90   # P(- | saglikli)
yalanci_poz <- 1 - ozgulluk  # P(+ | saglikli)

# Toplam olasılık: P(pozitif)
p_pozitif <- duyarlilik * prevalans +
             yalanci_poz * (1 - prevalans)

# Bayes: P(hasta | pozitif)
p_hasta_verilen_poz <- (duyarlilik * prevalans) / p_pozitif

cat("P(hasta | pozitif test) =", round(p_hasta_verilen_poz, 4))
# P(hasta | pozitif test) = 0.0873

Sonuç çarpıcıdır: duyarlılığı %95, özgüllüğü %90 olan bir testte pozitif sonuç alanların yalnızca %8.7'si gerçekten hastadır. Bu "Temel Oran Yanılgısı" (base rate fallacy) olarak bilinir ve klinik araştırmalarda kritik önem taşır.

Bağımsızlık

İki olay bağımsızdır eğer ve ancak P(AcapB)=P(A)cdotP(B)P(A cap B) = P(A) cdot P(B) ise. Eşdeğer ifade: P(AmidB)=P(A)P(A mid B) = P(A). Yani B'nin gerçekleşmesi A'nın olasılığını değiştirmez.

Bağımsızlık testi araştırma tasarımında kritiktir. İki ölçüm bağımsız mı yoksa ilişkili mi? Bu sorunun yanıtı hangi istatistik testinin kullanılacağını belirler (bağımsız t-testi vs. eşleştirilmiş t-testi; bağımsız ki-kare vs. McNemar testi).

R'da Bayes Güncellemesi

Birden fazla kanıt ardışık biçimde değerlendirilecekse ön olasılık her adımda güncellenir:

r
# Ardışık Bayes güncellemesi
bayes_guncelle <- function(prior, likelihood_ratio) {
  # likelihood_ratio = P(kanit | H1) / P(kanit | H0)
  posterior_oran  <- prior / (1 - prior) * likelihood_ratio
  posterior       <- posterior_oran / (1 + posterior_oran)
  return(posterior)
}

# Başlangıç: %10 önsel olasılık
p <- 0.10

# Üç bağımsız kanıt (her biri 3:1 olabilirlik oranı)
for (i in 1:3) {
  p <- bayes_guncelle(p, likelihood_ratio = 3)
  cat("Kanit", i, "sonrasi posterior:", round(p, 4), "
")
}
# Kanit 1 sonrasi posterior: 0.25
# Kanit 2 sonrasi posterior: 0.5
# Kanit 3 sonrasi posterior: 0.75

Meta-analizde Bayes Yaklaşımı

Bayes istatistiği meta-analizde giderek yaygınlaşmaktadır. Klasik random-effects meta-analizde heterojenlik parametresi τ² nokta tahminiyle raporlanır. Bayes yaklaşımında ise τ²'nin belirsizliği de modele dahil edilir:

r
library(brms)

# Bayes random-effects meta-analiz
meta_model <- brm(
  yi | se(sei) ~ 1 + (1 | study),
  data   = meta_veri,
  prior  = c(prior(normal(0, 1), class = Intercept),
             prior(cauchy(0, 0.5), class = sd)),
  chains = 4, iter = 4000,
  cores  = 4
)

summary(meta_model)

Yöntem Bölümünde Raporlama

Klasik Bayes analizi raporunda şu bilgiler yer almalıdır:

"Ön olasılık dağılımı [kaynak]'tan elde edilen mevcut literatür verilerine dayanılarak belirlenmiştir. [Yazılım, sürüm] kullanılarak MCMC örneklemesi yapılmış (zincir sayısı = 4, iterasyon = 4000, burn-in = 2000) ve yakınsama Gelman-Rubin istatistiği (R̂ < 1.01) ile doğrulanmıştır. Posterior dağılımın %95 kredibilite aralığı ve medyan rapor edilmiştir."

Kaynaklar

  • Ross, S. (2019). A First Course in Probability (10th ed.). Pearson.
  • Kruschke, J. K. (2014). Doing Bayesian Data Analysis (2nd ed.). Academic Press.
  • Spiegelhalter, D., Abrams, K., & Myles, J. (2004). Bayesian Approaches to Clinical Trials. Wiley.

Bu analizi tezinizde kullanmakta zorlanıyor musunuz?

Veri setinizi paylaşın, teorik gerekçesiyle birlikte APA 7 formatında analiz edip raporlayalım.

Proje Talebi Oluştur →

Başlayalım

Projenizi doğru temelde kuralım.

  • Teorik gerekçesiyle birlikte analiz
  • APA 7 uyumlu rapor ve R/Python kodu
  • 48 saat içinde ilk yanıt

%100 uzaktan · Türkiye genelinde