Koşullu Olasılık Nedir ve Neden Önemlidir?
Pek çok araştırma sorusu doğası gereği koşulludur: "Bu semptom görülen birinin hasta olma olasılığı nedir?" veya "Müdahale grubundaki iyileşme, kontrol grubunun varlığı göz önünde bulundurulduğunda ne anlama gelir?" Bu soruların doğru yanıtlanması koşullu olasılık (conditional probability) kavramına dayanır.
koşulunda A'nın B koşulundaki olasılığı şöyle tanımlanır:
Bu formülün sezgisel anlamı şudur: B'nin gerçekleştiğini bildiğimizde, yalnızca B'nin gerçekleştiği uzayı referans alırız ve A'nın bu uzaydaki payını hesaplarız.
Toplam Olasılık Yasası
Gerçek araştırma problemlerinde doğrudan P(A) hesaplamak çoğu zaman mümkün değildir. Bunun yerine A'yı, birbirini dışlayan ve örneklem uzayını tam kaplayan B_1, B_2, ..., B_k koşullarına göre ayrıştırırız:
Bu yasa, bir olayın olasılığını farklı senaryolar üzerinden ayrıştırarak hesaplamamıza olanak tanır. Epidemiyolojide hastalık prevalansı, kalite kontrolde hata oranı, eğitim araştırmalarında başarı olasılığı gibi hesaplamalarda temel araçtır.
Bayes Teoremi
Bayes Teoremi, koşullu olasılığı "ters yönde" hesaplamamıza olanak tanır. Bir testi uyguladınız ve sonucu pozitif çıktı. Peki kişinin gerçekten hasta olma olasılığı nedir?
Payda Toplam Olasılık Yasasıyla hesaplanır:
Temel Terimler
- P(B_i): Ön olasılık (prior) — veriden önce bildiğimiz olasılık (örn. hastalık prevalansı)
- P(A | B_i): Olabilirlik (likelihood) — koşulun doğru olduğu durumda gözlemin olasılığı (örn. testin duyarlılığı)
- P(B_i | A): Son olasılık (posterior) — gözlemi gördükten sonra güncellenen olasılık
Tıbbi Test Örneği: Neden Pozitif Test Yanıltıcı Olabilir?
Nadir bir hastalığı tespit eden bir test ele alalım:
- Hastalık prevalansı: P(hasta) = 0.01 (1 kişide 1)
- Testin duyarlılığı (sensitivity): P(pozitif | hasta) = 0.95
- Testin özgüllüğü (specificity): P(negatif | sağlıklı) = 0.90
Pozitif test sonucu alan birinin gerçekten hasta olma olasılığı:
# Parametreler
prevalans <- 0.01
duyarlilik <- 0.95 # P(+ | hasta)
ozgulluk <- 0.90 # P(- | saglikli)
yalanci_poz <- 1 - ozgulluk # P(+ | saglikli)
# Toplam olasılık: P(pozitif)
p_pozitif <- duyarlilik * prevalans +
yalanci_poz * (1 - prevalans)
# Bayes: P(hasta | pozitif)
p_hasta_verilen_poz <- (duyarlilik * prevalans) / p_pozitif
cat("P(hasta | pozitif test) =", round(p_hasta_verilen_poz, 4))
# P(hasta | pozitif test) = 0.0873Sonuç çarpıcıdır: duyarlılığı %95, özgüllüğü %90 olan bir testte pozitif sonuç alanların yalnızca %8.7'si gerçekten hastadır. Bu "Temel Oran Yanılgısı" (base rate fallacy) olarak bilinir ve klinik araştırmalarda kritik önem taşır.
Bağımsızlık
İki olay bağımsızdır eğer ve ancak ise. Eşdeğer ifade: . Yani B'nin gerçekleşmesi A'nın olasılığını değiştirmez.
Bağımsızlık testi araştırma tasarımında kritiktir. İki ölçüm bağımsız mı yoksa ilişkili mi? Bu sorunun yanıtı hangi istatistik testinin kullanılacağını belirler (bağımsız t-testi vs. eşleştirilmiş t-testi; bağımsız ki-kare vs. McNemar testi).
R'da Bayes Güncellemesi
Birden fazla kanıt ardışık biçimde değerlendirilecekse ön olasılık her adımda güncellenir:
# Ardışık Bayes güncellemesi
bayes_guncelle <- function(prior, likelihood_ratio) {
# likelihood_ratio = P(kanit | H1) / P(kanit | H0)
posterior_oran <- prior / (1 - prior) * likelihood_ratio
posterior <- posterior_oran / (1 + posterior_oran)
return(posterior)
}
# Başlangıç: %10 önsel olasılık
p <- 0.10
# Üç bağımsız kanıt (her biri 3:1 olabilirlik oranı)
for (i in 1:3) {
p <- bayes_guncelle(p, likelihood_ratio = 3)
cat("Kanit", i, "sonrasi posterior:", round(p, 4), "
")
}
# Kanit 1 sonrasi posterior: 0.25
# Kanit 2 sonrasi posterior: 0.5
# Kanit 3 sonrasi posterior: 0.75Meta-analizde Bayes Yaklaşımı
Bayes istatistiği meta-analizde giderek yaygınlaşmaktadır. Klasik random-effects meta-analizde heterojenlik parametresi τ² nokta tahminiyle raporlanır. Bayes yaklaşımında ise τ²'nin belirsizliği de modele dahil edilir:
library(brms)
# Bayes random-effects meta-analiz
meta_model <- brm(
yi | se(sei) ~ 1 + (1 | study),
data = meta_veri,
prior = c(prior(normal(0, 1), class = Intercept),
prior(cauchy(0, 0.5), class = sd)),
chains = 4, iter = 4000,
cores = 4
)
summary(meta_model)Yöntem Bölümünde Raporlama
Klasik Bayes analizi raporunda şu bilgiler yer almalıdır:
"Ön olasılık dağılımı [kaynak]'tan elde edilen mevcut literatür verilerine dayanılarak belirlenmiştir. [Yazılım, sürüm] kullanılarak MCMC örneklemesi yapılmış (zincir sayısı = 4, iterasyon = 4000, burn-in = 2000) ve yakınsama Gelman-Rubin istatistiği (R̂ < 1.01) ile doğrulanmıştır. Posterior dağılımın %95 kredibilite aralığı ve medyan rapor edilmiştir."
Kaynaklar
- Ross, S. (2019). A First Course in Probability (10th ed.). Pearson.
- Kruschke, J. K. (2014). Doing Bayesian Data Analysis (2nd ed.). Academic Press.
- Spiegelhalter, D., Abrams, K., & Myles, J. (2004). Bayesian Approaches to Clinical Trials. Wiley.
Bu analizi tezinizde kullanmakta zorlanıyor musunuz?
Veri setinizi paylaşın, teorik gerekçesiyle birlikte APA 7 formatında analiz edip raporlayalım.