Lindley'in paradoksu - Lindley's paradox

Lindley'in paradoksu , bir hipotez test etme problemine Bayesci ve sıklıkçı yaklaşımların , önceki dağılımın belirli seçimleri için farklı sonuçlar verdiği istatistiklerde , sezgisel olmayan bir durumdur . İki yaklaşım arasındaki uyuşmazlık sorunu Harold Jeffreys'in 1939 ders kitabında tartışılmıştır ; Dennis Lindley'in 1957 tarihli bir makaledeki anlaşmazlığı bir paradoks olarak adlandırmasından sonra bu, Lindley'nin paradoksu olarak bilinir hale geldi .

Bir paradoks olarak adlandırılsa da , Bayesci ve sıklıkçı yaklaşımlardan elde edilen farklı sonuçlar, bunların iki yöntem arasındaki gerçek anlaşmazlıktan ziyade temelde farklı soruları yanıtlamak için kullanılması olarak açıklanabilir.

Bununla birlikte, büyük bir öncelikler sınıfı için, sık ve Bayes yaklaşımı arasındaki farklar, önem düzeyini sabit tutmaktan kaynaklanır: Lindley'nin bile kabul ettiği gibi, "teori, önem düzeyini sabit tutma pratiğini haklı çıkarmaz" ve hatta "bazıları". Bu makalenin tartışmasında Prof. Pearson tarafından yapılan hesaplamalar, eğer kayıplar ve önceki olasılıklar sabit tutulursa, önem düzeyinin örneklem büyüklüğü ile nasıl değişmesi gerektiğini vurguladı.'' Aslında, kritik değer örneklem büyüklüğü ile uygun şekilde artarsa, hızlıysa, örneklem büyüklüğü arttıkça frekansçı ve Bayesci yaklaşımlar arasındaki uyuşmazlık ihmal edilebilir hale gelir.

paradoksun açıklaması

Bazı deneylerin sonucunun iki olası açıklaması vardır, hipotezler ve ve hesaba katılmadan önce hangi hipotezin daha doğru olduğuna dair belirsizliği temsil eden bazı önceki dağılımlar .

Lindley paradoksu ne zaman ortaya çıkar?

  1. Sonuç , sık sık yapılan bir teste göre "önemlidir" ve bu , örneğin %5 düzeyinde reddetmek için yeterli kanıtı gösterir ve
  2. Posterior olasılık içinde verilen güçlü kanıtlar gösteren yüksek olduğu daha uyum içindedir daha .

Bu sonuçlar, aşağıda görüldüğü gibi çok spesifik, daha yaygın ve önceki dağılımın birini veya diğerini güçlü bir şekilde desteklemediği durumlarda aynı anda ortaya çıkabilir .

Sayısal örnek

Aşağıdaki sayısal örnek, Lindley'in paradoksunu göstermektedir. Belirli bir şehirde, belirli bir zaman diliminde 49.581 erkek ve 48.870 kız çocuğu dünyaya gelmiştir. Erkek doğumların gözlenen oranı böylece 49.581/98.451 ≈ 0.5036'dır. Erkek doğumların kesrinin parametreli binom bir değişken olduğunu varsayıyoruz . 0,5 veya başka bir değer olup olmadığını test etmekle ilgileniyoruz . Yani, sıfır hipotezimiz ve alternatifi .

sık yaklaşım

Teste yönelik sık kullanılan yaklaşım, bir p-değeri hesaplamaktır , erkek çocukların en azından doğru varsayıldığı kadar büyük bir kısmını gözlemleme olasılığı . Doğumların sayısı çok büyük olduğu için, bir kullanabilir Normal yaklaşım erkek doğum kısmı için olan ve bilgi işlem için,

49.581 kadın doğumu görmüş olsaydık da aynı derecede şaşırırdık, yani bir sık ​​sık ziyaret eden kişi genellikle p-değeri olan iki taraflı bir test uygulardı . Her iki durumda da p-değeri, %5'lik anlamlılık düzeyinden, α'dan daha düşüktür, bu nedenle sıklıkçı yaklaşım , gözlemlenen verilerle uyuşmadığı için reddeder .

Bayes yaklaşımı

Diğeri üzerinde bir hipotezi lehine hiçbir neden varsayarsak, Bayes yaklaşımı öncesinde olasılıkları değerlendirmeye olacağını ve bir tekdüze dağılım altındakiler arka olasılığını hesaplamak için, sonra ve kullanma Bayes teoremi ,

Doğuştan erkek çocukları gözlemledikten sonra , bir binom değişkeni için olasılık kütle fonksiyonunu kullanarak her hipotezin arka olasılığını hesaplayabiliriz ,

nerede olduğunu Beta fonksiyonu .

Bu değerlerden, üzerinde kuvvetle tercih edilen ' nin arka olasılığını buluyoruz .

İki yaklaşım - Bayesci ve frekansçı - çatışıyor gibi görünüyor ve bu "paradoks".

Bayesci ve frekansçı yaklaşımların uzlaştırılması

Bununla birlikte, Lindley örneğinde en azından biz anlamlılık seviyelerinde, bir dizi almak durumunda α n , öyle ki, α , n = n - r ile r > 1/2 ile tutarlıdır 0, sıfır yakınsak sonra arka olasılık, sıfırın reddedilmesi. Bu sayısal örnekte, r = 1/2 almak , 0.00318'lik bir anlamlılık düzeyi ile sonuçlanır, bu nedenle, frekansçı, Bayes yaklaşımıyla kabaca uyumlu olan boş hipotezi reddetmeyecektir.

Dağılımı p geçersiz hipoteze göre, ve arka dağıtım p .

Bilgi vermeyen bir önsel kullanırsak ve frekansçı yaklaşımdakine daha benzer bir hipotezi test edersek , paradoks ortadan kalkar.

Örneğin, (ie ) üzerinde düzgün bir önsel dağılım kullanarak sonsal dağılımı hesaplarsak , şunu buluruz:

Bunu yeni doğmuş bir bebeğin kız olma olasılığının erkek olma olasılığını kontrol etmek için kullanırsak, yani şunu buluruz:


Başka bir deyişle, erkek doğumların oranının 0,5'in üzerinde olması çok olasıdır.

Her iki analiz de etki büyüklüğünün doğrudan bir tahminini vermez , ancak her ikisi de örneğin erkek çocuk doğumlarının belirli bir eşiğin üzerinde olup olmayacağını belirlemek için kullanılabilir.

Gerçek bir paradoksun olmaması

İki yaklaşım arasındaki bariz anlaşmazlık, faktörlerin bir kombinasyonundan kaynaklanmaktadır. İlk olarak, yukarıdaki frekans yaklaşımı , referans olmadan test eder . Bayes yaklaşımı , 'ye bir alternatif olarak değerlendirir ve ilkinin gözlemlerle daha iyi uyum içinde olduğunu bulur. Bunun nedeni, ikinci hipotezin, içinde herhangi bir yerde olabileceği gibi, çok daha yaygın olmasıdır, bu da onun çok düşük bir sonsal olasılığa sahip olmasına neden olur. Nedenini anlamak için, iki hipotezi gözlemlerin oluşturucuları olarak düşünmek faydalı olacaktır:

  • altında , seçiyoruz ve 98.451 doğumda 49.581 erkek çocuğu görmenin ne kadar olası olduğunu soruyoruz.
  • altında , 0'dan 1'e kadar herhangi bir yerden rastgele seçiyoruz ve aynı soruyu soruyoruz.

İçin olası değerler çoğu under çok kötü gözlemlerle desteklenmektedir. Özünde, yöntemler arasındaki bariz anlaşmazlık bir anlaşmazlık değil, daha ziyade hipotezlerin verilerle nasıl ilişkili olduğuna dair iki farklı ifadedir:

  • Sıkça kullanan kişi , bunun gözlem için yetersiz bir açıklama olduğunu düşünüyor.
  • Bayesci, bunun gözlem için 'den çok daha iyi bir açıklama olduğunu bulur .

Sık yapılan teste göre yenidoğanların cinsiyet oranı muhtemelen 50/50 erkek/kadındır. Yine de 50/50 , diğer oranların hepsinden olmasa da çoğundan daha iyi bir yaklaşımdır . Hipotez , gözleme dahil olmak üzere neredeyse tüm diğer oranlardan çok daha iyi uyuyordu .

Örneğin, bu hipotez ve ön olasılık seçimi şu ifadeyi ima eder: "Eğer > 0,49 ve < 0,51 ise, o zaman tam olarak 0,5 olma önceki olasılığı 0,50/0,51 %98'dir." İçin böyle güçlü bir tercihi göz önüne alındığında , bunu görmek kolaydır neden Bayes yaklaşımı iyilik karşısında dahi gözlenen değer olsa yalanlar uzakta 0,5 ila. 2 sigmadan fazla sapma, frekans yaklaşımında önemli kabul edilir, ancak önemi, Bayes yaklaşımında önceki tarafından reddedilir.

Başka bir şekilde baktığımızda, önceki dağılımın delta fonksiyonu ile temelde düz olduğunu görebiliriz . Açıkçası bu şüpheli. Aslında, gerçek sayıları sürekli olarak hayal edecek olsaydınız, verilen herhangi bir sayının tam olarak parametre değeri olmasının imkansız olduğunu varsaymak daha mantıklı olurdu, yani .

Alternatif hipotezde için daha gerçekçi bir dağılım, 'nin arkası için daha az şaşırtıcı bir sonuç üretir . Biz değiştirmek Örneğin, ile , yani maksimum olabilirlik tahmin için , arka olasılık için 0.93 ile karşılaştırıldığında sadece 0.07 olurdu (Tabii ki, biri aslında bir önceki dağıtımının parçası olarak MLE kullanamazsınız).

Son tartışma

Paradoks, aktif bir tartışma kaynağı olmaya devam ediyor.

Ayrıca bakınız

Notlar

daha fazla okuma