Açıklanan varyasyon - Explained variation

Olarak istatistik , bir varyasyon açıklanmaktadır önlemleri bir matematiksel model varyasyon (hesapları hangi oranı dispersiyon belirli bir veri kümesi). Çoğunlukla varyasyon, varyans olarak ölçülür ; o zaman, daha spesifik bir terim açıklanan varyans kullanılabilir.

Toplam varyasyonun tamamlayıcı kısmı, açıklanamayan veya artık varyasyon olarak adlandırılır .

Bilgi kazanımı açısından tanım

Daha iyi modelleme ile bilgi kazancı

Kent'i (1983) takip ederek Fraser bilgilerini kullanıyoruz (Fraser 1965)

burada rastgele değişkenin olasılık yoğunluğu ve ile ( parametrik model iki aile vardır). 0 model ailesi, kısıtlı bir parametre alanı ile daha basit olanıdır .

Parametreler maksimum olabilirlik tahmini ile belirlenir ,

Model 1'in model 0'a göre bilgi kazancı şu şekilde yazılır:

kolaylık sağlamak için 2 çarpanı dahil edilmiştir. Γ her zaman negatif değildir; g ( r ) 'yi açıklamada en iyi aile 1 modelinin en iyi aile modelinden ne ölçüde daha iyi olduğunu ölçer .

Koşullu bir modelle bilgi kazancı

İki boyutlu bir rasgele değişken varsayalım X, açıklayıcı bir değişken olarak kabul edilir, ve Y , bir bağımlı değişken olarak. Aile 1'in modelleri Y'yi X açısından "açıklar" ,

,

0 ailesinde ise X ve Y'nin bağımsız olduğu varsayılır. Biz rastlantısallığını tanımlayan Y ile ve rastlantısallığını Y verilen X, ile, . Sonra,

X tarafından "açıklanan" veri dağılımının oranı olarak yorumlanabilir .

Özel durumlar ve genel kullanım

Doğrusal regresyon

Açıklanamayan varyans oranı, doğrusal regresyon bağlamında yerleşik bir kavramdır . Belirleme katsayısının olağan tanımı , açıklanan varyans temel kavramına dayanmaktadır.

Açıklanan varyansın ölçüsü olarak korelasyon katsayısı

Let X'in rasgele vektör ve olmak Y'nin merkezi olan bir normal dağılım ile modellenir rastgele değişken . Bu durumda, açıklanan varyasyonun yukarıda türetilen oranı , kare korelasyon katsayısına eşittir .

Güçlü model varsayımlarına dikkat edin: Y dağılımının merkezi, X'in doğrusal bir fonksiyonu olmalıdır ve herhangi bir x için Y dağılımı normal olmalıdır. Diğer durumlarda, genellikle açıklanan varyansın oranı olarak yorumlamak haklı değildir .

Temel bileşen analizinde

Açıklanan varyans, temel bileşen analizinde rutin olarak kullanılır . Fraser-Kent bilgi kazanımı ile olan ilişki açıklığa kavuşturulmayı beklemektedir.

Eleştiri

"Açıklanan varyans" fraksiyonu, karesel korelasyon katsayısına eşit olduğundan , ikincisinin tüm dezavantajlarını paylaşır: sadece regresyonun kalitesini değil, aynı zamanda bağımsız (koşullandırma) değişkenlerin dağılımını da yansıtır.

Bir eleştirmenin sözleriyle: "Böylece , çoğu sosyal bilimci için şüpheli bir anlama sahip ancak büyük retorik değeri olan bir ifade olan, regresyonla açıklanan 'varyans yüzdesini' verir. Bu sayı büyükse, gerileme iyi bir sonuç verir. uygun, ve ek değişkenlerin aranmasında çok az nokta vardır. Farklı veri kümelerindeki diğer regresyon denklemlerinin daha az tatmin edici veya daha düşükse daha az güçlü olduğu söylenir . Bu iddialarla ilgili hiçbir şey desteklemiyor ". Ve, sadece iki farklı popülasyondan alınan verilerin müştereken ele alınmasıyla zenginleştirilen bir örnek oluşturduktan sonra : "'Açıklanan varyans' hiçbir şeyi açıklamaz."

Ayrıca bakınız

Referanslar

Dış bağlantılar