F testi - F-test

Bir F -testi herhangi bir istatistiksel test içinde test istatistiği bir sahiptir F -Dağıtım altında Boş hipotez . En çok , verilerin örneklendiği popülasyona en iyi uyan modeli belirlemek için, bir veri setine uydurulmuş istatistiksel modelleri karşılaştırırken kullanılır . Kesin " F- testleri" esas olarak modeller verilere en küçük kareler kullanılarak uydurulduğunda ortaya çıkar . İsim, Sir Ronald A. Fisher'ın onuruna George W. Snedecor tarafından icat edildi . Fisher ilk olarak istatistiği 1920'lerde varyans oranı olarak geliştirdi.

Yaygın örnekler

F testlerinin kullanımına ilişkin yaygın örnekler aşağıdaki durumların incelenmesini içerir:

Buna ek olarak, Scheffé'nin doğrusal modellerde çoklu karşılaştırma ayarlama yöntemi gibi bazı istatistiksel prosedürler de F testlerini kullanır.

İki varyansın eşitliğinin F- testi

F olduğu -test hassas için olmayan normalite . Olarak varyans analizi (ANOVA), alternatif testler şunlardır Levene'nin testi , Bartlett testi ve Brown-Forsythe testi . Bununla birlikte, bu testlerden herhangi biri , ortalama etkilerin test edilmesine yönelik bir ön adım olarak , temelde yatan homoskedastisite varsayımını ( yani varyansın homojenliğini) test etmek için yürütüldüğünde , deneysel Tip I hata oranında bir artış vardır .

Formül ve hesaplama

Çoğu F testi , bir veri koleksiyonundaki değişkenliğin karelerin toplamı cinsinden ayrıştırılması dikkate alınarak ortaya çıkar . Test istatistik bir in F değişkenlik farklı kaynaklardan yansıtan kareler iki ölçekli toplamlarının oranıdır testinde gösterilebilir. Bu karelerin toplamları, sıfır hipotezi doğru olmadığında istatistik daha büyük olma eğiliminde olacak şekilde oluşturulmuştur. İstatistiğin sıfır hipotezi altında F dağılımını takip edebilmesi için, karelerin toplamları istatistiksel olarak bağımsız olmalı ve her biri ölçekli bir χ² dağılımını izlemelidir . Veri değerlerinin bağımsız olması ve ortak bir varyansla normal olarak dağıtılması durumunda ikinci koşul garanti edilir .

Çoklu karşılaştırmalı ANOVA problemleri

Tek yönlü varyans analizinde F -testi, önceden tanımlanmış birkaç gruptaki nicel bir değişkenin beklenen değerlerinin birbirinden farklı olup olmadığını değerlendirmek için kullanılır . Örneğin, bir tıbbi araştırmanın dört tedaviyi karşılaştırdığını varsayalım. ANOVA F- testi, tedavilerden herhangi birinin, dört tedavinin hepsinin aynı ortalama yanıtı verdiği boş hipotezine karşı ortalama olarak daha üstün veya daha düşük olup olmadığını değerlendirmek için kullanılabilir. Bu, "omnibus" testine bir örnektir, yani birkaç olası farklılıktan herhangi birini tespit etmek için tek bir test gerçekleştirilir. Alternatif olarak, tedaviler arasında ikili testler yapabiliriz (örneğin, dört tedavili tıbbi deney örneğinde, tedavi çiftleri arasında altı test yapabiliriz). ANOVA F- testinin avantajı, hangi tedavilerin karşılaştırılacağını önceden belirlememiz gerekmemesi ve çoklu karşılaştırma yapmak için ayarlama yapmamıza gerek olmamasıdır . ANOVA F testinin dezavantajı , sıfır hipotezini reddedersek, hangi tedavilerin diğerlerinden önemli ölçüde farklı olduğunun söylenebileceğini bilmememiz ve eğer F testi α seviyesinde yapılırsa , şunu söyleyebilir miyiz? en büyük ortalama farka sahip tedavi çifti, a düzeyinde önemli ölçüde farklıdır.

Tek yönlü ANOVA F testi istatistiğinin formülü şöyledir:

veya

"Açıklanan varyans" veya "gruplar arası değişkenlik"

burada belirtmektedir örnek ortalaması olarak i , inci grubu gözlem sayısı i -inci grubu, verilerin genel ortalama temsil eder, ve gruplarının sayısını belirtmektedir.

"Açıklanamayan varyans" veya "grup içi değişkenlik"

burada bir j inci gözlem i th üzerinden grupları ve toplam örnek boyutudur. Bu F- istatistiki, F- dağılımını serbestlik dereceleriyle ve sıfır hipotezi altında izler . Gruplar arası değişkenlik, grup içi değişkenliğe göre büyükse istatistik büyük olacaktır; bu, grupların popülasyon ortalamalarının hepsinin aynı değere sahip olması durumunda gerçekleşmesi olası değildir .

Tek yönlü ANOVA F testi için yalnızca iki grup olduğunda , burada t , Öğrenci istatistiğidir .

Gerileme sorunları

Model 1'in model 2 içinde 'yuvalanmış' olduğu iki modeli düşünün: Model 1 kısıtlanmış modeldir ve model 2 sınırsız modeldir. Yani, model 1 p 1 parametresine sahiptir ve model 2 p 2 parametresine sahiptir, burada p 1  <  p 2'dir ve model 1'deki herhangi bir parametre seçimi için, modelin bazı parametrelerinin seçimi ile aynı regresyon eğrisi elde edilebilir. 2.

Bu bağlamda ortak bir bağlam, bir modelin verilere önemli ölçüde daha iyi uyup uymadığına karar vermektir; burada tek açıklayıcı terim kesişme terimidir, böylece bağımlı değişken için tüm tahmin edilen değerler o değişkeninkine eşit olarak ayarlanır. örnek demek. Tüm potansiyel açıklayıcı değişkenlerin katsayıları sıfıra eşit olduğu için saf model kısıtlı modeldir.

Diğer bir ortak bağlam, verilerde yapısal bir kırılma olup olmadığına karar vermektir: burada kısıtlı model tüm verileri tek bir regresyonda kullanırken, kısıtlanmamış model iki farklı veri alt kümesi için ayrı regresyonlar kullanır. F testinin bu kullanımı Chow testi olarak bilinir .

Daha fazla parametreye sahip model, her zaman en azından verilere ve daha az parametrelere sahip modele uyacaktır. Bu nedenle, tipik olarak model 2, verilere model 1'den daha iyi (yani daha düşük hata) bir uyum sağlayacaktır. Ancak çoğu zaman, model 2'nin verilere önemli ölçüde daha iyi uyup uymadığını belirlemek ister . Bu probleme bir yaklaşım, bir F testi kullanmaktır .

Her iki modelin parametrelerini tahmin etmek için n veri noktası varsa , o zaman F istatistiği hesaplanabilir.

burada RSS i , model i'nin karelerinin artık toplamıdır . Regresyon modeli ağırlıklarla hesaplandıysa, RSS i'yi 2 ile değiştirin , artıkların karelerinin ağırlıklı toplamı. Model 2'nin model 1'den önemli ölçüde daha iyi bir uyum sağlamadığı boş hipotezine göre, F ( p 2 - p 1n - p 2 ) serbestlik dereceleri ile bir F dağılımına sahip olacaktır . Verilerden hesaplanan F , istenen bazı yanlış ret olasılığı için F dağılımının kritik değerinden büyükse boş hipotez reddedilir (örn. 0.05). F bir olduğunu testinde gösterilebilir Wald testi .

Ayrıca bakınız

Referanslar

daha fazla okuma

Dış bağlantılar