Sıralamada ANOVA - ANOVA on ranks

Olarak istatistik için tek bir amaç varyans analizi (ANOVA) farklılıklarını analiz etmek vasıtasıyla gruplar arasında. Test istatistiği F , gözlemlerin, homojen varyansların ve popülasyon normalliğinin bağımsız olduğunu varsayar . Sıralardaki ANOVA , normallik varsayımının ihlal edildiği durumlar için tasarlanmış bir istatistiktir.

F testinin mantığı

F istatistiği bir payda, bir numara bir oranıdır. Daha sonra A, B ve C gruplarına rastgele atanan rastgele seçilmiş konuları düşünün. Boş hipotezin gerçeğine göre, bazı bağımlı değişkenlerdeki puanların değişkenliği (veya karelerin toplamı) her grup içinde aynı olacaktır. Serbestlik derecelerine bölündüğünde (yani, grup başına denek sayısına dayalı olarak), F oranının paydası elde edilir.

Her grubun ortalamasını bir puan olarak değerlendirin ve bu üç puanın değişkenliğini (yine karelerin toplamını) hesaplayın. Serbestlik derecesine bölündüğünde (yani grup sayısına göre), F oranının payı elde edilir.

Sıfır hipotezinin gerçeği altında, F oranının örnekleme dağılımı pay ve payda için serbestlik derecelerine bağlıdır.

Her puanı X'e göre artırarak A grubuna uygulanan bir muameleyi modelleyin. (Bu model, homojen varyansların altında yatan varsayımı sürdürür. Pratikte, bir grup ortalamasındaki X artışının, bir artışla meydana gelmesi - imkansız değilse de - nadirdir. her üyenin X'e göre puan alması.) Bu, dağılım X birimlerini pozitif yönde kaydıracak, ancak grup içindeki değişkenlik üzerinde herhangi bir etkisi olmayacaktır. Bununla birlikte, üç grubun ortalama puanları arasındaki değişkenlik artık artacaktır. Ortaya çıkan F oranı, değeri nadir bir olayın (Alfa seviyesi olarak adlandırılır) oluşturan eşiğini aşacak kadar yükseltirse, Anova F testinin üç grup arasındaki eşit ortalamaların boş hipotezini reddettiği söylenir. gruplardan en az birinin daha büyük bir ortalamaya sahip olduğu şeklindeki alternatif hipotezin lehine (bu örnekte, grup A'dır).

Nüfus normalliğinin ihlaliyle başa çıkmak

Sıralama, normallik varsayımlarını karşılamayan verileri dönüştürmek için kullanılan birçok prosedürden biridir . Conover ve Iman, dört ana derece dönüşüm türünün (RT) bir incelemesini sağladı. Bir yöntem, her orijinal veri değerini sırasına göre değiştirir (en küçük için 1'den en büyük için N'ye ). Bu derece tabanlı prosedür, normal olmayan hatalara karşı sağlam, aykırı değerlere karşı dirençli ve birçok dağıtım için yüksek verimli olarak önerilmiştir. Bilinen bir istatistikle sonuçlanabilir (örneğin, Wilcoxon sıra toplamı / Mann-Whitney U testiyle sonuçlanan iki bağımsız örnek yerleşim sıralamasında ) ve istenen sağlamlığı ve aranan artan istatistiksel gücü sağlar . Örneğin, Monte Carlo çalışmaları , iki bağımsız örnek t-testi düzenindeki sıra dönüşümünün tek yönlü bağımsız örnekler ANOVA'ya ve ayrıca iki bağımsız örnek çok değişkenli Hotelling'in T 2 düzenlerine başarıyla genişletilebileceğini göstermiştir. Ticari istatistiksel yazılım paketleri (örneğin, SAS) parametrik prosedürler kullanarak standart analizler yapmadan önce veri analistlerine veri setlerini bir sıralama prosedürü (örn., PROC RANK) ile çalıştırmaları için öneriler izledi.

Faktöriyel ANOVA ve diğer karmaşık düzenlerde sıralama başarısızlığı

Sıralardaki ANOVA, sıra dönüştürülmüş veriler üzerinde standart bir varyans analizinin hesaplandığı anlamına gelir . Orijinal puanların sıralarına göre faktöryel ANOVA yapılması da önerildi. Bununla birlikte, Monte Carlo çalışmaları ve sonraki asimptotik çalışmalar, sıra dönüşümünün 4x3 ve 2x2x2 faktöriyel tasarımda etkileşim etkilerini test etmek için uygun olmadığını buldu. Etkilerin sayısı (yani, ana, etkileşim) boş kalmaz hale geldikçe ve sıfır olmayan etkilerin büyüklüğü arttıkça, Tip I hatasında bir artış olur, bu da istatistiğin tamamen başarısız olmasına neden olur. % 100 yanlış pozitif karar verme olasılığı. Benzer şekilde, ön test ve son test puanları arasındaki korelasyon arttıkça iki bağımlı örneklem düzeninde sıra dönüşümünün giderek başarısız olduğu görülmüştür. Ayrıca, Kovaryans Analizi bağlamında, özellikle kovaryant ile bağımlı değişken arasındaki korelasyon arttıkça, Tip I hata oranı probleminin daha da kötüleştiği keşfedildi.

Sıraları dönüştürmek

Derece dönüşümünün bir varyantı, elde edilen değerlerin belirli bir dağılıma (genellikle belirli bir ortalama ve varyansa sahip normal bir dağılım) sahip olacağı şekilde sıralara başka bir dönüşümün uygulandığı 'nicelik normalleştirme'dir. Nicelikle normalleştirilmiş verilerin daha ileri analizleri daha sonra bu dağılımın anlamlılık değerlerini hesaplayacağını varsayabilir. Bununla birlikte, iki spesifik ikincil dönüşüm türü, rastgele normal puanlar ve beklenen normal puan dönüşümünün, Tip I hataları büyük ölçüde şişirdiği ve istatistiksel gücü ciddi şekilde azalttığı gösterilmiştir.

Eşcinselliği ihlal eden

Sıralardaki ANOVA, homojen varyansların altında yatan varsayım, kendi başına veya nüfus normalliği varsayımının ihlali ile birlikte ihlal edildiğinde asla tavsiye edilmemiştir. Genel olarak, sıra tabanlı istatistikler, aynı varsayımı paylaşan parametrik muadillerinden daha hızlı bir şekilde, homoskedastisiteden sapmalar için Tip I hatalarına göre güvenilir olmaz.

Daha fazla bilgi

Kepner ve Wackerly, literatürü "1980'lerin sonlarına doğru, yöntemin kullanışlılığına ilişkin hem olumlu hem de olumsuz yeni anlayışlar kazanıldıkça RT yöntemleriyle ilgili literatürün hacmi hızla genişlediğini belirterek özetlediler. Sawilowsky ve diğerleri (1989, s. 255), uygulayıcıları 'testlerin özelliklerinin iyi anlaşıldığı özel durumlar dışında' bu testlerin kullanımından kaçınmaları konusunda uyardı. Hettmansperger ve McKean'e göre, "Sawilowsky (1990), ANOVA'da etkileşimi test etmek için parametrik olmayan yaklaşımların mükemmel bir incelemesini sunar".

Notlar