İki yönlü varyans analizi - Two-way analysis of variance

Olarak istatistik , iki yönlü varyans analizi ( ANOVA ) bir uzantısı olan tek yönlü ANOVA , iki farklı etkisini inceleyen kategorik bağımsız değişken bir ilgili sürekli bağımlı değişken . İki yönlü ANOVA, yalnızca her bir bağımsız değişkenin ana etkisini değil, aralarında herhangi bir etkileşim olup olmadığını da değerlendirmeyi amaçlar .

Tarih

1925'te Ronald Fisher , ünlü kitabı Araştırma Çalışanları için İstatistiksel Yöntemler'de (7 ve 8. bölümler) iki yönlü ANOVA'dan bahseder . 1934'te Frank Yates , dengesiz durum için prosedürler yayınladı. O zamandan beri, geniş bir literatür üretildi. Konu 1993 yılında Yasunori Fujikoshi tarafından gözden geçirildi . 2005 yılında Andrew Gelman , çok seviyeli bir model olarak görülen farklı bir ANOVA yaklaşımı önerdi .

veri seti

Bağımlı bir değişkenin potansiyel varyasyon kaynakları olan iki faktörden etkilenebileceği bir veri seti hayal edelim . Birinci faktörün seviyeleri ( ) ve ikincisinin seviyeleri ( ) vardır . Her kombinasyon , toplam tedavi için bir tedavi tanımlar . Biz sayısını temsil çoğaltır tedavisi için tarafından ve izin bu tedavide suret dizinini olmak ( ) .

Bu verilerden hareketle, biz bir inşa edebilirsiniz acil masa , nerede ve ve çoğaltır toplam sayısı eşittir .

Deney tasarımı olan dengeli , her tedavi çoğaltır aynı sayıda varsa . Böyle bir durumda tasarımın aynı zamanda ortogonal olduğu söylenir ve her iki faktörün etkilerinin tam olarak ayırt edilmesini sağlar. Bu nedenle yazabiliriz ve .

modeli

Örneğin bir histogram aracılığıyla, tüm veri noktaları arasındaki varyasyonu gözlemledikten sonra , " bu tür varyasyonu tanımlamak için olasılık kullanılabilir". Bizim bu nedenle göstermek Let tarafından rastgele değişkenin gözlenen değer olan tedavi için inci ölçer . İki yönlü ANOVA modelleri değişen tüm bu değişkenler bağımsız bir şekilde, ve normal olarak , yaklaşık ortalama sabit bir varyansı, ( homoscedasticity ):

.

Spesifik olarak, yanıt değişkeninin ortalaması , açıklayıcı değişkenlerin doğrusal bir kombinasyonu olarak modellenir :

,

burada büyük ortalama olduğu, düzeyinin katkı temel etkisi olan birinci faktörü ( I contigency tabloda inci satır), seviye aditif ana etkisi , ikinci faktör ( j durum tablo-inci sütun) ve her iki faktörden gelen tedavinin toplamsal olmayan etkileşim etkisidir ( olasılık tablosundaki i satırındaki hücre ve j sütunu ).

İki yönlü ANOVA'yı tanımlamanın bir başka eşdeğer yolu, faktörler tarafından açıklanan varyasyonun yanı sıra, bazı istatistiksel gürültünün kaldığını belirtmektir . Bu açıklanamayan varyasyon miktarı, hata adı verilen veri noktası başına bir rastgele değişkenin eklenmesiyle işlenir . Bu rastgele değişkenler ortalamalardan sapmalar olarak görülür ve bağımsız ve normal dağılmış oldukları varsayılır:

.

varsayımlar

Gelman ve Hill'i takiben, ANOVA'nın ve daha genel olarak genel doğrusal modelin varsayımları azalan önem sırasına göredir:

  1. veri noktaları, araştırılan bilimsel soru ile ilgilidir;
  2. yanıt değişkeninin ortalaması, faktörler tarafından ek (etkileşim terimi değilse) ve doğrusal olarak etkilenir;
  3. hatalar bağımsızdır;
  4. hatalar aynı varyansa sahiptir;
  5. hatalar normal dağılır.

parametre tahmini

Parametrelerin tanımlanabilirliğini sağlamak için aşağıdaki "toplamdan sıfıra" kısıtlamalarını ekleyebiliriz:

Hipotez testi

Klasik yaklaşımda, sıfır hipotezlerinin (faktörlerin hiçbir etkisinin olmadığı) test edilmesi , kareler toplamını hesaplamayı gerektiren önemleri aracılığıyla gerçekleştirilir .

Etkileşim teriminin anlamlı olup olmadığını test etmek, potansiyel olarak çok sayıda serbestlik derecesi nedeniyle zor olabilir .

Ayrıca bakınız

Notlar

Referanslar