İki yönlü varyans analizi - Two-way analysis of variance
Olarak istatistik , iki yönlü varyans analizi ( ANOVA ) bir uzantısı olan tek yönlü ANOVA , iki farklı etkisini inceleyen kategorik bağımsız değişken bir ilgili sürekli bağımlı değişken . İki yönlü ANOVA, yalnızca her bir bağımsız değişkenin ana etkisini değil, aralarında herhangi bir etkileşim olup olmadığını da değerlendirmeyi amaçlar .
Tarih
1925'te Ronald Fisher , ünlü kitabı Araştırma Çalışanları için İstatistiksel Yöntemler'de (7 ve 8. bölümler) iki yönlü ANOVA'dan bahseder . 1934'te Frank Yates , dengesiz durum için prosedürler yayınladı. O zamandan beri, geniş bir literatür üretildi. Konu 1993 yılında Yasunori Fujikoshi tarafından gözden geçirildi . 2005 yılında Andrew Gelman , çok seviyeli bir model olarak görülen farklı bir ANOVA yaklaşımı önerdi .
veri seti
Bağımlı bir değişkenin potansiyel varyasyon kaynakları olan iki faktörden etkilenebileceği bir veri seti hayal edelim . Birinci faktörün seviyeleri ( ) ve ikincisinin seviyeleri ( ) vardır . Her kombinasyon , toplam tedavi için bir tedavi tanımlar . Biz sayısını temsil çoğaltır tedavisi için tarafından ve izin bu tedavide suret dizinini olmak ( ) .
Bu verilerden hareketle, biz bir inşa edebilirsiniz acil masa , nerede ve ve çoğaltır toplam sayısı eşittir .
Deney tasarımı olan dengeli , her tedavi çoğaltır aynı sayıda varsa . Böyle bir durumda tasarımın aynı zamanda ortogonal olduğu söylenir ve her iki faktörün etkilerinin tam olarak ayırt edilmesini sağlar. Bu nedenle yazabiliriz ve .
modeli
Örneğin bir histogram aracılığıyla, tüm veri noktaları arasındaki varyasyonu gözlemledikten sonra , " bu tür varyasyonu tanımlamak için olasılık kullanılabilir". Bizim bu nedenle göstermek Let tarafından rastgele değişkenin gözlenen değer olan tedavi için inci ölçer . İki yönlü ANOVA modelleri değişen tüm bu değişkenler bağımsız bir şekilde, ve normal olarak , yaklaşık ortalama sabit bir varyansı, ( homoscedasticity ):
.
Spesifik olarak, yanıt değişkeninin ortalaması , açıklayıcı değişkenlerin doğrusal bir kombinasyonu olarak modellenir :
,
burada büyük ortalama olduğu, düzeyinin katkı temel etkisi olan birinci faktörü ( I contigency tabloda inci satır), seviye aditif ana etkisi , ikinci faktör ( j durum tablo-inci sütun) ve her iki faktörden gelen tedavinin toplamsal olmayan etkileşim etkisidir ( olasılık tablosundaki i satırındaki hücre ve j sütunu ).
İki yönlü ANOVA'yı tanımlamanın bir başka eşdeğer yolu, faktörler tarafından açıklanan varyasyonun yanı sıra, bazı istatistiksel gürültünün kaldığını belirtmektir . Bu açıklanamayan varyasyon miktarı, hata adı verilen veri noktası başına bir rastgele değişkenin eklenmesiyle işlenir . Bu rastgele değişkenler ortalamalardan sapmalar olarak görülür ve bağımsız ve normal dağılmış oldukları varsayılır:
.
varsayımlar
Gelman ve Hill'i takiben, ANOVA'nın ve daha genel olarak genel doğrusal modelin varsayımları azalan önem sırasına göredir:
- veri noktaları, araştırılan bilimsel soru ile ilgilidir;
- yanıt değişkeninin ortalaması, faktörler tarafından ek (etkileşim terimi değilse) ve doğrusal olarak etkilenir;
- hatalar bağımsızdır;
- hatalar aynı varyansa sahiptir;
- hatalar normal dağılır.
parametre tahmini
Parametrelerin tanımlanabilirliğini sağlamak için aşağıdaki "toplamdan sıfıra" kısıtlamalarını ekleyebiliriz:
Hipotez testi
Klasik yaklaşımda, sıfır hipotezlerinin (faktörlerin hiçbir etkisinin olmadığı) test edilmesi , kareler toplamını hesaplamayı gerektiren önemleri aracılığıyla gerçekleştirilir .
Etkileşim teriminin anlamlı olup olmadığını test etmek, potansiyel olarak çok sayıda serbestlik derecesi nedeniyle zor olabilir .
Ayrıca bakınız
- varyans analizi
- F testi ( Tek yönlü bir ANOVA örneği içerir )
- karışık model
- Çok değişkenli varyans analizi (MANOVA)
- Tek yönlü ANOVA
- Tekrarlanan ölçümler ANOVA
- Türkiye'nin toplamsallık testi
Notlar
Referanslar
- George Casella (18 Nisan 2008). İstatistiksel tasarım . İstatistikte Springer Metinleri. Springer . ISBN'si 978-0-387-75965-4.