Tek yönlü varyans analizi - One-way analysis of variance

Olarak istatistik , tek yönlü varyans analizi (kısaltılmış tek yönlü ANOVA ) (kullanarak iki numunelerde anlamlı bir fark olup olmadığını karşılaştırmak için kullanılabilir bir tekniktir F dağılımı ). Bu teknik yalnızca sayısal yanıt verileri, genellikle tek değişkenli "Y" ve sayısal veya (genellikle) kategorik girdi verileri, "X", her zaman tek değişken, dolayısıyla "tek yönlü" için kullanılabilir.

ANOVA , tüm gruplardaki örneklerin aynı ortalama değerlere sahip popülasyonlardan alındığını belirten boş hipotezi test eder . Bunu yapmak için, popülasyon varyansına ilişkin iki tahmin yapılır. Bu tahminler çeşitli varsayımlara dayanmaktadır ( aşağıya bakınız ). ANOVA, ortalamalar arasında hesaplanan varyansın numuneler içindeki varyansa oranı olan bir F istatistiği üretir. Grup ortalamaları aynı ortalama değerlere sahip popülasyonlardan alınırsa, merkezi limit teoremine göre grup ortalamaları arasındaki varyansın örneklerin varyansından daha düşük olması gerekir . Bu nedenle daha yüksek bir oran, örneklerin farklı ortalama değerlere sahip popülasyonlardan alındığı anlamına gelir.

Ancak tipik olarak tek yönlü ANOVA en az üç grup arasındaki farklılıkları test etmek için kullanılır, çünkü iki grup durumu bir t-testi ile kapsanabilir (Gosset, 1908). Karşılaştırmak için yalnızca iki yol olduğunda, t-testi ve F-testi eşdeğerdir; ANOVA ve arasındaki ilişki t ile verilmektedir F  =  t 2 . Tek yönlü ANOVA'nın bir uzantısı, iki farklı kategorik bağımsız değişkenin bir bağımlı değişken üzerindeki etkisini inceleyen iki yönlü varyans analizidir .

varsayımlar

Tek yönlü bir ANOVA'nın sonuçları, aşağıdaki varsayımlar karşılandığı sürece güvenilir kabul edilebilir:

Veriler sıralıysa , bu teste Kruskal-Wallis tek yönlü varyans analizi gibi parametrik olmayan bir alternatif kullanılmalıdır . Varyansların eşit olduğu bilinmiyorsa, 2 örnekli Welch t testinin bir genellemesi kullanılabilir.

Nüfus normalliğinden sapmalar

ANOVA, normallik varsayımının ihlali açısından nispeten sağlam bir prosedürdür.

Tek yönlü ANOVA, faktöriyel ve çok değişkenli düzenlerin yanı sıra kovaryans analizine genelleştirilebilir.

Popüler literatürde , özellikle küçük alfa seviyeleri ve dengesiz düzenler için, her popülasyonun normal dağılımı izlediği varsayımının ciddi ihlalleri olduğunda , bu F testlerinin hiçbirinin sağlam olmadığı sıklıkla belirtilir . Ayrıca, homoskedastisitenin altında yatan varsayımın ihlal edilmesi durumunda, Tip I hata özelliklerinin çok daha şiddetli bir şekilde dejenere olacağı da iddia edilmektedir .

Ancak bu, 1950'lerde ve öncesinde yapılan çalışmalara dayanan bir yanlış anlamadır. Konunun Monte Carlo simülasyonu ile ilk kapsamlı araştırması Donaldson (1966) olmuştur. Olağan sapmalar altında (pozitif çarpıklık, eşit olmayan varyanslar) " F testinin muhafazakar" olduğunu ve bu nedenle bir değişkenin anlamlı olduğunu bulmanın olması gerekenden daha az olası olduğunu gösterdi. Ancak, ya örneklem boyutu ya da hücre sayısı arttıkça, "güç eğrileri normal dağılıma dayalı olana yakınsıyor gibi görünmektedir". Tiku (1971), " F'nin normal olmayan teori gücünün, artan numune boyutu ile keskin bir şekilde azalan bir düzeltme terimi ile normal teori gücünden farklı olduğu bulunmuştur" bulmuştur. Normal olmama sorunu, özellikle büyük örneklemlerde, popüler makalelerin önerdiğinden çok daha az ciddidir.

Mevcut görüş şudur: "Monte-Carlo çalışmaları, popülasyondaki analiz edilen değişkenlerin normal dağılım varsayımının ihlaline karşı ne kadar hassas olduklarını belirlemek için normal dağılıma dayalı testlerle yaygın olarak kullanılmıştır. Bu çalışmalardan elde edilen genel sonuç şudur: bu tür ihlallerin sonuçları önceden düşünülenden daha az şiddetlidir.Bu sonuçlar, normallik varsayımıyla ilgili endişe duymaktan kimseyi tamamen caydırmasa da, tüm araştırma alanlarında dağılıma bağlı istatistiksel testlerin genel popülaritesini artırmıştır."

Faktöriyel düzende parametrik olmayan alternatifler için bkz. Sawilowsky. Daha fazla tartışma için rütbeler hakkında ANOVA'ya bakın .

Sabit etkiler durumu, tamamen rastgele deney, dengesiz veriler

model

Normal lineer model, farklı ortalamalara sahip aynı çan şeklindeki (normal) eğriler olan olasılık dağılımlarına sahip tedavi gruplarını tanımlar. Bu nedenle, modellerin uydurulması yalnızca her bir tedavi grubunun ortalamasını ve bir varyans hesaplamasını gerektirir (tedavi grupları içindeki ortalama bir varyans kullanılır). Ortalamaların ve varyansın hesaplanması, hipotez testinin bir parçası olarak yapılır.

Tamamen rastgele bir deney için yaygın olarak kullanılan normal doğrusal modeller şunlardır:

(araç modeli)

veya

(etki modeli)

nerede

deneysel birimler üzerinde bir dizindir
tedavi grupları üzerinde bir indekstir
j. tedavi grubundaki deney birimlerinin sayısıdır
toplam deneysel birim sayısıdır
gözlemler
j. tedavi grubu için gözlemlerin ortalamasıdır
gözlemlerin büyük ortalamasıdır
jth tedavi etkisi, büyük ortalamadan bir sapma
, normal olarak dağıtılan sıfır ortalamalı rastgele hatalardır.

Deney birimleri üzerindeki indeks birkaç şekilde yorumlanabilir. Bazı deneylerde, aynı deney birimi bir dizi işleme tabi tutulur; belirli bir birime işaret edebilir. Diğerlerinde, her tedavi grubunun ayrı bir deneysel ünite seti vardır; basitçe -th listesine bir dizin olabilir .

Veriler ve verilerin istatistiksel özetleri

Deneysel gözlemleri organize etmenin bir yolu , sütunlar halinde gruplardır:

ANOVA veri organizasyonu, Dengesiz, Tek faktör
Grup Gözlemleri Listeleri
1
2
3
Grup Özeti İstatistikleri Büyük Özet İstatistikler
# Gözlemlenen # Gözlemlenen
toplam toplam
Toplam Metrekare Toplam Metrekare
Anlamına gelmek Anlamına gelmek
Varyans Varyans

Modeli özetlerle karşılaştırma: ve . Büyük ortalama ve büyük varyans, grup ortalamalarından ve varyanslarından değil, genel toplamlardan hesaplanır.

hipotez testi

Özet istatistikler göz önüne alındığında, hipotez testinin hesaplamaları tablo şeklinde gösterilir. Açıklayıcı değerleri için iki SS sütunu gösterilirken, sonuçları görüntülemek için yalnızca bir sütun gereklidir.

Sabit model, tek faktörlü, tamamen randomize deney için ANOVA tablosu
Varyasyon kaynağı kareler toplamı kareler toplamı Özgürlük derecesi ortalama kare F
açıklayıcı SS hesaplamalı SS DF HANIM
Tedaviler
Hata
Toplam

modele karşılık gelen varyansın tahminidir .

Analiz özeti

Çekirdek ANOVA analizi bir dizi hesaplamadan oluşur. Veriler tablo şeklinde toplanır. Sonra

  • Her tedavi grubu, deney birimlerinin sayısı, iki toplam, bir ortalama ve bir varyans ile özetlenir. Tedavi grubu özetleri, birim sayısı ve toplamlar için toplamlar sağlamak üzere birleştirilir. Büyük ortalama ve büyük varyans, genel toplamlardan hesaplanır. Modelde tedavi ve büyük araçlar kullanılmıştır.
  • Üç DF ve SS, özetlerden hesaplanır. Daha sonra MS'ler hesaplanır ve bir oran F'yi belirler.
  • Bir bilgisayar tipik olarak, tedavilerin önemli ölçüde farklı sonuçlar üretip üretmediğini belirleyen F'den bir p-değeri belirler. Sonuç anlamlıysa, model geçici olarak geçerliliğe sahiptir.

Deney dengelenirse, tüm terimler eşittir, böylece SS denklemleri basitleşir.

Deney birimlerinin (veya çevresel etkilerin) homojen olmadığı daha karmaşık bir deneyde, analizde satır istatistikleri de kullanılır. Model, bağlı terimleri içerir . Ekstra terimlerin belirlenmesi, mevcut serbestlik derecesi sayısını azaltır.

Misal

Bir faktörün üç farklı seviyesinin bir tepki üzerindeki etkisini incelemek için bir deney düşünün (örneğin, bitki büyümesi üzerinde üç seviyeli gübre). Biz her seviye için 6 gözlemler olsaydı, böyle bir tablo, deney sonucunu yazabilirsiniz bir 1 , bir 2 ve bir 3 faktör üç düzeyi çalışılan vardır.

bir 1 bir 2 bir 3
6 8 13
8 12 9
4 9 11
5 11 8
3 6 7
4 8 12

Bu deney için genel F testi için H 0 ile gösterilen boş hipotez, faktörün üç seviyesinin de ortalama olarak aynı yanıtı ürettiği olacaktır. F oranını hesaplamak için :

Adım 1: Her grup içindeki ortalamayı hesaplayın:

Adım 2: Genel ortalamayı hesaplayın:

burada a grup sayısıdır.

Adım 3: "Gruplar arası" farkların karesi toplamını hesaplayın:

burada n , grup başına veri değerlerinin sayısıdır.

Gruplar arası serbestlik derecesi, grup sayısından bir eksiktir.

yani gruplar arası ortalama kare değeri

Adım 4: "Grup içi" kareler toplamını hesaplayın. Her gruptaki verileri ortalayarak başlayın

bir 1 bir 2 bir 3
6−5=1 8−9=−1 13−10=3
8−5=3 12−9=3 9−10=−1
4−5=−1 9−9=0 11−10=1
5−5=0 11−9=2 8−10=−2
3−5=−2 6−9=−3 7−10=−3
4−5=−1 8−9=−1 12−10=2

Grup içi kareler toplamı, bu tablodaki 18 değerin tümünün karelerinin toplamıdır.

Grup içi serbestlik dereceleri,

F-dens-2-15df.svg

Böylece grup içi ortalama kare değeri

Adım 5: F olduğu -ratio

Kritik değer, testi reddetmek için test istatistiğinin aşması gereken sayıdır. Bu durumda, α = 0.05'te F kritik (2,15) = 3.68 . Yana F = 9.3> 3.68, sonuçlar önemli % 5 önem seviyesinde. Üç gruptaki beklenen değerlerin farklı olduğuna dair güçlü kanıtlar olduğu sonucuna varılarak sıfır hipotezi reddedilir. P-değeri bu test için 0.002 olan.

F- testini gerçekleştirdikten sonra , grup ortalamalarının bazı "post-hoc" analizlerinin yapılması yaygındır. Bu durumda, ilk iki grup ortalamaları 4 birim, birinci ve üçüncü grup ortalamaları 5 birim, ikinci ve üçüncü grup ortalamaları ise sadece 1 birim farklılık göstermektedir. Standart hata bu farklılıkların her birinin olduğunu . Bu nedenle, ortalama fark standart hatadan daha fazla olduğundan, birinci grup diğer gruplardan güçlü bir şekilde farklıdır, bu nedenle birinci grubun popülasyon ortalamasının diğer grupların popülasyon ortalamalarından farklı olduğundan oldukça emin olabiliriz . Ancak, bir birimlik ortalama farkları standart hata ile karşılaştırılabilir olduğundan, ikinci ve üçüncü grupların birbirinden farklı popülasyon ortalamalarına sahip olduğuna dair bir kanıt yoktur.

Not F ( xy ) , payda x serbestlik derecesi ve paydada y serbestlik derecesi olan bir F dağılımı kümülatif dağılım fonksiyonunu gösterir .

Ayrıca bakınız

Notlar

daha fazla okuma