Varyans Analizi - Analysis of variance


Vikipedi, özgür ansiklopedi

Varyans analizi ( ANOVA ) oluşan bir koleksiyon istatistiksel model grubu anlamına gelir arasındaki farkları analiz etmek için kullanılan ve (örneğin, ve gruplar arasında "değişim" gibi) ilişkili tahmin prosedürleri örnek . ANOVA tarafından geliştirilen istatistikçi ve evrimsel biyolog Ronald Fisher . ANOVA ortamda gözlenen varyans belirli bir değişken varyasyonun farklı kaynaklardan atfedilebilir bileşenlere bölünür. En basit haliyle, bir ANOVA içerir istatistiksel test popülasyonu olup olmadığı anlamına gelir çeşitli gruplar eşit olduğunda ve bu nedenle genelleştirir t -testi için ikiden fazla grup. ANOVA üç veya daha fazla grup için araçlar (test) karşılaştırmak için faydalıdır istatistiksel anlamlılık . Bu konsept olarak benzerdir ve bir çok, iki numune t-testi , ancak daha az ile sonuçlanan, daha konservatif I tip hatalar , ve bu yüzden, pratik sorunları geniş bir aralığına uygundur.

Tarihçe

Varyans analizleri 20. yüzyılda semere ulaşırken, öncülleri Stigler göre geçmişe yüzyıllar uzanır. Bu hipotez test, karelerin toplamlarının, deneysel teknikler bölünmesi ve katkı modeli bulunmaktadır. Laplace 1770s hipotez testinin yapılması edildi. Laplace ve ile en küçük kareler yöntemlerinin geliştirilmesi Gauss circa 1800 (daha sonra astronomi ve jeodezideki kullanılan mevcut uygulamalara göre) gözlemleri birleştirilmesi için geliştirilmiş bir yöntem sağlanır. Ayrıca kare toplam katkıları çok çalışma başlatmıştır. Laplace bir artık (yerine toplam) karelerinin toplamının bir varyans tahmin biliyorlardı. 1827 olarak, Laplace kullanıyordum en küçük kareler atmosferik gelgit ölçümlerine ilişkin ANOVA sorunları çözmek için yöntemler. 1800 öncesinde astronomlar reaksiyon zamanlarından ( "Ortaya çıkan gözlemsel hataları izole etmişti kişisel denklemi ") ve hataları azaltan yöntemler geliştirdi. Kişisel denklemin çalışmada kullanılan deneysel yöntemler daha sonra güçlü (tam faktöriyel) geliştirdi psikoloji çıkan alana göre randomizasyon ve yakında eklendi yol açıcı deneysel yöntemler kabul edildi. Aditif etkileri modelin bir anlamlı olmayan matematiksel açıklama 1885 kullanılabilir.

Ronald Fisher terimi tanıtıldı varyansı ve 1918 makalesinde onun biçimsel analizini önerdi Mendel Kalıtım sandığının üzerinde yakınları arasındaki ilişki . Varyans analizinin İlk uygulama Varyans 1921 Analiz yayımlandı yaygın Fisher 1925 defterine eklenme sonra bilinmeye başlandı Araştırma İşçiler için İstatistiksel Yöntemler .

Rasgeleleştirme modelleri çeşitli araştırmacılar tarafından geliştirilmiştir. İlk tarafından Lehçe yayımlandı Jerzy Neyman 1923 yılında.

erken popülerlik sağladı ANOVA özelliklerinden biri hesaplamalı şıklık oldu. katkı modelin yapısı, basit cebir ziyade matrisi hesaplamaları ile katkı katsayıları için bir çözüm sağlar. mekanik hesap makineleri döneminde bu basitlik kritikti. istatistiksel anlamlılık belirlenmesi, erken istatistik metinler tarafından tedarik edildi F fonksiyonunun tablolara erişimi gerekli.

Motivasyonu örnek

Uyum yok.
Adil uyum
Çok iyi bir uyum

Varyans analizleri gözlemleri açıklamak için bir keşif aracı olarak kullanılabilir. Bir köpek gösterisi bir örnek sağlar. Bir köpek gösterisi cins rastgele örnekleme değildir: genellikle yetişkin, yetiştirilen saf ve örnek teşkil köpekler ile sınırlıdır. Bir gösteri köpek ağırlıkları Histogram makul bir resimlerde gösterilen sarı-turuncu dağılımı gibi, oldukça karmaşık olabilir. Her köpeğin özelliklerinin belli bir kümesi temelinde bir köpeğin ağırlığını tahmin etmek istedik varsayalım. Bunu yapmanın bir yolu olduğunu açıklamak bu özelliklere göre gruplar halinde köpek nüfusu bölerek ağırlıkları dağılımını. Başarılı bir gruplaşma yer almaktadır (a) her bir grup (b) her bir grubun ortalama farklıdır (iki grup, aynı ortalama varsa, o zaman düşük bir köpek ağırlıkları varyans (grup nispeten homojen olduğu için anlamına gelir) ve sahip olduğu şekilde köpekler bölecek bu ), aslında, gruplar olduğu sonucuna varılması anlamlı bir biçimde ayırmak için makul değildir.

Sağa Şekillerde grupları olarak tanımlanan X 1 , X 2 birinci çizimde, vb Köpekler iki ikili gruplar ürününün (karşılıklı) göre ayrılır: eski vs genç ve uzun karşı kısa tüylü saçlı (örneğin grup 1 genç, kısa tüylü köpekler, grup 2 genç, uzun saçlı köpek, vs.). (Mavi renkle gösterilir) gruplar dahilinde köpek ağırlığı dağılımları yana nispeten büyük bir varyansa sahiptir ve araçlar bu özelliklere göre köpekler gruplama, gruplar arasında oldukça benzer olduğundan, köpek ağırlıklarında varyasyonu açıklamak için etkili bir yol üretmez : bir köpek içinde olan grup bilerek bize basitçe köpeği bilerek bir köpek gösterisinde olduğu çok daha iyi ağırlığını tahmin etmek izin vermez. Bu durumda, bu gruplama, toplam dağılıma (sarı-turuncu) varyasyonu açıklayamamaktadır.

Gibi köpekler gruplayarak ağırlık dağılımını açıklamak için bir girişimde çalışma cins vs hayvan ve daha atletik vs az atletik muhtemelen biraz daha başarılı (adil uyum) olacaktır. Irkları evcil daha küçük ve dolayısıyla daha hafif olma eğilimindedir olarak muhafaza ederken en ağır gösteri köpekleri büyük, güçlü çalışma ırkları olması muhtemeldir. İkinci gösterim ile gösterildiği gibi, dağılımlar, ilk durumda daha küçüktürler sapmalara sahip, araçlar ve daha ayırt edilebilir. Bununla birlikte, dağılımların anlamlı bir örtüşme, örneğin, biz ayrım anlamına gelir X 1 ve X 2 güvenilir. Benzeyen dağılımlarını doğurabileceğini bir yazı tura göre köpekler gruplandırılması.

cins tarafından ağırlığını açıklamaya denemesi çok iyi bir uyum elde etmek olasıdır. Tüm Çivavalar hafif ve tüm St. Bernard ağır. Setters ve İşaretçiler arasındaki ağırlıklar farkı ayrı ırkları haklı çıkarmaz. Varyans analizi, bu sezgisel yargılara haklı resmi araçlar sağlar. Yöntemin yaygın bir kullanımı deneysel verilerin analizi veya modeller geliştirilmesidir. yöntem korelasyon üzerinde bazı avantajları vardır: tüm verilerin sayısal olmalıdır ve yöntemin bir sonucu açıklayıcı bir ilişkide güven içinde bir yargıdır değil.

Arka Plan ve terminoloji

ANOVA şeklidir istatistiksel hipotez testi ağır deneysel verilerin analizi için kullanılır. (Hesaplanan bir test sonucu Boş hipotez tesadüfen meydana geldiği olası kabul edilmektedir ve eğer numune), istatistiksel olarak anlamlı olarak adlandırılır hipotezini gerçeği varsayarak . Bir olasılık (zaman istatistiksel olarak anlamlı bir sonuç, p-değeri ), önceden belirlenmiş bir eşik (anlamlılık seviyesi) daha az olduğu, bir ret haklı boş hipotezine ama hipotezini önsel olasılığı yüksek değildir, sadece.

ANOVA tipik bir uygulamasında, boş hipotez tüm gruplar aynı popülasyondan rasgele örnekler olmasıdır. Örneğin, hastaların benzer numuneler üzerinde farklı tedavilerin etkisini incelemek zaman sıfır hipotezi tüm tedaviler aynı etkiye (belki hiçbiri) sahip olurdu. sıfır hipotezini reddetmek tedavi grupları arasında gözlenen etkilerin farklılıklar nedeniyle rasgele şansa olması olası olduğu anlamına kabul edilir.

Yapım olarak, hipotez testi oranını sınırlayan Tip I hatalar anlamlılık düzeyine (yanlış pozitif). Deneyciler da sınırlamak isteyen Type II hataları (yanlış negatifler). Tip II hata oranı büyük ölçüde örneklem büyüklüğü (oran daha küçük örnekler için büyüktür), anlamlılık düzeyi (ispat standardı yüksek olduğunda, bir keşif bakan şansı yüksek de) ve bağlı etki boyutu (küçük etki büyüklüğüne ) II hatayı yazın daha yatkın olduğunu.

ANOVA terminoloji istatistiksel gelen büyük ölçüde deney tasarımı . Deneyci bir etkisini belirlemek için bir girişimde faktörleri ve önlemler yanıt olarak ayarlar. Faktörler randomizasyondan kombinasyonuyla deneysel birimlere tahsis ve edilir engelleme sonuçların geçerliliğini sağlamak için. Blindgin tartı tarafsız tutar. Yanıtlar kısmen etkisinin sonucu olan ve kısmen rasgele hata olan bir değişkenlik göstermektedir.

ANOVA birkaç fikirlerin sentezidir ve farklı amaçlar için kullanılmaktadır. Bunun bir sonucu olarak, özlü bir ya da tam olarak tanımlamak güçtür.

Dengeli veriler için "Klasik" ANOVA seferde üç şey yapar:

  1. Olarak keşif veri analizi , bir ANOVA bir katkı veri ayrışma kullanır ve kareler onun toplamları ayrışma (ya da, bir doğrusal model açısından arasında eşit, her set) her bir bileşeninin değişimi belirtmek.
  2. Bir ile birlikte ortalama kareler Karşılaştırmalar, F -testi  ... modellerin iç içe geçmiş bir dizinin test izin verir.
  3. Yakından katsayı tahminleri ve standart hataları ile doğrusal bir model uyum ANOVA etmektir ilgili.

Kısacası, ANOVA gözlenen veriler için bir açıklama geliştirmek ve onaylamak için çeşitli şekillerde kullanılan istatistiksel bir araçtır.

Bunlara ek olarak:

  1. Bu hesaplama zarif ve varsayımların ihlallerine karşı nispeten sağlamdır.
  2. ANOVA kuvvetli (çoklu numune karşılaştırma) istatistiksel analiz sağlar.
  3. Bu deneysel tasarımlar çeşitli analizine adapte edilmiştir.

Sonuç olarak: ANOVA "Uzun olma durumunu gördü en çok kullanılan psikolojik araştırmalarda (bazı istismar derdim) istatistiksel tekniktir." ANOVA "muhtemelen en kullanışlı istatistiksel çıkarsama alanında tekniği."

ANOVA ile, özellikle karmaşık deneyler için, öğretmek zordur bölünmüş arsa tasarımları namlı olmak. Bazı durumlarda yöntemin uygun bir uygulama iyi bir klasik yetkili testin istişare ardından sorun örüntü tanıma göre belirlenir.

Tasarım-of-the deneyler terimler

( "NIST Mühendislik İstatistiği El Kitabı" ndan Yoğun:. Bölüm 5.7 DOE Terminolojisi Sözlüğü.)

Dengeli tasarım
Tüm hücreler (yani tedavi kombinasyonları) gözlemler aynı sayıda bir deney tasarımı.
bloke etme
deneysel çalışmada tedavi kombinasyonları yürütmek için bir zamanlama vb bağlı olarak hammadde, operatör, makine, bilinen bir değişikliğe deney sonuçları herhangi bir etki olup, blokaj değişken seviyelerinde konsantre hale bu şekilde. engelleme sebebi sistematik etkiye izole etmek ve ana etkileri engelleyen onu önlemektir. Engelleme rasgele kısıtlayarak elde edilir.
dizayn
Belirli bir modelin uyum ve etkilerinin tahmin sağlar Deneysel çalışmalar bir dizi.
DOE
Deney tasarımı. Geçerli savunulabilir ve desteklenebilir sonuçları destekleyecek verilerin toplanmasını içeren problem çözme için bir yaklaşım.
Efekt
Bir faktörün ayarlarını değiştirerek nasıl yanıtı değiştirir. Tek bir faktörün etkisi de bir ana etkisi denir.
Hata
gözlemler koleksiyonunda Açıklanamayan varyasyonu. DOE en tipik rastgele hata ve uyum hatasının olmaması hem anlaşılmasını gerektirir.
Deneysel ünite
Belirli bir tedavi kombinasyonunun uygulandığı varlık.
Faktörler
Bir araştırmacı yönlendiren bir işlem giriş çıkışı bir değişime neden olmak üzere.
Eksikliği-of-fit hata
Analiz işlemi modelinden bir veya daha fazla önemli terimleri ya da faktörler dikkate almaz oluşur hata. uyum ve rastgele (saf) hatanın eksikliği: bir DOE olarak dahil çoğaltma bileşenlerine deneysel hata ayrılmasını sağlar.
model
Bir veya daha fazla faktörlerindeki değişiklikler belirli bir tepki olarak değişiklik ile ilgilidir matematiksel ilişki.
Rastgele hata
işlemde, doğal varyasyona bağlı olarak meydana hata. Rastgele hata genellikle normal olarak sıfır ortalama ve sabit bir varyans ile dağıtılmak üzere varsayılmıştır. Rastgele hata da deneysel hata denir.
Rasgeleleştirme
Tedavi malzemesi tahsis edilmesi için ve bir çalışma koşulları, önceki çalışma koşullarına bağlıdır ne de daha sonraki ishal koşulları önceden ne şekilde bir DOE tedavi kombinasyonları yürütmek için bir program.
kopya
birden fazla kez aynı tedavi kombinasyonu daha Sahne. çoğaltma dahil uygun herhangi bir hata olmaması bağımsız rastgele sapmasının bir tahminini sağlar.
Tepkiler
bir işlemin çıkış (lar). Bazen denilen bağımlı değişken (ler).
tedavi
Bir tedavi etkisi için diğer tedavileri ile karşılaştırıldığında gereken etken seviyeleri belirli bir kombinasyonudur.

ANOVA tablosu

Tek yönlü ANOVA
Kaynaklar df SS MSS F -ratio
tedavi arasında k-1 SST MST (SST / (k-1)) MST / MSE
Hata N-k GGD MSE (SSE / (N-k))
Genel Toplam N-1
  • SSE - Sum-of-Kare Hata nedeniyle
  • SST - Sum-of-Meydanı'nın Tedavisi
  • MST - Mean Sum-of-kare Tedavisi
  • MSE - Mean Sum-of-kare Hata
  • df - Serbestlik Derecesi
İki yönlü ANOVA
Kaynak df SS MSS F -ratio
tedavi arasında k-1 SSR MST (SSR / (k-1)) MST / MSE ( F -ratio satır)
blokta arasında h-1 SSC MSV (SSC / (h-1)) MSV / MSE ( F -ratio kolon)
Hata (H-1) (k-1) GGD MSE (SSE / ((h-1) (k-1)))
Genel Toplam N-1
  • SSR - Sum-of-Meydanı'nda Satırlar tedavinin (SST)
  • SSC - Toplam-of-kare kolon arasında
  • MSV - Varyans Ortalama Toplamı

modellerin Sınıflar

Orada varyans analizinde kullanılan modellerin üç sınıfları vardır ve bunlar burada özetlenmiştir.

Sabit etkiler modelleri

Varyans analizi sabit etkiler modeli (sınıf I) deneyi olup olmadığını görmek için deney deneklere, bir ya da daha fazla tedavi uygulanır ettiği durumlar için geçerlidir yanıt değişkeni değerleri değişir. Bu deneyi işlem, bir bütün olarak nüfus üretecek yanıt değişken değerlerinin aralıkları tahmin sağlar.

Rastgele etkiler modelleri

Tedaviler sabit değildir zaman rastgele etki modeli (Sınıf II) kullanılır. Çeşitli faktörü seviyeleri daha büyük bir popülasyondan örneklenir oluşur. Düzeyleri kendileri için rastgele değişkenler , bazı varsayım ve tedaviler (basit farklar çok değişkenli bir genelleme) zıt bir yöntem sabit etkiler modelinden farklıdır.

Karışık etkiler modelleri

Bir karma etki modeli (sınıf III) iki tip için uygun şekilde farklı yorumlar ve analizi ile sabit ve rastgele etki tip deneysel faktörler içerir.

Örnek: Her metin bir tedavi olarak kabul ile Öğretim deneyleri, iyi bir tanıtım kitabı bulmak için bir kolej veya üniversite departmanı tarafından da yapılabilmektedir. Sabit etkiler modeli aday metinlerinin listesini karşılaştırmak istiyorsunuz. rastgele etki modeli belirlemek edip etmeyeceği önemli farklar rastgele seçilmiş metinler listesi arasında bulunmaktadır. karma etki modeli rasgele alternatifler seçilmiş (sabit) yerleşik metinleri karşılaştırmak.

Tanımlanması değişken ve sabit etki rakip tanımlamalar tartışmalı bir dilsel bataklığa doğru başında oldukça zor olduğu kanıtlanmıştır.

Varsayımlar

Varyans analizi kullanan en yaygın olan çeşitli yaklaşımlar da ele alınmıştır doğrusal model tedaviler ve bloklara yanıtı ile ilgilidir. Model parametreleri doğrusal ama faktör düzeyleri arasında doğrusal olmayan olabileceğini unutmayın. Veri etkenleriyle dengeli ama çok daha derin bir anlayış dengesiz veriler için gerektiğinde Yorumlama kolaydır.

bir normal dağılım Kitabı analizi

Varyans analizi açısından sunulabilir doğrusal model ile ilgili aşağıdaki varsayımlar yapar, olasılık dağılımı tepkilerinin:

Ders kitabı modelinin ayrı varsayımlar anlamına hatalar , bağımsız bir şekilde, aynı, ve normal olarak hataları (yani, yani, sabit etkiler modelleri için dağıtılır ) bağımsızdır ve

Randomizasyon esaslı analiz

Bir de randomize kontrollü deneyde , tedaviler rastgele deney protokolü takip deneysel birimlere atanır. Bu randomizasyon objektif ve deney yapılmadan önce ilan olduğunu. Objektif rastgele atama fikirleri aşağıdaki null hipotezi önemini test etmek için kullanılır CS Peirce ve Ronald Fisher . Bu tasarım tabanlı analiz tartışılmış ve tarafından geliştirilen Francis J. Anscombe de Rothamsted Deney İstasyonu tarafından Oscar Kempthorne at Iowa State University . Kempthorne ve öğrencileri bir varsayım yapmak birim tedavi aditif Kempthorne ve kitaplarında ele alınmıştır, David R. Cox .

Birim tedavi toplamsallık

En basit formunda, birim işlem aditif varsayımı gözlenen etkisi bildiren deneysel biriminden tedavi birimin karşılık toplamı olarak yazılabilir ve tedavi etkisi , yani

Ünite arıtma katılabılirlik varsayım her tedavi için, ima , inci tedavi tam olarak aynı etkiye sahiptir , her deney biriminde gösterebilir.

Ünite arıtma katılabılirlik varsayım genellikle doğrudan edilemez tahrif Cox ve Kempthorne göre. Ancak, birçok sonuçları tedavi birimi katılabılirlik tahrif edilebilir. Randomize deneme için, birim tedavi katılabılirlik varsayım ima varyans tüm tedaviler için sabit olur. Bunun sonucunda, , tersine , birim işlem additif için gerekli bir koşul varyans sabit olmasıdır.

Ünite arıtma aditif ve rastgele hale kullanımı sonlu-nüfus standarttır tasarım tabanlı çıkarsama benzer anket örnekleme .

Türetilmiş lineer model

Kempthorne randomizasyon-dağılımı ve varsayımları kullanır ünitesi tedavisi aditif bir üretilmesi için elde edilen lineer model daha önce tartışılan ders kitabı modeli çok benzer. Bu türetilmiş lineer model test istatistik yakın yaklaşım teoremi ve simülasyon çalışmalara göre, uygun bir normal bir doğrusal model test istatistiklerle yaklaştırılır. Ancak, farklılıklar vardır. Örneğin, gözlemlerin arasında küçük ama (kesinlikle) negatif korelasyon içinde randomizasyon tabanlı analiz sonuçları. Randomizasyon dayalı analizde, orada hiçbir varsayım a Normal dağılım ve kesinlikle hiçbir varsayım arasında bağımsızlık . Aksine, gözlemler bağımlıdır !

randomizasyon dayalı analiz onun anlatım sıkıcı cebir ve geniş zaman gerektirir dezavantajına sahiptir. randomizasyon tabanlı analiz karmaşıktır ve yakından normal doğrusal model kullanılarak yaklaşımla yaklaşılır yana, çoğu öğretmen, normal doğrusal model yaklaşımı vurgulamak. Birkaç istatistikçiler, dengelenmiş rasgele deneyler model-bazlı analiz nesne.

gözlemsel veriler için istatistiksel modeller

Randomize olmayan deneyler veya verilerine tatbik Ancak, gözlem çalışmalar , model-bazlı analiz randomizasyon emri yoksundur. Gözlemsel veriler için güven aralıkları türetilmesi kullanmalıdır sübjektif vurguladığı gibi modeller Ronald Fisher ve takipçileri. Uygulamada, gözlemsel çalışmalardan tedaviye etkilerinin tahminlerin genelde sık tutarsız. Uygulamada, "istatistiksel modeller" ve gözlemsel veriler halk tarafından çok dikkatlice değerlendirilmelidir hipotezler öne için yararlıdır.

varsayımlar Özeti

ANOVA analizi esaslı normal modeli artıkların sapmaların bağımsızlığı, normallik ve homojenlik varsayar. Randomizasyon dayalı analiz (birim muamele aditif bir sonucu olarak) artıkların varyans sadece homojenlik kabul ve deney randomizasyon işlemi kullanır. Her iki analizler gerektiren homoscedasticity normal modeli analizi için bir varsayım olarak ve randomizasyon tabanlı analiz için randomizasyon ve aditif bir sonucu olarak,.

Bununla birlikte, (dağılma etkileri olarak adlandırılmaktadır) varyanslar yerine elemanlarını değiştirme işlemlerinin çalışmalar başarıyla ANOVA kullanılarak yapılmıştır. Orada hiçbir tam genelliği içinde ANOVA için gerekli varsayımlar, ancak F ANOVA hipotez testi için kullanılan -test ilgi devam eden varsayımlar ve pratik sınırlamaları vardır.

ANOVA varsayımları tatmin olmayan problemler çoğu zaman varsayımlar karşılamak için dönüştürülebilir. İstatistikçiler genellikle birim tedavi toplanırlığını ulaşmak için dönüşümleri kullanmak böylece birim tedavi katılabılirlik mülkiyet, bir "ölçek değişikliği" altında değişmeyen değildir. Tepki değişken olasılık dağılımları bir parametrik ailesini takip bekleniyorsa, o zaman istatistikçi yanıtları değişkenliği stabilize ya dönüştürülmesi (deney ya gözlemsel çalışma için protokolde) belirtebilir. Ayrıca, bir istatistikçi logaritmik dönüşümler çarpımsal modelini takip inanılan tepkileri, uygulanabilir olduğu belirtebilir. Cauchy göre işlevsel denklem teoremi, logaritma ilavesinden gerçek çarpma dönüştüren tek sürekli bir dönüşümdür.

Özellikleri

ANOVA sonuçlar tek fark ilgi konusudur, bu hangi karşılaştırma deneyleri, analizinde kullanılır. Deney istatistiksel önemi iki varyans bir oranı ile belirlenir. Bu oran deneysel gözlemlere birkaç olası değişiklikler bağımsızdır: Tüm gözlemler sabit bir ekleme önemini değiştirmez. Bir sabit bütün gözlemler çarpımı önemini değiştirmez. Yani ANOVA istatistiksel anlamlılık sonucu sürekli önyargı ve ölçekleme hataları yanı sıra gözlemleri ifade kullanılan birimlerin bağımsızdır. (Öncü rakamları bırakarak eşdeğer olduğunda) veri girişini kolaylaştırmak için mekanik hesaplama çağda bütün gözlemlerinden sabit çıkarmak yaygındı. Bu veriler bir örnek kodlama .

Mantık

ANOVA hesaplamaları, ve sapmaların bir dizi işlem iki modeli bölünmesi ve istatistiksel öneme sahip değeri belirlemek üzere bir el kitabı değerine oranını karşılaştırarak olarak karakterize edilebilir. Bir tedavi etkisi hesaplanması "Herhangi tedavi etkisi tedavi ve genel ortalamayı aldığınızda gözlemlerin ortalama arasındaki fark alınarak tahmin edilmektedir", daha sonra önemsiz olduğunu.

karelerinin toplamının bölümleme

ANOVA geleneksel standardize terminoloji kullanır. Örnek varyans tanımsal denklemidir bölen serbestlik (DF) sahiptir derece olarak tanımlanır,, toplam kareler (SS) toplamı olarak adlandırılır, sonuç ortalama kare (MS) ve karesel terimler sapmalar olarak adlandırılır numune demek. Büyük ortalamasına, bunların uygun işlem vasıtasıyla tüm gözlem sapmalara göre bir hata varyans tüm gözlem sapmalara göre toplam varyans ve bir tedavi varyans: ANOVA 3 örnek sapmaları tahmin etmektedir. Tedavi varyans büyük ortalamadan anlamına tedavi sapmalara göre, sonuç gözlemlerin varyans ve araçlarının varyans arasındaki farkı dikkate almak için, her bir tedavinin gözlem sayısı ile çarpılarak edilir.

Temel teknik, toplam bir bölümleme kareler toplamı SS modelinde kullanılan etkileri ile ilgili bileşenlere. Örneğin, farklı seviyelerde muamele bir tip basitleştirilmiş bir ANOVA modeli.

Sayısı özgürlüğü dereceleri DF benzer şekilde bölümlenmiş edilebilir: Bu bileşenlerden biri (yani hata için) bir belirtir ki-kare dağılımı varsa aynı "tedavi" için doğru olmakla birlikte, kareler ilişkili toplamını açıklar hiçbir tedavi etkisi.

Ayrıca bkz eksikliği-of-fit karelerinin toplamını .

F -testi

F -testi toplam sapma faktörleri karşılaştırılması için kullanılır. Örneğin, tek yönlü ya da tek faktör ANOVA olarak, istatistiksel anlamlılık F testi istatistiğini karşılaştırılarak test edilir

nerede MS kare ortalama olduğunu tedavilerin numarası ve = vakaların = toplam sayısını

için F -Dağıtım ile , serbestlik derecesi. Kullanma F testi istatistik ölçekli bir takip eden her hangi karelerinin iki ölçekli toplamlarının oranı için -Dağıtım doğal adaydır ki-kare dağılımı .

F beklenen değer bir tedavi etkisi için 1 (n tedavisi numune boyutu) içine alır. 1 Yukarıdaki F artış değerlerinde olduğu gibi, delil boş hipotezi ile giderek tutarsız. F artan iki belirgin deneysel yöntemler örnek sayısının artırılması ve dar deneysel kontrol ile hata varyansını azaltmaktadır.

aynı sonucu üretmek her ikisi de ANOVA hipotez testi sonucuna için iki yöntem vardır:

  • Ders kitabı yöntemi tablolarından tespit F kritik değeri ile F gözlenen değer karşılaştırmaktır. F kritik değeri pay ve payda ve anlamlılık düzeyi (α) serbestlik derecelerinin bir fonksiyonudur. F ≥ F Eğer Kritik , sıfır hipotezi reddedilir.
  • Bilgisayar yöntemi gözlenen değere eşit veya daha büyük bir F değeri olasılığını (p-değeri) hesaplar. Bu olasılık anlamlılık seviyesi (α) daha az veya eşit ise Boş hipotez reddedilir.

ANOVA F yalancı pozitif hataların sabit oran için yanlış negatif hataları minimize anlamında neredeyse optimal olduğu bilinir testinde gösterilebilir (sabit anlamlılık düzeyi için yani maksimize gücü). Örneğin, çeşitli tıbbi tedaviler aynı etkiye sahiptir hipotezini test etmek için, F -testi 'in p -değerleri yakından yaklaştığı permütasyon testi s' p değerleri : yaklaşım tasarım, dengeli olduğu zaman, özellikle yakındır. Bu permütasyon testleri karakterize maksimum güç ile testler Tüm karşı alternatif hipotez Rosenbaum tarafından görüldüğü gibi. ANOVA F (bütün tedaviler tam olarak aynı etkiye sahip boş-hipotez) -test çünkü birçok alternatif dağılımlar karşı dayanıklılığın, pratik bir test olarak önerilmektedir.

Genişletilmiş mantık

ANOVA ayrılabilir parçadan oluşmaktadır; Varyans ve hipotez testi bölümleme kaynakları bireysel olarak kullanılabilir. ANOVA diğer istatistiksel araçları desteklemek için kullanılır. Regresyon ilk veri daha karmaşık modeller uyması için kullanılır, daha sonra varyans yeterli verileri tanımlamak basit (r) modelini seçme amacı ile modelleri karşılaştırmak için kullanılır. "Bu tür modeller ANOVA herhangi bir ilişkisi olmayan formda olabilir ama ANOVA araçları daha sonra donatılmış modellerin bazıları mantıklı ve katsayılar toplu ilgili hipotezleri test etmek için kullanılabilir olabilir." "[W] E-olmayan modellere regresyon alternatif olarak değil bir araç olarak karmaşık yüksek boyutlu çıkarımlar özetleme için anlayış ve yapılanma düzeyli bir yolu olarak varyans analizi düşünüyorum ..."

Tek bir faktör,

ANOVA analizi için uygun basit bir deney, tek faktörlü tamamen randomize bir deneydir. Tek bir faktör ile daha karmaşık deneyler rasgele üzerinde kısıtlamalar içerir ve tamamen randomize blok ve Latin kare arasında (ve varyantları: Graeco-Latin kare, vb.) Daha karmaşık deneyler birçok faktörün karmaşık birçok paylaşır. Tamamen randomize bir deney analizi (modelleri, veri özetleri, varyans analizi tablo) ihtiva eden bir göreceli olarak tam bir tartışma mevcuttur .

birden çok faktöre için

ANOVA çoklu faktörlerin etkileri çalışmasında yaygınlaştırır. Deney her faktörün seviyeleri tüm kombinasyonlarında gözlemleri içerdiğinde, adını almaktadır faktöryel . Faktöriyel Deneyler tek faktör bir dizi deneye daha verimlidir ve verimlilik faktörleri sayısı arttıkça büyür. Sonuç olarak, faktöryel tasarımlar yoğun kullanılmaktadır.

Birden faktörlerin etkilerini incelemek için ANOVA kullanımı komplikasyon vardır. Faktörler x, y ve z, 3-yollu ANOVA olarak, ANOVA modelinde ana etkileri (x, y, z) ve terimleri için terimler içeren etkileşimler (xy xz, yz, xyz). Tüm terimler hipotez testleri gerektirir. Etkileşim terimlerin çoğalması bazı hipotez testi tesadüfen bir yanlış pozitif üretecektir riskini artırır. Neyse ki, deneyim yüksek mertebeden etkileşimleri nadir olduğunu söylüyor. Etkileşimlerini tespit yeteneği çoklu faktör ANOVA önemli bir avantajdır. Her seferinde bir faktör test etkileşimleri gizler, ancak görünüşe göre tutarsız deneysel sonuçlar üretir.

etkileşimlerini karşılaşmak dikkatli olunmalıdır; etkileşimler bulunursa Testi etkileşim terimleri birinci ve ANOVA ötesinde analizi genişletin. Metinler etkileşimi karşılaştıktan sonra tek yönlü ANOVA devamına ilişkin kendi önerileri değişir. Etkileşimler deneysel verilerin yorumlanması karmaşık hale getirir. Ne önemi hesaplamalar ne de tahmini tedavi etkileri yüzeysel olarak alınabilir. "Önemli bir etkileşim ana etkilerin önemi gizlemek genellikle olacaktır." Grafik yöntemler anlayışı geliştirmek için tavsiye edilir. Regresyon çoğu kez yararlıdır. etkileşimlerin bir uzun tartışma Cox (1958) mevcuttur. Diğer Çözümler Bazı etkileşimler (dönüşümler ile) çıkarılabilir.

Çeşitli teknikler giderleri azaltmak için birden fazla faktör ANOVA ile birlikte kullanılır. Faktöriyel tasarımlarda kullanılan tekniklerden biri çoğaltma (desteğiyle muhtemelen hiçbir çoğaltma minimize etmektir analitik hile ) ve etkileri istatistiksel (veya pratik olarak) önemsiz olduğu tespit edildiğinde grupları birleştirebilir. Birçok önemsiz faktörlerle bir deney birçok tekrarlamalı tarafından desteklenen birkaç faktörlerle birine çökebilir.

Çalışılan sayısal örnekler

Çeşitli tam olarak çalıştı sayısal örnekler mevcuttur. Bir Basit bir durumda tek yönlü (tek bir faktör) analizini kullanır. Bir daha karmaşık bir durumda , iki yol (iki faktörü) analizini kullanır.

ilişkili analizi

Bazı analiz desteği gereklidir tasarımın diğer analiz gerçekleştirilirken faktörlerdeki değişiklikler resmen yanıtlarda istatistiksel olarak anlamlı bir değişiklik üretmek için bulunurlar sonra deney. Deneyler tekrarlı olduğundan, bir deneyin sonuçları deneyleri aşağıdaki planlarını değiştirmek.

Hazırlık analizi

Deney birimlerinin sayısı

Bir deneyin tasarımında, deneysel birimlerinin sayısı deney hedeflerini karşılamak için planlanmıştır. Deneme genellikle sıralı olduğunu.

Erken deneyler genellikle tedavi etkilerinin ve deneysel hatanın ortalama-tarafsız tahminleri sağlamak üzere tasarlanmıştır. Daha sonra deneyler genellikle tedavi etkisi önemli büyüklüğe sahip bir hipotezi test etmek üzere tasarlanmıştır; Deney diğer hedefler arasında, bütçe içinde ve yeterli güce sahip olacak şekilde bu durumda, deneysel birimlerin sayısı seçilir.

Raporlama örnek boyutu analizi genellikle psikolojide gereklidir. "Örneklem büyüklüğü ve büyüklük kararlarını örnek liderliğindeki sürece bilgi verin." Deney uygulanmadan önce deney protokolünde yazılır analizi, hibe uygulamaları ve idari inceleme kurullarında incelenir.

güç analizi yanında, deneysel birim sayısı seçilmesi için az resmi yöntem vardır. Bu yanlış negatif hataları sayışım azaltmaktadır göre grafik yöntemleri arasında, grafik yöntemler arzu edilen bir emin aralığı elde dayalı ve yöntemleri (artıklar üzerinde) beklenen varyasyon arttırılması temeline dayanmaktadır.

Güç analizi

Güç analizi biz evren, örneklem büyüklüğü ve anlamlılık düzeyinde belli bir ANOVA tasarım, efekt büyüklüğünü varsayarsak sık başarıyla sıfır hipotezini reddetme olasılığını değerlendirmek için ANOVA bağlamında uygulanmaktadır. Güç analizi, alternatif hipotez doğru olduğunda boş varsayımı reddetme makul bir şans olması için gerekli ne örnek boyutu belirleyerek çalışma tasarımında yardımcı olabilir.

Etki büyüklüğü

etkisinin birkaç standart önlemler bir göstergesi (lar) ve bağımlı değişken ya da tamamen modelin genel olarak standart bir fark arasındaki ilişkinin kuvvetini özetlemek ANOVA önerilmiştir. Standardize etki boyutunda tahminleri çalışmaları ve disiplinler arasında bulguların karşılaştırılması kolaylaştırır. standardize etki büyüklükleri yaygın mesleki literatürün çok kullanılan Ancak, hemen vardır etki boyutunun standart olmayan ölçü "anlamlı" birimleri raporlama amacıyla tercih edilebilir.

Takip analizi

Dikkatle Aykırı dikkate almak her zaman uygundur. Onlar istatistiksel sonuçlara orantısız bir etkiye sahip ve genellikle hataların sonucudur.

Model onayı

ANOVA varsayımlar karşılandığını doğrulamak için isabetli olmuştur. Yüzeyde kalan muayene veya onaylamak için analiz edilir homoscedasticity ve brüt normalliği. Zaman ve modellenen veri değerlerinin dahil şey bir fonksiyonu olarak çizilmiştir zaman Orion'u (sıfır ortalama normal dağılım) gürültü görünüme sahip olmalıdır. Trendler faktörler arasında veya gözlemler arasındaki etkileşimler de ipucu. Pratik bir kural: "büyük standart sapma en küçük standart sapma, biz eşit standart sapmaların varsayımına dayalı yöntemler kullanabilir ve sonuçlarımız yine yaklaşık olarak doğru olacaktır iki katından daha az ise"

Takip testleri

ANOVA istatistiksel olarak anlamlı etkisinin genellikle bir veya daha fazla farklı izlem testleri ile takip edilmektedir. Bu hangi diğer gruplardan farklı olan grupları değerlendirmek veya diğer çeşitli odaklı hipotezleri test etmek için yapılabilir. Takip testler genellikle (bunlar planlı olup olmadığını açısından ayırt edilir önsel ) ya da post hoc . Planlanan testler verilere bakarak sonra yapılmaktadır veri ve post hoc testler bakıyor önce belirlenir.

Tedavi grubu kontrol olarak hareket edebilir, böylece Genellikle "tedaviler" biri hiçbiri vardır. Dunnett testi (t-testi a biçimi) diğer tedavi gruplarının her biri bir kontrol olarak aynı ortalama sahip olup olmadığını test eder.

Gibi Post hoc testler Tukey aralık testi en sık her grup anlamına her grupla ortalama ve tipik Tip I hatalar için kontrol bazı yöntem dahil karşılaştırın. En yaygın olarak planlanan karşılaştırmaları, basit ya da bileşik olabilir. Basit karşılaştırmalar bir grup bir başka grup ortalama demek karşılaştırın. Bileşik karşılaştırmalar tipik olarak bir dizi (örneğin, ortalama grup karşılaştırmak grubu D Grup A, B ve C anlamına gelir), iki veya daha fazla grup yer alır burada gruplarının iki grup anlamına gelir karşılaştırın. Karşılaştırmalar ayrıca bağımsız değişken sipariş düzeylerini içeren doğrusal ve kuadratik ilişkiler gibi eğilimin testlerde, bakabilirsiniz.

çiftler halinde çoklu karşılaştırma testleri ile ANOVA sonrasında, çeşitli gerekçelerle eleştirildi. bunların kullanımıyla ilgili birçok tür testleri (10 tablo bir cinsinden) ve öneriler belirsiz veya çakışan vardır vardır.

Çalışma tasarımları

ANOVA çeşitli türleri vardır. Birçok istatistikçiler üzerinde ANOVA dayandırmak deney tasarımı özellikle belirten protokolüne, rastgele atama konulara tedavilerin; atama mekanizmasının protokol açıklaması tedavilerin herhangi yapısının bir şartname içermelidir engellenmesi . Uygun bir istatistiksel model kullanılarak gözlemsel verilere ANOVA uygulamak da yaygındır.

Bazı popüler tasarımları ANOVA aşağıdaki türde kullanın:

  • Tek yönlü varyans analizi , iki ya da daha fazla arasındaki farklılıkların test etmek için kullanılır , bağımsız bir ilaç etkisinin çeşitli bakteri türlerine, örneğin grup (araçları), bir ekin üre uygulamasının farklı seviyelerde ya da antibiyotik farklı etki seviyelerinde ya da farklı düzeylerde hastaların gruplara. Bununla birlikte, bu gruplar olup bağımsız olmalı ve bir ilaç dozunda (örneğin, 5 mg / ml, 10 mg / ml, 20 mg vardır (örneğin, hafif, orta ve şiddetli hastalık gibi) gruplar halinde bir düzen ya da aynı hasta grubuna verilen / mL), sonra bir lineer trend tahmini kullanılmalıdır. Ancak, tipik olarak, tek-yönlü varyans analizi, iki grup vaka ile örtülebilir, çünkü en azından üç grup arasındaki farklılıkların test etmek için kullanılır t-testi . Karşılaştırma için sadece iki aracı olduğu zaman, t-testi ve ANOVA F -testi eşdeğerdir; ANOVA ve arasındaki ilişki t ile verilmektedir F  =  t 2 .
  • Faktöriyel ANOVA deneyci tedaviler arasında etkileşim etkilerini incelemek istediğinde kullanılır.
  • Tekrarlanan ölçümler aynı kişi (a, örneğin, her bir muamele için kullanıldığı zaman, ANOVA kullanılan uzunlamasına bir çalışmada ).
  • Çok değişkenli varyans analizi , birden fazla olduğunda (MANOVA) kullanılır yanıt değişkeni .

Dikkat

Dengeli deneyler (her bir muamele için eşit numune boyutuna sahip olanlar) yorumlamak için nispeten kolaydır; Dengesiz deneyler daha karmaşık sunuyoruz. Tek faktör (tek yönlü) ANOVA için, simetrik veri için ayarlama kolaydır, ancak dengesiz analiz sağlamlığı ve gücü yoktur. Daha karmaşık tasarımları için denge eksikliği başka komplikasyonlara yol açar. "Ana etkileri ve dengesiz duruma taşınmaz dengeli verilerde mevcut etkileşimlerin diklik özelliği. Bu varyans tekniklerinin zamanki analizi geçerli değildir anlamına gelir. Sonuç olarak, dengesiz faktöriyellerinin analizi çok daha zor dengeli için olandan ise tasarımlar." Genel durumda, "varyans analizi de dengesiz verilerine tatbik edilebilir, ancak daha sonra kareler ortalama kareler ve toplamları F -ratios varyasyon kaynakları olarak sırayla bağlıdır." Dengelenmemiş veri ister atarak ya da eksik verileri sentezlenerek dengeyi yeniden kullanım için basit teknikleri. Daha karmaşık teknikler regresyon kullanılır.

ANOVA anlamın sınama (kısmen) 'dir. Amerikan Psikoloji Derneği basitçe raporlama önemi yetersizdir ve güvenlik sınırını raporlama tercih edilir olduğu görüşünü tutar.

ANOVA karşı (anlamlılık düzeyi sürdürülmesinde) muhafazakar olmakla birlikte çoklu karşılaştırmalar tek boyutta, birden boyutta karşılaştırmaları karşı muhafazakar değildir.

genellemeler

ANOVA özel bir durum olarak kabul edilir lineer regresyon sırayla özel bir durumdur genel lineer model . Tüm minimize edilecek bir model (uyum) ve bir kalıntı (hata) toplamı olarak gözlemlerini düşünün.

Kruskal-Wallis testi ve Friedman testi olan parametrik olmayan normallik varsayımı güvenmeyin testler,.

Doğrusal regresyon bağlantı

Biz çok yönlü ANOVA ve lineer regresyon arasındaki bağlantıyı temizlemek yapmak görebilirsiniz. Böylece lineer olarak yeniden sipariş veri gözlem tepki ile ilişkilidir ve faktör farklı faktörleri belirtmektedir ve faktör toplam sayısıdır. Tek yönlü ANOVA içinde ve iki yönlü ANOVA içinde . Ayrıca, varsayalım faktör vardır yani seviyelerini . Şimdi, biz tek sıcak içine faktörler kodluyor boyutlu vektör .

Bir sıcak şifreleme işlevi şekilde tanımlanır girişi olan

Vektör her için yukarıda vektörlerinin her birleşimidir . Bu nedenle, . Tam genel elde etmek amacıyla yollu etkileşim ANOVA da vektör içinde her ek etkileşim terimi birleştirmek gerekir ve daha sonra bir sabit terim ekleyin. Bu vektör olsun .

Yerine bu gösterimde, şimdi lineer regresyon ile tam bağlantı var. Biz sadece yanıtı gerileme vektör karşı . Ancak, tanımlanabilir hakkında bir endişe vardır. Bu tür sorunları aşmak amacıyla biz etkileşimlerin her bir kümede yer parametrelerin toplamı sıfıra eşit olduğunu varsayalım. Buradan birini kullanabilirsiniz F bireysel faktörlerin belirlemek üzere -İstatistik veya başka yöntemler.

Örnek

Biz ilk faktör 2 katlıdır ve ikinci faktör 3 seviyeleri olduğunu varsayalım 2 yönlü etkileşim örneği düşünebilirsiniz.

Tanımlama ise ve , eğer , örneğin, birinci faktörün bir sıcak kodlama ve ikinci faktörün bir sıcak kodlamasıdır.

Bununla,

nerede Geçen dönem bir yolunu kesmek terimdir. Daha somut bir örnek için varsayalım
Sonra,

Ayrıca bakınız

Dipnotlar

notlar

Referanslar

daha fazla okuma

Dış bağlantılar