Student t -testi -Student's t-test

T -testi herhangi bir istatistiksel hipotez testi içinde test istatistiği bir aşağıdaki Student t -Dağıtım altında Boş hipotez .

Bir t- testi, test istatistiğindeki bir ölçeklendirme teriminin değeri biliniyorsa, test istatistiğinin normal bir dağılım izleyeceği durumlarda en yaygın olarak uygulanır . Ölçeklendirme terimi bilinmediğinde ve verilere dayalı bir tahminle değiştirildiğinde , test istatistikleri (belirli koşullar altında) bir Student t dağılımını izler . T , iki veri setinin aracı ise, örneğin, kullanılabilecek -test belirlemek için önemli ölçüde birbirinden farklı.

Tarih

William Sealy Gosset , " t- istatistik"i geliştiren ve "Öğrenci" takma adı altında yayınlayan kişidir .

" t- istatistiği" terimi, "hipotez test istatistiği"nden kısaltılmıştır. İstatistikte, t-dağılımı ilk olarak 1876'da Helmert ve Lüroth tarafından bir sonsal dağılım olarak türetilmiştir . T-dağılımı ayrıca Karl Pearson'ın 1895 tarihli makalesinde Pearson Tip IV dağılımı olarak daha genel bir biçimde ortaya çıktı . Ancak, Student's T Distribution olarak da bilinen T-Dağılımı, adını ilk kez 1908'de Biometrika bilimsel dergisinde "Student" takma adını kullanarak İngilizce olarak yayınlayan William Sealy Gosset'ten alır, çünkü işvereni yayınlarken personelin mahlas kullanmasını tercih eder. gerçek adı yerine bilimsel makaleler yayınladı, bu yüzden kimliğini gizlemek için "Öğrenci" adını kullandı. Gosset çalıştı Guinness bira içinde Dublin , İrlanda ve küçük numunelerin sorunlarına ilgi duyan edildi - örneğin, küçük örneklem boyutları ile arpa kimyasal özellikleri. Bu nedenle, Student teriminin etimolojisinin ikinci bir versiyonu, Guinness'in rakiplerinin hammadde kalitesini belirlemek için t-testini kullandıklarını bilmelerini istememesidir (bu takma adın ayrıntılı bir geçmişi için Student's t - dağılımına bakın, bu, kelimenin tam anlamıyla öğrenci terimiyle karıştırılmamalıdır ). "Öğrenci" terimi kendisinden sonra kaleme alınan William Gosset olmasına rağmen, aslında dağılımın "Öğrenci dağılımı" ve "Öğrencinin t-testi" olarak iyi bilinmesi Ronald Fisher'ın çalışmasıyla olmuştur.

Gosset, Claude Guinness'in Oxford ve Cambridge'den en iyi mezunları Guinness'in endüstriyel süreçlerine biyokimya ve istatistik uygulamaları için işe alma politikası nedeniyle işe alınmıştı . Gosset, t- testini, şişmanlığın kalitesini izlemenin ekonomik bir yolu olarak tasarladı . T çalışması-testi sunulmuş ve kabul edilen dergide edildi Biometrika ve 1908 yılında yayınladı.

Guinness, Gosset'in 1906–1907 akademik yılının ilk iki döneminde University College London'daki Profesör Karl Pearson'ın Biyometrik Laboratuvarında kullandığı teknik personelin çalışma iznine ("çalışma izni") izin verme politikasına sahipti . Gosset'in kimliği daha sonra diğer istatistikçiler ve baş editör Karl Pearson tarafından biliniyordu.

kullanır

En sık kullanılan t- testleri arasında şunlar yer alır:

  • Bir popülasyonun ortalamasının boş hipotezde belirtilen bir değere sahip olup olmadığının tek örnekli konum testi .
  • Bir , iki örnek boş konumu deney böyle bir varsayımda aracı iki popülasyonlarının eşittir. Tüm bu testler genellikle Student's t -testleri olarak adlandırılır , ancak kesinlikle bu ad yalnızca iki popülasyonun varyanslarının da eşit olduğu varsayılırsa kullanılmalıdır; Bu varsayımdan vazgeçildiğinde kullanılan testin formuna bazen Welch'in t -testi denir . Bu testler, genellikle karşılaştırılan iki örneğin temelindeki istatistiksel birimler örtüşmediğinde uygulandıkları için genellikle eşleştirilmemiş veya bağımsız örnekler t- testleri olarak adlandırılır .

varsayımlar

Çoğu test istatistiği t = biçimindedir Z/s, burada Z ve s verilerin işlevleridir.

Z , alternatif hipoteze duyarlı olabilir (yani, alternatif hipotez doğru olduğunda büyüklüğü daha büyük olma eğilimindedir), oysa s , t'nin dağılımınınbelirlenmesineizin verenbir ölçeklendirme parametresidir .

Örnek olarak, tek örnek t -testinde

burada X, bir örnek ortalaması bir numuneden x 1 , x 2 , ..., x , n , boyut N , s olan ortalama standart hata , bir tahminidir standart sapma nüfusun ve μ olan nüfus ortalama .

Yukarıdaki en basit biçimde bir t -testinin altında yatan varsayımlar şunlardır:

  • X , ortalama μ ve varyansile normal bir dağılım izlerσ 2/n
  • s 2 ( n  − 1)/ σ 2 , n  − 1 serbestlik dereceli bir χ 2 dağılımını takip eder . Bu varsayım, s 2'yi tahmin etmek için kullanılan gözlemlernormal bir dağılımdan (ve her grup için iid) geldiğinde karşılanır.
  • Z, ve s olan bağımsız .

Gelen t iki bağımsız numune vasıtanın karşılaştırılması için -test aşağıdaki varsayımlar karşılanmalıdır:

  • Karşılaştırılan iki popülasyonun ortalamaları normal dağılımları izlemelidir . Zayıf varsayımlar altında , her bir gruptaki gözlemlerin dağılımı normal olmadığında bile , merkezi limit teoreminden büyük örneklerde bunu takip eder .
  • Student'ın orijinal t testi tanımı kullanılıyorsa , karşılaştırılan iki popülasyon aynı varyansa sahip olmalıdır ( F testi , Levene testi , Bartlett testi veya Brown-Forsythe testi kullanılarak test edilebilir ; veya bir Q-Q grafiği kullanılarak grafik olarak değerlendirilebilir) ). Karşılaştırılan iki gruptaki örneklem büyüklükleri eşitse, Student'in orijinal t testi, eşit olmayan varyansların varlığına karşı oldukça sağlamdır. Welch'in t- testi , örnek boyutlarının benzer olup olmadığına bakılmaksızın varyansların eşitliğine duyarsızdır.
  • Testi gerçekleştirmek için kullanılan veriler, karşılaştırılan iki popülasyondan bağımsız olarak örneklenmeli veya tamamen eşleştirilmelidir. Bu genellikle verilerden test edilemez, ancak verilerin bağımlı olduğu biliniyorsa (örneğin test tasarımı ile eşleştirilmiş), bağımlı bir test uygulanmalıdır. Kısmen eşleştirilmiş veriler için, klasik bağımsız t- testleri, test istatistiği bir t dağılımını takip etmeyebileceğinden geçersiz sonuçlar verebilirken , bağımlı t- testi, eşleştirilmemiş verileri attığı için alt-optimaldir.

Çoğu iki örnekli t testi, varsayımlardan büyük sapmalar dışında tümüne karşı dayanıklıdır.

İçin doğruluk , t -testi ve Z, örnek aracının normalliği gerektiren -test ve t -testi, ilave olarak örnek varyans ölçekli aşağıdaki gerektirir χ 2 dağılımı ve örnek ortalaması ve örnek varyans olması istatistiksel olarak bağımsız . Bu koşullar karşılanırsa, bireysel veri değerlerinin normalliği gerekli değildir. Tarafından merkezi sınır kuramı , orta derecede büyük örneklerin örnek araçları genellikle veri normal dağılım bile normal dağılım ile iyi yaklaştırılır. Normal olmayan veriler için, örnek varyansının dağılımı, χ 2 dağılımından önemli ölçüde sapabilir . Bununla birlikte, örnek boyutu büyükse, Slutsky'nin teoremi , örnek varyansının dağılımının test istatistiğinin dağılımı üzerinde çok az etkisi olduğunu ima eder.

Eşlenmemiş ve eşleştirilmiş iki örnekli t testleri

Korelasyonun bir fonksiyonu olarak eşleştirilmemiş ve eşleştirilmiş iki örnekli t - testlerinin Tip I hatası . Simüle edilen rastgele sayılar, varyansı 1 olan iki değişkenli bir normal dağılımdan kaynaklanmaktadır. Anlamlılık düzeyi %5 ve vaka sayısı 60'tır.
Korelasyonun bir fonksiyonu olarak eşleştirilmemiş ve eşleştirilmiş iki örnekli t testlerinin gücü. Simüle edilmiş rasgele sayılar, varyansı 1 ve beklenen değerin sapması 0,4 olan iki değişkenli bir normal dağılımdan kaynaklanır. Önem düzeyi %5 ve vaka sayısı 60'tır.

Ortalamadaki bir fark için iki örnekli t testleri, bağımsız örnekleri (eşlenmemiş örnekler) veya eşleştirilmiş örnekleri içerir. Eşleştirilmiş t- testleri, bir engelleme biçimidir ve eşleştirilmiş birimler "gürültü faktörleri" açısından benzer olduğunda, eşlenmemiş testlerden bağımsız testlerden daha fazla güce (yanlış negatif olarak da bilinen tip II hatadan kaçınma olasılığı) sahiptir. karşılaştırılan iki gruba üyelik. Farklı bağlamda, eşleştirilmiş t -test etkilerini azaltmak için kullanılabilecek faktörleri karıştırıcı , bir in gözlem çalışma .

Bağımsız (eşleştirilmemiş) örnekler

Bağımsız örnekler t- testi, karşılaştırılan iki popülasyonun her birinden birer tane olmak üzere iki ayrı bağımsız ve aynı şekilde dağılmış örnek seti elde edildiğinde kullanılır. Örneğin, bir tıbbi tedavinin etkisini değerlendirdiğimizi ve çalışmamıza 100 denek dahil ettiğimizi ve ardından rastgele 50 denek tedavi grubuna ve 50 denek kontrol grubuna atadığımızı varsayalım. Bu durumda, iki bağımsız örneğimiz var ve t -testinin eşleştirilmemiş formunu kullanacağız .

eşleştirilmiş örnekler

Eşleştirilmiş örnekler t- testleri tipik olarak, benzer birimlerin eşleştirilmiş çiftlerinden veya iki kez test edilmiş bir grup birim örneğinden ("tekrarlanan ölçümler" t- testi) oluşur.

Tekrarlanan ölçümler t- testinin tipik bir örneği, deneklerin bir tedaviden önce örneğin yüksek tansiyon için test edildiği ve aynı deneklerin kan basıncını düşüren bir ilaçla tedaviden sonra tekrar test edildiği yerlerdir. Aynı hastanın tedavi öncesi ve sonrası numaralarını karşılaştırarak, her hastayı kendi kontrolü olarak etkin bir şekilde kullanıyoruz. Bu şekilde, boş hipotezin (burada: tedavi tarafından yapılan hiçbir fark olmadığı) doğru şekilde reddedilme olasılığı çok daha olası hale gelebilir, sadece rastgele hastalar arası varyasyon artık ortadan kaldırıldığı için istatistiksel güç artar. Bununla birlikte, istatistiksel gücün artmasının bir bedeli vardır: daha fazla test gereklidir, her denek iki kez test edilmelidir. Numunenin yarısı artık diğer yarısına bağlı olduğundan, Student t -testinin eşleştirilmiş versiyonu yalnızcan/2− 1 serbestlik derecesi ( n toplam gözlem sayısı olmak üzere). Çiftler ayrı test birimleri haline gelir ve aynı sayıda serbestlik derecesini elde etmek için numunenin iki katına çıkarılması gerekir. Normalde, n - 1 serbestlik derecesi vardır ( n , toplam gözlem sayısıdır).

"Eşleşen çiftler örneğine" dayalı bir eşleştirilmiş örnekler t testi, daha sonra ilgili değişkenle birlikte ölçülen ek değişkenler kullanılarak bir eşleştirilmiş örnek oluşturmak için kullanılan eşlenmemiş bir örnekten elde edilir. Eşleştirme, diğer ölçülen değişkenler açısından çiftin benzer olduğu iki örneğin her birinden bir gözlemden oluşan değer çiftlerinin tanımlanmasıyla gerçekleştirilir. Bu yaklaşım bazen, karıştırıcı faktörlerin etkilerini azaltmak veya ortadan kaldırmak için gözlemsel çalışmalarda kullanılır.

Eşleştirilmiş numuneler t -testleri genellikle "bağımlı numuneler t -testleri" olarak adlandırılır.

hesaplamalar

Çeşitli t- testlerini gerçekleştirmek için kullanılabilecek açık ifadeler aşağıda verilmiştir. Her durumda, sıfır hipotezi altında bir t- dağılımını tam olarak takip eden veya buna çok yakın olan bir test istatistiği için formül verilir. Ayrıca, her durumda uygun serbestlik dereceleri verilmiştir. Bu istatistiklerin her biri, tek kuyruklu veya iki kuyruklu testi gerçekleştirmek için kullanılabilir .

Bir kez t değeri ve serbestlik derecesi belirlenir, bir p -değeri , bir ile bulunabilir Student gelen değerleri tablosuna t -Dağıtım . Hesaplanan p değeri, istatistiksel anlamlılık için seçilen eşiğin altındaysa (genellikle 0.10, 0.05 veya 0.01 seviyesi), o zaman boş hipotez, alternatif hipotez lehine reddedilir.

Tek örnek t testi

Popülasyon ortalamasının belirli bir μ 0 değerine eşit olduğu sıfır hipotezini test ederken , istatistik kullanılır.

burada örnek ortalaması, bir s olan numune standart sapma ve n, örnek boyutudur. Bu testte kullanılan serbestlik dereceleri n - 1'dir . Ana popülasyonun normal olarak dağılması gerekmese de, örnek ortalama popülasyonunun dağılımının normal olduğu varsayılır.

Tarafından merkezi limit teoremi gözlemler bağımsız olan ve ikinci momenti, varsa, o zaman yaklaşık olarak normal N- (1; 0) olacaktır.

Bir regresyon çizgisinin eğimi

Diyelim ki biri modele uyuyor

burada X , bilinen a ve β bilinmemektedir, ε 0 ortalama ve bilinmeyen varyans ile normal olarak dağıtılmış rasgele değişkendir σ 2 ve Y, ilgi konusu bir sonuçtur. Eğim β'nın belirli bir β 0 değerine eşit olduğu boş hipotezini test etmek istiyoruz (genellikle 0 olarak alınır, bu durumda boş hipotez x ve y'nin ilişkisizdir).

İzin vermek

Sonra

sıfır hipotezi doğruysa , n − 2 serbestlik dereceli bir t dağılımına sahiptir . Şev katsayısının standart hatası :

kalıntılar cinsinden yazılabilir. İzin vermek

Daha sonra t puanı şu şekilde verilir:

t puanını belirlemenin başka bir yolu :

burada r , Pearson korelasyon katsayısıdır .

T skoru, kesişme belirlenebilir t skoru, eğimi :

burada s x 2 örnek varyansıdır.

Bağımsız iki örnekli t testi

Eşit numune boyutları ve varyans

İki grup (1, 2) verildiğinde, bu test yalnızca şu durumlarda uygulanabilir:

  • iki örneklem büyüklüğü (yani, her grubun katılımcı sayısı n ) eşittir;
  • iki dağılımın aynı varyansa sahip olduğu varsayılabilir;

Bu varsayımların ihlalleri aşağıda tartışılmaktadır.

T aracı aşağıdaki gibi hesaplanabilir farklı olup olmadığını test etmek için istatistik:

nerede

Burada s p , n = n 1 = n 2 ve s için birleştirilmiş standart sapmadır 2
X 1
ve s 2
x 2
Hangi yansız tahmin ait sapmaların iki numune. Payda t olan standart hata , iki ortalama arasındaki farkın.

Önem testi için, bu testin serbestlik derecesi 2 n − 2'dir ; burada n , her gruptaki katılımcı sayısıdır.

Eşit veya eşit olmayan örneklem büyüklükleri, benzer varyanslar (1/2 < s X 1/s X 2 < 2)

Bu test, yalnızca iki dağılımın aynı varyansa sahip olduğu varsayıldığında kullanılır. (Bu varsayım ihlal edildiğinde, aşağıya bakınız.) Önceki formüller, aşağıdaki formüllerin özel bir halidir, her iki numunenin boyutu eşit olduğunda, biri onları kurtarır: n = n 1 = n 2 .

T aracı aşağıdaki gibi hesaplanabilir farklı olup olmadığını test etmek için istatistik:

nerede

iki örneğin havuzlanmış standart sapmasının bir tahmincisidir : bu şekilde tanımlanır, böylece karesi, popülasyon ortalamalarının aynı olup olmadığına bakılmaksızın ortak varyansın yansız bir tahmincisi olur . Bu formüllerde, n i − 1 , her grup için serbestlik derecesi sayısıdır ve toplam örneklem büyüklüğü eksi iki (yani, n 1 + n 2 − 2 ) kullanılan toplam serbestlik derecesi sayısıdır. önem testinde.

Eşit veya eşit olmayan örnek boyutları, eşit olmayan varyanslar ( s X 1 > 2 s X 2 veya s X 2 > 2 s X 1 )

Welch'in t- testi olarak da bilinen bu test, yalnızca iki anakütle varyansının eşit olmadığı varsayıldığında (iki örnek boyutu eşit olabilir veya olmayabilir) ve dolayısıyla ayrı olarak tahmin edilmesi gerektiğinde kullanılır. T nüfus aracı farklı olup olmadığını test etmek için istatistik olarak hesaplanır:

nerede

Burada s ı 2 olduğu tarafsız tahmin arasında varyans ile iki örneğin her biri , n i = grubunda yer alan sayısı ı ( i 1 ya da 2 =). Bu durumda havuzlanmış bir varyans değildir. Önem testinde kullanım için, test istatistiğinin dağılımı, kullanılarak hesaplanan serbestlik dereceleri ile sıradan bir Student t- dağılımı olarak tahmin edilir.

Bu Welch-Satterthwaite denklemi olarak bilinir . Test istatistiğinin gerçek dağılımı aslında (biraz) iki bilinmeyen popülasyon varyansına bağlıdır (bkz. Behrens-Fisher problemi ).

Eşleştirilmiş örnekler için bağımlı t testi

Bu test, örnekler bağımlı olduğunda kullanılır; yani, iki kez test edilmiş tek bir numune olduğunda (tekrarlanan ölçümler) veya eşleşen veya "eşleştirilmiş" iki numune olduğunda. Bu, eşleştirilmiş fark testinin bir örneğidir . T istatistik olarak hesaplanır

nerede ve tüm çiftler arasındaki farkların ortalama ve standart sapmasıdır. Çiftler, örneğin ya bir kişinin ön test ve son test puanlarıdır ya da anlamlı gruplar halinde eşleştirilen kişi çiftleri arasındadır (örneğin aynı aileden veya yaş grubundan seçilmiştir: tabloya bakınız). Farkın ortalamasının önemli ölçüde farklı olup olmadığını test etmek istiyorsak μ 0 sabiti sıfırdır. Kullanılan serbestlik derecesi n − 1'dir , burada n çift ​​sayısını temsil eder.

Tekrarlanan ölçümlere örnek
Sayı İsim Test 1 2. test
1 Mike %35 %67
2 Melanie %50 %46
3 Melisa %90 %86
4 Mitchell %78 %91
Eşleşen çiftlere örnek
Çift İsim Yaş Ölçek
1 John 35 250
1 Jane 36 340
2 Jimmy 22 460
2 Jessy 21 200

Çalışılan örnekler

Let A 1 altı ölçümün rastgele örneği alınması ile elde edilen bir dizi göstermektedirler:

ve A 2'nin benzer şekilde elde edilen ikinci bir kümeyi göstermesine izin verin :

Bunlar örneğin bir kovadan seçilen vidaların ağırlıkları olabilir.

O hipotezini test yürütecek aracı iki numune alınmıştır olan popülasyonlarının eşittir.

İki örnek ortalaması arasındaki fark, her biri ile gösterilen , X i , iki numune test yukarıda tartışılan yaklaşımlar tüm pay görünür, olduğunu

İki numune için numune standart sapmaları sırasıyla yaklaşık 0,05 ve 0,11'dir. Böyle küçük örnekler için, iki anakütle varyansı arasındaki eşitlik testi çok güçlü olmayacaktır. Örnek boyutları eşit olduğundan, iki örnekli t testinin iki biçimi bu örnekte benzer şekilde çalışacaktır.

eşit olmayan varyanslar

Eşit olmayan varyanslar (yukarıda tartışılan) yaklaşımı izlenirse, sonuçlar şöyledir:

ve serbestlik dereceleri

Test istatistiği yaklaşık olarak 1.959'dur ve bu, 0.09077'lik iki kuyruklu bir test p değeri verir.

eşit varyanslar

Eşit varyanslar (yukarıda tartışılan) yaklaşımı izlenirse, sonuçlar şöyledir:

ve serbestlik dereceleri

Test istatistiği yaklaşık olarak 1.959'a eşittir, bu da 0.07857'lik iki uçlu bir p değeri verir.

İlgili istatistiksel testler

Konum sorunları için t testinin alternatifleri

T iki vasıtasıyla eşitliği için kesin testi içerir -test bilinmeyen normal popülasyonları IID, ancak eşit, varyans. ( Welch'in t - testi , verilerin normal olduğu ancak varyansların farklı olabileceği durum için neredeyse kesin bir testtir.) Orta derecede büyük örnekler ve tek kuyruklu bir test için, t - testi, normallik varsayımının orta düzeyde ihlallerine karşı nispeten sağlamdır. Yeterince büyük örneklerde, t-testi asimptotik yaklaşımlar z -testi ve hatta normalden büyük sapmalara sağlam olur.

Veriler büyük ölçüde normal değilse ve örneklem boyutu küçükse, t testi yanıltıcı sonuçlar verebilir. Normal olmayan dağılımların belirli bir ailesiyle ilgili bazı teoriler için Gauss ölçeği karışım dağılımları için Konum testi'ne bakın .

Normallik varsayımı tutmadığında, t- testine parametrik olmayan bir alternatif daha iyi istatistiksel güce sahip olabilir . Bununla birlikte, veriler gruplar arasında farklı varyanslarla normal olmadığında, bir t-testi, bazı parametrik olmayan alternatiflerden daha iyi tip-1 hata kontrolüne sahip olabilir. Ayrıca, aşağıda tartışılan Mann-Whitney U testi gibi parametrik olmayan yöntemler, tipik olarak bir ortalama farkını test etmez, bu nedenle eğer bir ortalama farkı birincil bilimsel ilgi konusuysa dikkatli kullanılmalıdır. Örneğin Mann-Whitney U testi, her iki grup da aynı dağılıma sahipse tip 1 hatayı istenen alfa düzeyinde tutacaktır. Aynı zamanda, B grubunun A ile aynı dağılıma sahip olduğu, ancak bir sabit tarafından bir miktar kaymadan sonra (bu durumda iki grubun ortalamalarında gerçekten bir fark olacaktır) bir alternatifi tespit etme gücüne sahip olacaktır. Bununla birlikte, A ve B gruplarının farklı dağılımlara sahip olacağı ancak aynı ortalamalara sahip olacağı durumlar olabilir (örneğin, biri pozitif çarpıklıklı ve diğeri negatif olan, ancak aynı ortalamalara sahip olacak şekilde kaydırılmış iki dağılım gibi). Bu gibi durumlarda, MW, Null hipotezini reddetmede alfa düzeyinden daha fazla güce sahip olabilir, ancak araçlardaki farklılığın yorumunu böyle bir sonuca bağlamak yanlış olur.

Bir aykırı değerin varlığında t-testi sağlam değildir. Örneğin, veri dağılımları asimetrik olduğunda (yani dağılımlar çarpık olduğunda ) veya dağılımların büyük kuyrukları olduğunda iki bağımsız örnek için , Wilcoxon sıra toplamı testi ( Mann-Whitney U testi olarak da bilinir ) üç tane olabilir. t- testinden dört kat daha yüksek güce . Eşleştirilmiş örnekler t testinin parametrik olmayan karşılığı, eşleştirilmiş örnekler için Wilcoxon işaretli sıra testidir . t- testi ve parametrik olmayan alternatifler arasında seçim yapma tartışması için Lumley, et al. (2002).

Tek yönlü varyans analizi (ANOVA) , veriler ikiden fazla gruba ait olduğunda iki örnekli t testini genelleştirir .

Hem eşleştirilmiş gözlemleri hem de bağımsız gözlemleri içeren bir tasarım

İki örnek tasarımda hem eşleştirilmiş gözlemler hem de bağımsız gözlemler mevcut olduğunda, verilerin rastgele (MCAR) tamamen eksik olduğu varsayılarak, yukarıdaki standart testlere devam etmek için eşleştirilmiş gözlemler veya bağımsız gözlemler atılabilir. Alternatif olarak, normallik ve MCAR varsayılarak mevcut tüm verilerden yararlanılarak genelleştirilmiş kısmen örtüşen örnekler t-testi kullanılabilir.

Çok değişkenli test

Hotelling'in t- kare istatistiği olarak adlandırılan Student t istatistiğinin bir genellemesi , aynı örnek içinde birden fazla (genellikle ilişkili) ölçümler üzerinde hipotezlerin test edilmesine izin verir. Örneğin, bir araştırmacı birden fazla deneği çoklu kişilik ölçeklerinden oluşan bir kişilik testine gönderebilir (örneğin Minnesota Çok Yönlü Kişilik Envanteri ). Bu tür ölçümler genellikle pozitif korelasyonlu olduğundan, hipotezleri test etmek için ayrı tek değişkenli t testleri yapılması tavsiye edilmez, çünkü bunlar ölçümler arasındaki kovaryansı ihmal eder ve en az bir hipotezi yanlış reddetme olasılığını artırır ( Tip I hata ). Bu durumda, hipotez testi için tek bir çok değişkenli test tercih edilir. Fisher'in, testler arasında pozitif korelasyon için azaltılmış alfa ile birden fazla testi birleştirmeye yönelik Yöntemi birdir. Bir diğeri, Hotelling'in T 2 istatistiğinin bir T 2 dağılımını izlemesidir . İçin tablo değerleri Ancak, uygulamada dağıtım nadiren kullanılır T 2'ye bulmak zor. Genellikle, T 2 bunun yerine bir F istatistiğine dönüştürülür .

Tek örnekli çok değişkenli bir test için hipotez, ortalama vektörün ( μ ) belirli bir vektöre ( μ 0 ) eşit olmasıdır . Test istatistiği Hotelling t 2 :

burada n örnek boyutudur, x sütun ortalamalarının vektörüdür ve S bir m × m örnek kovaryans matrisidir .

İki örnekli çok değişkenli bir test için hipotez, iki örneğin ortalama vektörlerinin ( μ 1 , μ 2 ) eşit olmasıdır. Test istatistiği Hotelling iki örnek t 2 :

Yazılım uygulamaları

QtiPlot , LibreOffice Calc , Microsoft Excel , SAS , SPSS , Stata , DAP , gretl , R , Python , PSPP , MATLAB ve Minitab gibi birçok elektronik tablo programı ve istatistik paketi Student t - testinin uygulamalarını içerir .

Dil/Program İşlev Notlar
2010 öncesi Microsoft Excel TTEST(array1, array2, tails, type) Bkz. [1]
Microsoft Excel 2010 ve sonrası T.TEST(array1, array2, tails, type) Bkz. [2]
LibreOffice Calc TTEST(Data1; Data2; Mode; Type) Bkz. [3]
Google E-Tablolar TTEST(range1, range2, tails, type) Bkz. [4]
piton scipy.stats.ttest_ind(a, b, equal_var=True) Bkz. [5]
MATLAB ttest(data1, data2) Bkz. [6]
matematik TTest[{data1,data2}] Bkz. [7]
r t.test(data1, data2, var.equal=TRUE) Bkz. [8]
SAS PROC TTEST Bkz. [9]
Java tTest(sample1, sample2) Bkz. [10]
Julia EqualVarianceTTest(sample1, sample2) Bkz. [11]
durum ttest data1 == data2 Bkz. [12]

Ayrıca bakınız

Referanslar

alıntılar

Kaynaklar

daha fazla okuma

  • Boneau, C. Alan (1960). " t testinin altında yatan varsayımların ihlallerinin etkileri ". Psikolojik Bülten . 57 (1): 49-64. doi : 10.1037/h0041412 . PMID  13802482 .
  • Edgell, Stephen E.; Öğlen, Sheila M. (1984). "Normallik ihlalinin korelasyon katsayısının t testine etkisi ". Psikolojik Bülten . 95 (3): 576-583. doi : 10.1037/0033-2909.95.3.576 .

Dış bağlantılar