Dunnett testi - Dunnett's test

Gelen istatistik , Dunnett testi bir olan çoklu karşılaştırma Kanadalı istatistikçi tarafından geliştirilen prosedür Charles Dunnett tek kumanda ile tedavilerin bir takım birbiri ile karşılaştırılması için. Bir denetime Çoklu karşılaştırmalar da birçok bire bir karşılaştırma adlandırılır.

içindekiler

1 Tarihçe
- 1.1 Çoklu Karşılaştırmalar Sorun
- 1.2 Dunnett testinin Kullanımları
2 Dunnett testi Formal açıklaması
- 2.1 Varsayımlar
- 2.2 Hesaplama
3 Örnekler
- 3.1 kumaşın kırılma mukavemeti, ^[5]
4 Kaynaklar

Tarihçe

Dunnett testi 1955 yılında geliştirildi; Kritik değerler güncelleştirilmiş tablo 1964 yılında yayınlanmıştır.

Çoklu Karşılaştırmalar Sorun

Bir eş zamanlı olarak istatistiksel çıkarımlar bir dizi dikkate veya gözlemlenen değerlere dayalı seçilen parametrelerden bir alt algılar zaman çoklu karşılaştırmalar, çokluk veya birden fazla test sorun oluşur. Çoklu karşılaştırma yöntemlerinin herhangi tartışmada büyük sorun Tip I hatalarının olasılık sorudur. Alternatif teknikler arasında en farklılıklar bu hataları nasıl kontrol edileceği sorusuna farklı yaklaşımlar sonucu. Sorun teknik kısmında bulunur; ama gerçekten çok daha hata oranını tanımlamak istiyorum nasıl öznel bir soru ne kadar büyük maksimum olası hata oranı olalım istekli olduğunu. Dunnett testi iyi bilinmektedir ve yaygın olarak eş zamanlı aralık tahminine veya hipotez testi, normallik varsayımı uygun bir dağılım numune bir kontrol ile tüm aktif tedavi ile karşılaştırılması için çoklu karşılaştırma prosedüründe kullanılmaktadır. Dunnett testi tutmak için tasarlanmıştır Familywise hata oranı veya altında kontrolü ile tedavi grubunda birden fazla karşılaştırmalar yaparken. ${\ Displaystyle \ a}$

Dunnett testinin kullanır

Çoklu Karşılaştırmalar problem üzerinde özgün eser tarafından yapıldı Tukey ve Scheffe . Bu yöntem kili karşılaştırmalar her türlü kabul genel biriydi. Tukey en ve Scheffe en yöntemleri örnek araçlarla bir dizi arasındaki karşılaştırmalar herhangi bir sayıda izin verir. Tek bir kontrol grubu ile çoklu tedavi gruplarının kili karşılaştırmalar - Öte yandan, Dunnett testi sadece çoklu karşılaştırmalar sorun özel bir durumu ele diğerleriyle bir grup karşılaştırır. Biz çiftlerinin her karşılaştırmak genel durumda, bu siteler arasında karşılaştırmalar (k gruplarının sayısı olduğu), ancak tedavide vs biz sadece yapacak durumda kontrol karşılaştırmalar. Tedavi ve kontrol gruplarının durumunda biz daha genel Tukey en ve Scheffé en yöntemleri kullanmak için olsaydı, bunlar gereksiz yere geniş güven aralıkları ile sonuçlanabilir. Dunnett testi dikkate dar güven aralıklarında verimli, kontrolüne karşı tedaviyi karşılaştıran özel yapısını alır. Diğer iki iki farklı ilaçlarla tedavi edildi iken kontrol olarak görev yaptı, bunlardan biri hayvanların üç gruba, kan sayımı ölçümlerinin karşılaştırılması örneğin, tıbbi deneylerde Dunnett testi kullanımı çok yaygındır. Bu yöntemin diğer bir yaygın kullanımı agronomist arasındadır: mühendisler mahsulün verimi üzerinde toprağa eklenmesi, belirli kimyasal maddelerin etkisini incelemek isteyebilir, böylece muamele edilmemiş bir takım planlar bırakmak (kontrol parselleri) ve kimyasal ilave edildi araziler ile karşılaştıracaktır toprak (tedavi araziler). ${\ Displaystyle k (k-1) {\ büyük /} 2}$ ${\ Displaystyle (k-1)},$

Dunnett testi biçimsel tanımı

Dunnett testi, bir işlem ile gerçekleştirilir Student t-testi ile istatistik tek bir kontrol grubuna göre tedavi grubu karşılaştırır, her deney, veya tedavisi grubu için. Her karşılaştırma ortak aynı kontrole sahip olduğundan, prosedür Bu karşılaştırmaların arasındaki bağımlılıkları içermektedir. Özellikle, T-istatistikleri Bütün (işleme ve kontrol) grupları arasında hata kareleri toplamı havuzu ile elde edilen hata varyans aynı tahmini elde edilir. Dunnett testi için resmi test istatistiği ya olup, bu T-istatistikleri (iki kuyruklu deney gerekli ise) mutlak değeri büyük ya da en olumsuz ya da t-istatistiği (bir kuyruklu deney ise, en olumlu gereklidir).

Dunnett testi biz kritik değerlerin ortak bir tabloyu kullanabilirsiniz, ancak daha esnek seçenekler gibi günümüzde birçok istatistik paketler halinde hazır olan R . Herhangi bir puanlık kritik değerler bağlıdır: Bir tek veya- iki kuyruklu testi olup olmadığı; gruplarının sayısı karşılaştırılan; çalışmalarda toplam sayısı.

Varsayımlar

Analiz deney sonuçları sayısal olduğu durumu dikkate alır ve deney bir kontrol grubu ile p uygulamalarını karşılaştırmak için gerçekleştirilir. Sonuçlar, bir dizi olarak özetlenebilir gözlemlerin setleri hesaplanan vasıtasıyla, olurken, tedavi atıfta ve gözlem kontrol grubuna değinmektedir, ve her bir ortak standart sapmanın bağımsız tahmindir gözlemlerin kümeleri. Tüm ait gözlemlerin setleri, bağımsız ve normal bir ortak ile dağıtılacak varsayılır Varyans ve araçlarla . Kullanılabilir bir tahmin olduğunu bir varsayım da vardır için . ${\ Displaystyle (p + 1)}$ ${\ Displaystyle ({\ çubuğu {X_ {0}}}, ..., {\ çubuğu {X_ {s}}})}$ ${\ Displaystyle ({\ çubuğu {X_ {1}}}, ..., {\ çubuğu {X_ {s}}})}$ ${\ Displaystyle {\ çubuğu {X_ {0}}}}$ ${\ Displaystyle s}$ ${\ Displaystyle p + 1}$ ${\ Displaystyle {\ çubuğu {X_ {i}}}}$ ${\ Displaystyle p + 1}$ ${\ Displaystyle \ sigma ^ {2}}$ ${\ Displaystyle \ u _ {i}}$ ${\ Displaystyle s ^ {2}}$ ${\ Displaystyle \ sigma ^ {2}}$

Hesaplama

Dunnett testin hesaplama doğru veya beklenen değerleri hakkında güven ifadeleri hesaplanması dayanan bir işlemdir farklılıklara , tedavi gruplarının ortalama ve kontrol grubunun ortalama arasındaki böylece farklılıkların. Bu prosedür, tüm olasılığı sağlar tablolar , aynı zamanda, doğru olarak belirtilen bir değere eşittir . Tek taraflı üst (veya daha düşük) hesaplanırken güven aralığını tedavisi ve ortalaması arasındaki farkın, gerçek değeri , kontrol grubunda , bu gerçek değeri sınırın (daha düşük ya da daha yüksek) üst daha az olması olasılığını teşkil bu aralığın. İki taraflı hesaplanırken güven aralığı , gerçek değer üst ve alt sınırlar arasında olacaktır olasılığını oluşturur. ${\ Displaystyle p}$ ${\ Displaystyle {\ çubuğu {X_ {i}}} - {\ çubuğu {X_ {0}}}}$ ${\ Displaystyle p}$ ${\ Displaystyle {\ çubuğu {X_ {i}}} - {\ çubuğu {X_ {0}}}}$ ${\ Displaystyle P}$ ${\ Displaystyle P}$ ${\ Displaystyle P}$

İlk olarak, tarafından temin N gözlemlerini belirtmek edecek ve ortak tahmin varyans örneğin,: ne zaman grubun ortalama olan ve gruptaki gözlem sayısıdır ve serbestlik derecesi. Daha önce de belirtildiği gibi, farklılıklar her biri için ayrı güven aralığı elde etmek istiyorum tüm olasılık şekilde güven aralıkları mukabil içerir eşittir . ${\ Displaystyle X_ {ij}}$ ${\ Displaystyle i = 1 ... p}$ ${\ Displaystyle j = 1 ... N_ {i}}$ ${\ Displaystyle s ^ {2} = {\ frac {\ toplamı _ {i = 0} ^ {s} \ toplamı _ {j = 1} ^ {N_ {i}} (X_ {ij} - {\ çubuğu { X_ {i}}}) ^ {2}} {n}}}$ ${\ Displaystyle {\ çubuğu {X_ {i}}}}$ ${\ Displaystyle ı}$ ${\ Displaystyle N_ {i}}$ ${\ Displaystyle ı}$ ${\ Displaystyle, n = \ toplamı _ {i = 0} ^ {s} N_ {i} - (p + 1)}$ ${\ Displaystyle m_ {I} -m_ {0}, (i = 1 ... p)}$ ${\ Displaystyle p}$ ${\ Displaystyle m_ {I} -m_ {0}}$ ${\ Displaystyle P}$

Biz orada genel durum dikkate alacaktır tedavi grupları ve bir kontrol grubu. Yazacağız: ${\ Displaystyle p}$

${\ Displaystyle Z_ {ı} = {\ cfrac {{\ çubuğu {X_ {i}}} - {\ çubuğu {X_ {0}}} - (m_ {I} -m_ {0})} {\ sqrt { {\ cfrac {1} {N_ {i}}} + {\ cfrac {1} {N_ {0}}}}}}}$

${\ Displaystyle D_ {ı} = {\ cfrac {{\ çubuğu {X_ {i}}} - {\ çubuğu {X_ {0}}} - (m_ {I} -m_ {0})} {s {\ sqrt {{\ cfrac {1} {N_ {i}}} + {\ cfrac {1} {N_ {0}}}}}}}}$

biz de yazacağız: aşağıdaki hangi Student t-istatistik n dağılımını serbestlik derecesine . Eklem güven katsayısı ile alt güven sınırları için tedavi etkileri tarafından verilecektir: ${\ Displaystyle D_ {ı} = {\ frac {Z_ {i}} {s}}}$ ${\ Displaystyle P}$ ${\ Displaystyle p}$ ${\ Displaystyle m_ {I} -m_ {0}, (i = 1 ... p)}$

${\ Displaystyle {\ çubuğu {X_ {i}}} - {\ çubuğu {X_ {0}}} - d_ {ı} 'nin {\ sqrt {{\ frac {1} {N_ {i}}} + { \ frac {1} {N_ {0}}}}} i = 1 ... p}$

ve sabitler , böylece seçilir . Benzer şekilde, üst limit ile verilecektir: ${\ Displaystyle p}$ ${\ Displaystyle d_ {I} '}$ ${\ Displaystyle Prob (t_ {1} <d_ {1} '..., t_ {s} <d_ {s}') = P}$

${\ Displaystyle {\ çubuğu {X_ {i}}} - {\ çubuğu {X_ {0}}} + d_ {ı} 'nin {\ sqrt {{\ frac {1} {N_ {i}}} + { \ frac {1} {N_ {0}}}}} i = 1 ... p}$

Sınırlayıcı için her iki yönde de aşağıdaki aralık alınabilir: ${\ Displaystyle m_ {I} -m_ {0}}$

${\ Displaystyle {\ çubuğu {X_ {i}}} - {\ çubuğu {X_ {0}}} \ am d_ {I} 'in {\ sqrt {{\ frac {1} {N_ {i}}} + {\ frac {1} {N_ {0}}}}} i = 1 ... p}$

ne zaman karşılamak için seçilir . Bu özel değerlerin çözüm , iki yönlü test için ve tek taraflı bir deney için tablolarda verilmiştir. Kritik değerler güncellenmiş tablo 1964 yılında yayınlanmıştır. ${\ Displaystyle d_ {I} ''}$ ${\ Displaystyle Prob (| t_ {1} | <d_ {1} '..., | t_ {s} | <d_ {s}') = P}$ ${\ Displaystyle d_ {I} ''}$ ${\ Displaystyle d_ {I} '}$

Örnekler

kumaşın yırtılma gücü kırılma

Aşağıdaki örnek, Villars [6] ile verilen bir uyarlanmıştır. Veri üretimi standart bir yönteme göre, üç farklı kimyasal işlem ile muamele edilmiş kumaşın kopma mukavemeti ile ilgili değerleri göstermektedir.

mukavemeti (lb). kırma
	standart	proses 1	işlem 2	işlem 3
	55	55	55	50
	47	64	49	44
	48	64	52	41
Anlamına geliyor	50	61	52	45
Varyans	19	27	9	21

Burada, p = 3 ve N = 3. Ortalama varyans serbestlik (p + 1) (n-1) = 8 ° ile dört setleri ortak varyans tahmini olan. Aşağıdaki gibi hesaplanabilir: ${\ Displaystyle s ^ {2} 19 =}$

${\ Displaystyle {\ frac {55 ^ {2} + 47 ^ {2} + 48 ^ {2} + 55 ^ {2} + ... + 41 ^ {2} -3 (50 ^ {2} +61 ^ {2} + 52 {2} + {2})} + {8}} = {\ frac {152} {8}}} 19 ^ = 45 ^$ .

Standart sapma ve iki aracı arasındaki farkın tahmini standart hatadır . ${\ Displaystyle s = {\ sqrt {19}} = 4.36}$ ${\ Displaystyle ait {\ sqrt {\ frac {2} + {N}}} = 4.36 {\ sqrt {\ frac {2} + {N}}} = 3.56}$

İlave edildi ve / veya çıkarılan araçları arasında gözlemlenen farkların kendi güven sınırlarını vermek için bir "yardımı" Tukey anılmıştır ve verilir gereken miktar T bir yan sınırları 1 ise Dunnett Tablo elde edilir, istenen ya da iki taraflı limitler istediği takdirde Dunnett Tablo 2'den. P = 3 ve df = 8 için, T P =% 95, iki taraflı sınırlar 2.42 bir yan sınırları ve t = 2.88 =. P =% 99 güven gerekli ise t benzer değerler tablolardan belirlenebilir. Tek taraflı limitler için, izin A = (2.42), (3.56) = 9 ve deneyi olduğu sonucuna varabiliriz: ${\ Displaystyle A = ts {\ sqrt {\ frac {2} + {N}}}}$

işlem 1 kullanılarak kırılma mukavemeti, en azından standart aşıyor ${\ Displaystyle 61-50-9 = £ 2}.$
Yöntem 2 kullanılarak kırılma mukavemeti, en azından standart aşıyor . ${\ Displaystyle 52-50-9 = -7lbs}$
İşlem 3 ile kırılma mukavemeti, en azından standart aşıyor . ${\ Displaystyle 45-50-9 = -14lbs}$

Yukarıdaki üç sonuçların oluşan ortak bildiride, uzun vadede, bu tür ortak ifadelerin% 95 aslında doğru olacaktır yani% 95, bir güven katsayısına sahiptir. Üç farklar için üst sınırlar benzer bir şekilde elde edilebilir. İki taraflı limitler için, izin A = (2.94), (3.56) 11 = ve deneyi olduğu sonucuna varabiliriz olduğu:

işlem 1 kullanılarak kırılma mukavemeti bir miktar arasında tarafından standart aşıyor

${\ Displaystyle 61-50-11 = 0lbs.}$ ve ${\ Displaystyle 61-50 + 11 = 22 lbs.}$

yöntem 2 kullanılarak kırılma mukavemeti bir miktar arasında tarafından standart aşıyor

${\ Displaystyle 52-50-11 = -9lbs}$ ve . ${\ Displaystyle 52-50 + 11 = 13lbs}$

işlem 3 ile kırılma mukavemeti bir miktar arasında tarafından standart aşıyor

${\ Displaystyle 45-50-11 = -16lbs}$ ve . Bu üç deyimi için ortak güven katsayısı% 95 daha büyüktür. (Elde gerçek p en Tablolar 1a ve işlem yapıldı 95 ve uyumu yer.Hiçbir% 99 biraz daha büyük olacak şekilde nedeniyle işlem Tablo 2a ve 2b de yapılan bir yaklaşımla, t tablo değerleri gerekli bir şekilde daha büyük olan 1b) . ${\ Displaystyle 45-50 + 11 = 6lbs}$

Referanslar

^ Upton G. & Cook I. (2006) İstatistik A Sözlük , 2e, Oxford University Press, Oxford, Birleşik Krallık.
^ Rumsey Deborah (2009-08-19). Aptallar için İstatistik II . Alındı 2012-08-22 .
^ Everett BS & Shrondal A. (2010) İstatistik Cambridge Sözlük , 4e, Cambridge University Press, Cambridge, Birleşik Krallık.
^ "İstatistiksel Yazılım | Kentucky Bilgi Teknoloji Üniversitesi" . Uky.edu . Alındı 2012-08-22 .
^ ^Bir ^b ^c ^d Dunnett CW (1955) "bir kontrol ile çeşitli tedaviler karşılaştırılması için bir çoklu karşılaştırma prosedürü", Amerikan İstatistik Derneği Dergisi , 50 : 1096-1121.
^ ^Bir ^B Dunnett CW (1964) "bir kontrol ile, çoklu karşılaştırmalar için yeni tablolar", Biometrics , 20 : 482-491.
^ ^Bir ^b ^c David C Howell, "Psikoloji İstatistiksel Yöntemler", 8th Ed.
^ Dunnett testi , Hyperstat Çevrimiçi: Bir Tanıtım İstatistik Ders Kitabı ve Online Eğitimi İstatistik Dersler Yardımı
^ Farklı Testlerin Mekaniği - Biyoistatistik BI 345 , Aziz Anselm Koleji

[1] Upton G. & Cook I. (2006) İstatistik A Sözlük , 2e, Oxford University Press, Oxford, Birleşik Krallık.

[2] Rumsey Deborah (2009-08-19). Aptallar için İstatistik II . Alındı 2012-08-22 .

[3] Everett BS & Shrondal A. (2010) İstatistik Cambridge Sözlük , 4e, Cambridge University Press, Cambridge, Birleşik Krallık.

[4] "İstatistiksel Yazılım | Kentucky Bilgi Teknoloji Üniversitesi" . Uky.edu . Alındı 2012-08-22 .

[original_article-5] Bir ^b ^c ^d Dunnett CW (1955) "bir kontrol ile çeşitli tedaviler karşılaştırılması için bir çoklu karşılaştırma prosedürü", Amerikan İstatistik Derneği Dergisi , 50 : 1096-1121.

[Dunnett_C._W._1964-6] Bir ^B Dunnett CW (1964) "bir kontrol ile, çoklu karşılaştırmalar için yeni tablolar", Biometrics , 20 : 482-491.

[howell-7] Bir ^b ^c David C Howell, "Psikoloji İstatistiksel Yöntemler", 8th Ed.

[8] Dunnett testi , Hyperstat Çevrimiçi: Bir Tanıtım İstatistik Ders Kitabı ve Online Eğitimi İstatistik Dersler Yardımı

[9] Farklı Testlerin Mekaniği - Biyoistatistik BI 345 , Aziz Anselm Koleji

Languages

In other projects