Dunnett testi - Dunnett's test

Gelen istatistik , Dunnett testi bir olan çoklu karşılaştırma Kanadalı istatistikçi tarafından geliştirilen prosedür Charles Dunnett tek kumanda ile tedavilerin bir takım birbiri ile karşılaştırılması için. Bir denetime Çoklu karşılaştırmalar da birçok bire bir karşılaştırma adlandırılır.

Tarihçe

Dunnett testi 1955 yılında geliştirildi; Kritik değerler güncelleştirilmiş tablo 1964 yılında yayınlanmıştır.

Çoklu Karşılaştırmalar Sorun

Bir eş zamanlı olarak istatistiksel çıkarımlar bir dizi dikkate veya gözlemlenen değerlere dayalı seçilen parametrelerden bir alt algılar zaman çoklu karşılaştırmalar, çokluk veya birden fazla test sorun oluşur. Çoklu karşılaştırma yöntemlerinin herhangi tartışmada büyük sorun Tip I hatalarının olasılık sorudur. Alternatif teknikler arasında en farklılıklar bu hataları nasıl kontrol edileceği sorusuna farklı yaklaşımlar sonucu. Sorun teknik kısmında bulunur; ama gerçekten çok daha hata oranını tanımlamak istiyorum nasıl öznel bir soru ne kadar büyük maksimum olası hata oranı olalım istekli olduğunu. Dunnett testi iyi bilinmektedir ve yaygın olarak eş zamanlı aralık tahminine veya hipotez testi, normallik varsayımı uygun bir dağılım numune bir kontrol ile tüm aktif tedavi ile karşılaştırılması için çoklu karşılaştırma prosedüründe kullanılmaktadır. Dunnett testi tutmak için tasarlanmıştır Familywise hata oranı veya altında kontrolü ile tedavi grubunda birden fazla karşılaştırmalar yaparken.

Dunnett testinin kullanır

Çoklu Karşılaştırmalar problem üzerinde özgün eser tarafından yapıldı Tukey ve Scheffe . Bu yöntem kili karşılaştırmalar her türlü kabul genel biriydi. Tukey en ve Scheffe en yöntemleri örnek araçlarla bir dizi arasındaki karşılaştırmalar herhangi bir sayıda izin verir. Tek bir kontrol grubu ile çoklu tedavi gruplarının kili karşılaştırmalar - Öte yandan, Dunnett testi sadece çoklu karşılaştırmalar sorun özel bir durumu ele diğerleriyle bir grup karşılaştırır. Biz çiftlerinin her karşılaştırmak genel durumda, bu siteler arasında karşılaştırmalar (k gruplarının sayısı olduğu), ancak tedavide vs biz sadece yapacak durumda kontrol karşılaştırmalar. Tedavi ve kontrol gruplarının durumunda biz daha genel Tukey en ve Scheffé en yöntemleri kullanmak için olsaydı, bunlar gereksiz yere geniş güven aralıkları ile sonuçlanabilir. Dunnett testi dikkate dar güven aralıklarında verimli, kontrolüne karşı tedaviyi karşılaştıran özel yapısını alır. Diğer iki iki farklı ilaçlarla tedavi edildi iken kontrol olarak görev yaptı, bunlardan biri hayvanların üç gruba, kan sayımı ölçümlerinin karşılaştırılması örneğin, tıbbi deneylerde Dunnett testi kullanımı çok yaygındır. Bu yöntemin diğer bir yaygın kullanımı agronomist arasındadır: mühendisler mahsulün verimi üzerinde toprağa eklenmesi, belirli kimyasal maddelerin etkisini incelemek isteyebilir, böylece muamele edilmemiş bir takım planlar bırakmak (kontrol parselleri) ve kimyasal ilave edildi araziler ile karşılaştıracaktır toprak (tedavi araziler).

Dunnett testi biçimsel tanımı

Dunnett testi, bir işlem ile gerçekleştirilir Student t-testi ile istatistik tek bir kontrol grubuna göre tedavi grubu karşılaştırır, her deney, veya tedavisi grubu için. Her karşılaştırma ortak aynı kontrole sahip olduğundan, prosedür Bu karşılaştırmaların arasındaki bağımlılıkları içermektedir. Özellikle, T-istatistikleri Bütün (işleme ve kontrol) grupları arasında hata kareleri toplamı havuzu ile elde edilen hata varyans aynı tahmini elde edilir. Dunnett testi için resmi test istatistiği ya olup, bu T-istatistikleri (iki kuyruklu deney gerekli ise) mutlak değeri büyük ya da en olumsuz ya da t-istatistiği (bir kuyruklu deney ise, en olumlu gereklidir).

Dunnett testi biz kritik değerlerin ortak bir tabloyu kullanabilirsiniz, ancak daha esnek seçenekler gibi günümüzde birçok istatistik paketler halinde hazır olan R . Herhangi bir puanlık kritik değerler bağlıdır: Bir tek veya- iki kuyruklu testi olup olmadığı; gruplarının sayısı karşılaştırılan; çalışmalarda toplam sayısı.

Varsayımlar

Analiz deney sonuçları sayısal olduğu durumu dikkate alır ve deney bir kontrol grubu ile p uygulamalarını karşılaştırmak için gerçekleştirilir. Sonuçlar, bir dizi olarak özetlenebilir gözlemlerin setleri hesaplanan vasıtasıyla, olurken, tedavi atıfta ve gözlem kontrol grubuna değinmektedir, ve her bir ortak standart sapmanın bağımsız tahmindir gözlemlerin kümeleri. Tüm ait gözlemlerin setleri, bağımsız ve normal bir ortak ile dağıtılacak varsayılır Varyans ve araçlarla . Kullanılabilir bir tahmin olduğunu bir varsayım da vardır için .

Hesaplama

Dunnett testin hesaplama doğru veya beklenen değerleri hakkında güven ifadeleri hesaplanması dayanan bir işlemdir farklılıklara , tedavi gruplarının ortalama ve kontrol grubunun ortalama arasındaki böylece farklılıkların. Bu prosedür, tüm olasılığı sağlar tablolar , aynı zamanda, doğru olarak belirtilen bir değere eşittir . Tek taraflı üst (veya daha düşük) hesaplanırken güven aralığını tedavisi ve ortalaması arasındaki farkın, gerçek değeri , kontrol grubunda , bu gerçek değeri sınırın (daha düşük ya da daha yüksek) üst daha az olması olasılığını teşkil bu aralığın. İki taraflı hesaplanırken güven aralığı , gerçek değer üst ve alt sınırlar arasında olacaktır olasılığını oluşturur.

İlk olarak, tarafından temin N gözlemlerini belirtmek edecek ve ortak tahmin varyans örneğin,: ne zaman grubun ortalama olan ve gruptaki gözlem sayısıdır ve serbestlik derecesi. Daha önce de belirtildiği gibi, farklılıklar her biri için ayrı güven aralığı elde etmek istiyorum tüm olasılık şekilde güven aralıkları mukabil içerir eşittir .

Biz orada genel durum dikkate alacaktır tedavi grupları ve bir kontrol grubu. Yazacağız:

biz de yazacağız: aşağıdaki hangi Student t-istatistik n dağılımını serbestlik derecesine . Eklem güven katsayısı ile alt güven sınırları için tedavi etkileri tarafından verilecektir:

ve sabitler , böylece seçilir . Benzer şekilde, üst limit ile verilecektir:

Sınırlayıcı için her iki yönde de aşağıdaki aralık alınabilir:

ne zaman karşılamak için seçilir . Bu özel değerlerin çözüm , iki yönlü test için ve tek taraflı bir deney için tablolarda verilmiştir. Kritik değerler güncellenmiş tablo 1964 yılında yayınlanmıştır.

Örnekler

kumaşın yırtılma gücü kırılma

Aşağıdaki örnek, Villars [6] ile verilen bir uyarlanmıştır. Veri üretimi standart bir yönteme göre, üç farklı kimyasal işlem ile muamele edilmiş kumaşın kopma mukavemeti ile ilgili değerleri göstermektedir.

mukavemeti (lb). kırma
standart proses 1 işlem 2 işlem 3
55 55 55 50
47 64 49 44
48 64 52 41
Anlamına geliyor 50 61 52 45
Varyans 19 27 9 21

Burada, p = 3 ve N = 3. Ortalama varyans serbestlik (p + 1) (n-1) = 8 ° ile dört setleri ortak varyans tahmini olan. Aşağıdaki gibi hesaplanabilir:

.

Standart sapma ve iki aracı arasındaki farkın tahmini standart hatadır .

İlave edildi ve / veya çıkarılan araçları arasında gözlemlenen farkların kendi güven sınırlarını vermek için bir "yardımı" Tukey anılmıştır ve verilir gereken miktar T bir yan sınırları 1 ise Dunnett Tablo elde edilir, istenen ya da iki taraflı limitler istediği takdirde Dunnett Tablo 2'den. P = 3 ve df = 8 için, T P =% 95, iki taraflı sınırlar 2.42 bir yan sınırları ve t = 2.88 =. P =% 99 güven gerekli ise t benzer değerler tablolardan belirlenebilir. Tek taraflı limitler için, izin A = (2.42), (3.56) = 9 ve deneyi olduğu sonucuna varabiliriz:

  • işlem 1 kullanılarak kırılma mukavemeti, en azından standart aşıyor
  • Yöntem 2 kullanılarak kırılma mukavemeti, en azından standart aşıyor .
  • İşlem 3 ile kırılma mukavemeti, en azından standart aşıyor .

Yukarıdaki üç sonuçların oluşan ortak bildiride, uzun vadede, bu tür ortak ifadelerin% 95 aslında doğru olacaktır yani% 95, bir güven katsayısına sahiptir. Üç farklar için üst sınırlar benzer bir şekilde elde edilebilir. İki taraflı limitler için, izin A = (2.94), (3.56) 11 = ve deneyi olduğu sonucuna varabiliriz olduğu:

  • işlem 1 kullanılarak kırılma mukavemeti bir miktar arasında tarafından standart aşıyor

ve

  • yöntem 2 kullanılarak kırılma mukavemeti bir miktar arasında tarafından standart aşıyor

ve .

  • işlem 3 ile kırılma mukavemeti bir miktar arasında tarafından standart aşıyor

ve . Bu üç deyimi için ortak güven katsayısı% 95 daha büyüktür. (Elde gerçek p en Tablolar 1a ve işlem yapıldı 95 ve uyumu yer.Hiçbir% 99 biraz daha büyük olacak şekilde nedeniyle işlem Tablo 2a ve 2b de yapılan bir yaklaşımla, t tablo değerleri gerekli bir şekilde daha büyük olan 1b) .

Referanslar

  1. ^ Upton G. & Cook I. (2006) İstatistik A Sözlük , 2e, Oxford University Press, Oxford, Birleşik Krallık.
  2. ^ Rumsey Deborah (2009-08-19). Aptallar için İstatistik II . Alındı 2012-08-22 .
  3. ^ Everett BS & Shrondal A. (2010) İstatistik Cambridge Sözlük , 4e, Cambridge University Press, Cambridge, Birleşik Krallık.
  4. ^ "İstatistiksel Yazılım | Kentucky Bilgi Teknoloji Üniversitesi" . Uky.edu . Alındı 2012-08-22 .
  5. ^ Bir b c d Dunnett CW (1955) "bir kontrol ile çeşitli tedaviler karşılaştırılması için bir çoklu karşılaştırma prosedürü", Amerikan İstatistik Derneği Dergisi , 50 : 1096-1121.
  6. ^ Bir B Dunnett CW (1964) "bir kontrol ile, çoklu karşılaştırmalar için yeni tablolar", Biometrics , 20 : 482-491.
  7. ^ Bir b c David C Howell, "Psikoloji İstatistiksel Yöntemler", 8th Ed.
  8. ^ Dunnett testi , Hyperstat Çevrimiçi: Bir Tanıtım İstatistik Ders Kitabı ve Online Eğitimi İstatistik Dersler Yardımı
  9. ^ Farklı Testlerin Mekaniği - Biyoistatistik BI 345 , Aziz Anselm Koleji