Parametrik olmayan istatistikler - Nonparametric statistics
Parametrik olmayan istatistikler dalıdır istatistiklerine dayanarak yapıldığı edilmez parametrize ailelerine olasılık dağılımları (parametrelerin yaygın örneği ortalama ve varyans vardır). Parametrik olmayan istatistikler, dağıtımdan bağımsız olmaya veya belirli bir dağılıma sahip olmaya, ancak dağıtımın parametreleri belirtilmemiş olmasına dayanır . Parametrik olmayan istatistik içerir tanımlayıcı istatistikler ve istatistiksel çıkarım . Parametrik olmayan testler genellikle parametrik testlerin varsayımları ihlal edildiğinde kullanılır.
Tanımlar
"Parametrik olmayan istatistikler" terimi, diğerlerinin yanı sıra aşağıdaki iki şekilde kesin olarak tanımlanmıştır.
- Parametrik olmayanın ilk anlamı, herhangi bir özel parametrik olasılık dağılım ailesine ait verilere dayanmayan teknikleri kapsar.
Bunlar, diğerleri arasında şunları içerir:
- Verilerin belirli bir parametrik olasılık dağılımları ailesinden alındığı varsayımlarına dayanmayan dağıtımdan bağımsız yöntemler . Bu nedenle parametrik istatistiğin tam tersidir .
- parametrik olmayan istatistikler ( istatistik , bir örnek üzerinde bir fonksiyon olarak tanımlanır; bir parametreye bağımlılık yoktur ).
Gözlem sıralarına dayanan sıra istatistikleri , bu tür istatistiklere bir örnektir.
Aşağıdaki tartışma Kendall'dan alınmıştır .
İstatistiksel hipotezler, gözlemlenebilir rastgele değişkenlerin davranışıyla ilgilidir .... Örneğin, hipotez (a) normal bir dağılımın belirli bir ortalamaya sahip olduğu ve varyansın istatistiksel olduğu; (b) hipotezi de (b) belirli bir ortalamaya sahip ancak belirlenmemiş bir varyansa sahiptir; (c) hipotezi de, bir dağılımın hem ortalama hem de varyans belirtilmemiş normal formdadır; son olarak, iki belirtilmemiş sürekli dağılımın özdeş olduğu hipotezi (d) de öyledir.
(A) ve (b) örneklerinde gözlemlerin altında yatan dağılımın belirli bir biçimde (normal) olduğu ve hipotezin tamamen parametrelerinden birinin veya her ikisinin değeriyle ilgili olduğu fark edilecektir. Açık nedenlerden dolayı böyle bir hipoteze parametrik denir .
Hipotezin açıklamasında hiçbir parametre değeri belirtilmediğinden, hipotez (c) farklı bir nitelikteydi; makul olarak böyle bir hipotezi parametrik olmayan olarak adlandırabiliriz . Hipotez (d) de parametrik değildir, ancak buna ek olarak, dağıtımın temelini oluşturan formu bile belirtmez ve artık makul bir şekilde dağıtımdan bağımsız olarak adlandırılabilir . Bu ayrımlara rağmen, istatistiksel literatür artık "non-parametrik" etiketini, az önce "dağıtımdan bağımsız" olarak adlandırdığımız test prosedürlerine uygulamakta ve böylece yararlı bir sınıflandırmayı kaybetmektedir.
- Parametrik olmayanın ikinci anlamı, bir modelin yapısının sabit olduğunu varsaymayan teknikleri kapsar . Tipik olarak model, verilerin karmaşıklığına uyum sağlamak için boyut olarak büyür. Bu tekniklerde, bireysel değişkenler vardır genellikle parametrik dağılımları ait olduğu varsayılır ve değişkenler arası bağlantıların türleri hakkında varsayımlar da yapılır. Bu teknikler, diğerleri arasında şunları içerir:
- parametrik olmayan regresyon , değişkenler arasındaki ilişkinin yapısının parametrik olmayan bir şekilde ele alındığı modelleme, ancak yine de model artıklarının dağılımı hakkında parametrik varsayımlar olabilir.
- Dirichlet sürecine dayalı modeller gibi parametrik olmayan hiyerarşik Bayes modelleri , gizli değişkenlerin sayısının verilere uymak için gerektiği kadar artmasına izin verir , ancak bireysel değişkenler hala parametrik dağılımları ve hatta büyüme oranını kontrol eden süreci takip eder. gizli değişkenler parametrik bir dağılımı takip eder.
Uygulamalar ve amaç
Parametrik olmayan yöntemler, sıralı bir sıraya sahip olan popülasyonları incelemek için yaygın olarak kullanılmaktadır (bir ila dört yıldız alan film incelemeleri gibi). Parametrik olmayan yöntemlerin kullanılması, verilerin bir sıralaması olduğunda ancak tercihleri değerlendirirken olduğu gibi net bir sayısal yorum bulunmadığında gerekli olabilir . Ölçüm seviyeleri açısından, parametrik olmayan yöntemler sıralı verilerle sonuçlanır .
Parametrik olmayan yöntemler daha az varsayım yaptığından, uygulanabilirliği karşılık gelen parametrik yöntemlerden çok daha geniştir. Özellikle söz konusu uygulama hakkında daha az bilindiği durumlarda uygulanabilir. Ayrıca, daha az varsayıma güvenilmesi nedeniyle parametrik olmayan yöntemler daha sağlamdır .
Parametrik olmayan yöntemlerin kullanımının bir başka gerekçesi de basitliktir. Bazı durumlarda, parametrik yöntemlerin kullanımı gerekçelendirilse bile, parametrik olmayan yöntemlerin kullanımı daha kolay olabilir. Hem bu basitlik hem de daha sağlam olmaları nedeniyle, parametrik olmayan yöntemler bazı istatistikçiler tarafından yanlış kullanım ve yanlış anlama için daha az alan bırakıyor olarak görülmektedir.
Parametrik olmayan testlerin daha geniş uygulanabilirliği ve artan sağlamlığının bir bedeli vardır: parametrik bir testin uygun olacağı durumlarda, parametrik olmayan testler daha az güce sahiptir . Başka bir deyişle, aynı derecede güvenle sonuç çıkarmak için daha büyük bir örneklem büyüklüğü gerekebilir.
Parametrik olmayan modeller
Parametrik olmayan modeller farklı parametrik model yapısı belirtilen olmadığını modelleri önsel ancak bunun yerine verilerden belirlenir. Parametrik olmayan terimi , bu tür modellerin tamamen parametrelerden yoksun olduğu anlamına gelmez, ancak parametrelerin sayısının ve doğasının esnek olduğunu ve önceden sabitlenmediğini ifade eder.
- Bir Histogram bir olasılık dağılımının basit bir parametrik olmayan bir tahmindir.
- Çekirdek yoğunluğu tahmini , histogramlardan daha iyi yoğunluk tahminleri sağlar.
- Parametrik olmayan regresyon ve yarı parametrik regresyon yöntemleri çekirdeklere , spline'lara ve dalgacıklara dayalı olarak geliştirilmiştir .
- Veri zarflama analizi , herhangi bir dağıtım varsayımı olmaksızın çok değişkenli analizle elde edilenlere benzer verimlilik katsayıları sağlar .
- KNN'ler , görünmeyen örneği, ona en yakın olan eğitim kümesindeki K noktalarına göre sınıflandırır.
- Bir destek vektör makinesi (Gauss çekirdeğine sahip), parametrik olmayan bir geniş marjlı sınıflandırıcıdır.
- Moment yöntemi polinom olasılık dağılımları ile.
Yöntemler
Parametrik olmayan (veya dağılımdan bağımsız ) çıkarımsal istatistiksel yöntemler , parametrik istatistiklerin aksine , değerlendirilen değişkenlerin olasılık dağılımları hakkında hiçbir varsayımda bulunmayan istatistiksel hipotez testi için matematiksel prosedürlerdir . En sık kullanılan testler şunları içerir:
- Benzerliklerin analizi
- Anderson-Darling testi : belirli bir dağılımdan bir örneğin çekilip çekilmediğini test eder
- İstatistiksel önyükleme yöntemleri : bir istatistiğin doğruluğunu / örnekleme dağılımını tahmin eder
- Cochran'ın Q'su : 0/1 sonuçları olan randomize blok tasarımlarında k işleminin aynı etkilere sahip olup olmadığını test eder
- Cohen'in kappa : kategorik öğeler için değerlendiriciler arası anlaşmayı ölçer
- Derecelere göre Friedman iki yönlü varyans analizi : randomize blok tasarımlarında k işleminin aynı etkilere sahip olup olmadığını test eder
- Kaplan – Meier : sansür modelleme, yaşam boyu verilerden sağkalım işlevini tahmin eder
- Kendall'ın tau : iki değişken arasındaki istatistiksel bağımlılığı ölçer
- Kendall'ın W'si : Değerlendiriciler arası anlaşmanın 0 ile 1 arasında bir ölçü
- Kolmogorov-Smirnov testi : belirli bir dağılımdan bir numunenin çekilip çekilmediğini veya aynı dağılımdan iki numunenin çekilip çekilmediğini test eder
- Kruskal – Wallis derecelere göre tek yönlü varyans analizi : aynı dağılımdan> 2 bağımsız örneğin çekilip çekilmediğini test eder
- Kuiper'in testi : bir numunenin belirli bir dağılımdan çekilip çekilmediğini test eder, haftanın günü gibi döngüsel değişikliklere duyarlıdır.
- Logrank testi : Sağ eğimli , sansürlenmiş iki örneğin hayatta kalma dağılımlarını karşılaştırır
- Mann-Whitney U veya Wilcoxon sıra toplamı testi: verilen bir alternatif hipoteze kıyasla aynı dağılımdan iki örneğin çekilip çekilmediğini test eder.
- McNemar testi : ikili bir özellik ve eşleşen denek çiftlerine sahip 2 × 2 olasılık tablolarında, satır ve sütun marjinal frekanslarının eşit olup olmadığını test eder.
- Medyan testi : Eşit medyanlara sahip dağılımlardan iki örneğin çekilip çekilmediğini test eder
- Pitman permütasyon testi : etiketlerin tüm olası yeniden düzenlemelerini inceleyerek kesin p değerleri veren istatistiksel bir anlamlılık testi
- Sıralama ürünleri : çoğaltılmış mikroarray deneylerinde farklı şekilde ifade edilen genleri algılar
- Siegel-Tukey testi : iki grup arasındaki ölçek farklılıkları için testler
- İşaret testi : Eşleştirilmiş çift örneklerin eşit medyanlara sahip dağılımlardan çekilip çekilmediğini test eder
- Spearman sıra korelasyon katsayısı : monoton bir işlev kullanarak iki değişken arasındaki istatistiksel bağımlılığı ölçer
- Kare sıra testi : iki veya daha fazla örnekte varyansların eşitliğini test eder
- Tukey – Duckworth testi : sıraları kullanarak iki dağılımın eşitliğini test eder
- Wald – Wolfowitz test çalıştırır : bir dizinin elemanlarının karşılıklı olarak bağımsız / rastgele olup olmadığını test eder
- Wilcoxon işaretli sıra testi : eşleşen çift örneklemlerin farklı ortalama sıralamalara sahip popülasyonlardan çekilip çekilmediğini test eder
Tarih
Erken parametrik olmayan istatistikler arasında medyan (13. yüzyıl veya öncesi, Edward Wright tarafından tahmini kullanım , 1599; bkz. Medyan § Tarih ) ve doğumda insan cinsiyet oranının analizinde John Arbuthnot (1710) tarafından yapılan işaret testi (bkz. İşaret testi § Tarih ).
Ayrıca bakınız
- CDF tabanlı parametrik olmayan güven aralığı
- Parametrik istatistikler
- Yeniden örnekleme (istatistikler)
- Yarı parametrik model
Notlar
Genel referanslar
- Bagdonavicius, V., Kruopis, J., Nikulin, MS (2011). "Tam veriler için parametrik olmayan testler", ISTE & WILEY: London & Hoboken. Mayıs ISBN 978-1-84821-269-5 .
- Corder, GW; Foreman, DI (2014). Parametrik Olmayan İstatistikler: Adım Adım Yaklaşım . Wiley. ISBN 978-1118840313 .
- Gibbons, Jean Dickinson ; Chakraborti, Subhabrata (2003). Parametrik Olmayan İstatistiksel Çıkarım , 4. Baskı. CRC Basın. ISBN 0-8247-4052-1 .
- Hettmansperger, T. P .; McKean, J.W. (1998). Sağlam Parametrik Olmayan İstatistiksel Yöntemler . Kendall'ın İstatistik Kitaplığı. 5 (İlk baskı). Londra: Edward Arnold . New York: John Wiley & Sons. ISBN 0-340-54937-8 . MR 1604954 . ayrıca ISBN 0-471-19479-4 .
- Hollander M., Wolfe DA, Tavuk E. (2014). Parametrik Olmayan İstatistiksel Yöntemler , John Wiley & Sons.
- Sheskin, David J. (2003) Handbook of Parametric and Nonparametric Statistical Procedures . CRC Basın. ISBN 1-58488-440-1
- Wasserman Larry (2007). Tüm Parametrik Olmayan İstatistikler , Springer. ISBN 0-387-25145-6 .