Parametrik olmayan istatistikler - Nonparametric statistics

Parametrik olmayan istatistikler dalıdır istatistiklerine dayanarak yapıldığı edilmez parametrize ailelerine olasılık dağılımları (parametrelerin yaygın örneği ortalama ve varyans vardır). Parametrik olmayan istatistikler, dağıtımdan bağımsız olmaya veya belirli bir dağılıma sahip olmaya, ancak dağıtımın parametreleri belirtilmemiş olmasına dayanır . Parametrik olmayan istatistik içerir tanımlayıcı istatistikler ve istatistiksel çıkarım . Parametrik olmayan testler genellikle parametrik testlerin varsayımları ihlal edildiğinde kullanılır.

Tanımlar

"Parametrik olmayan istatistikler" terimi, diğerlerinin yanı sıra aşağıdaki iki şekilde kesin olarak tanımlanmıştır.

  1. Parametrik olmayanın ilk anlamı, herhangi bir özel parametrik olasılık dağılım ailesine ait verilere dayanmayan teknikleri kapsar.

    Bunlar, diğerleri arasında şunları içerir:

    Gözlem sıralarına dayanan sıra istatistikleri , bu tür istatistiklere bir örnektir.

    Aşağıdaki tartışma Kendall'dan alınmıştır .

    İstatistiksel hipotezler, gözlemlenebilir rastgele değişkenlerin davranışıyla ilgilidir .... Örneğin, hipotez (a) normal bir dağılımın belirli bir ortalamaya sahip olduğu ve varyansın istatistiksel olduğu; (b) hipotezi de (b) belirli bir ortalamaya sahip ancak belirlenmemiş bir varyansa sahiptir; (c) hipotezi de, bir dağılımın hem ortalama hem de varyans belirtilmemiş normal formdadır; son olarak, iki belirtilmemiş sürekli dağılımın özdeş olduğu hipotezi (d) de öyledir.

    (A) ve (b) örneklerinde gözlemlerin altında yatan dağılımın belirli bir biçimde (normal) olduğu ve hipotezin tamamen parametrelerinden birinin veya her ikisinin değeriyle ilgili olduğu fark edilecektir. Açık nedenlerden dolayı böyle bir hipoteze parametrik denir .

    Hipotezin açıklamasında hiçbir parametre değeri belirtilmediğinden, hipotez (c) farklı bir nitelikteydi; makul olarak böyle bir hipotezi parametrik olmayan olarak adlandırabiliriz . Hipotez (d) de parametrik değildir, ancak buna ek olarak, dağıtımın temelini oluşturan formu bile belirtmez ve artık makul bir şekilde dağıtımdan bağımsız olarak adlandırılabilir . Bu ayrımlara rağmen, istatistiksel literatür artık "non-parametrik" etiketini, az önce "dağıtımdan bağımsız" olarak adlandırdığımız test prosedürlerine uygulamakta ve böylece yararlı bir sınıflandırmayı kaybetmektedir.

  2. Parametrik olmayanın ikinci anlamı, bir modelin yapısının sabit olduğunu varsaymayan teknikleri kapsar . Tipik olarak model, verilerin karmaşıklığına uyum sağlamak için boyut olarak büyür. Bu tekniklerde, bireysel değişkenler vardır genellikle parametrik dağılımları ait olduğu varsayılır ve değişkenler arası bağlantıların türleri hakkında varsayımlar da yapılır. Bu teknikler, diğerleri arasında şunları içerir:
    • parametrik olmayan regresyon , değişkenler arasındaki ilişkinin yapısının parametrik olmayan bir şekilde ele alındığı modelleme, ancak yine de model artıklarının dağılımı hakkında parametrik varsayımlar olabilir.
    • Dirichlet sürecine dayalı modeller gibi parametrik olmayan hiyerarşik Bayes modelleri , gizli değişkenlerin sayısının verilere uymak için gerektiği kadar artmasına izin verir , ancak bireysel değişkenler hala parametrik dağılımları ve hatta büyüme oranını kontrol eden süreci takip eder. gizli değişkenler parametrik bir dağılımı takip eder.

Uygulamalar ve amaç

Parametrik olmayan yöntemler, sıralı bir sıraya sahip olan popülasyonları incelemek için yaygın olarak kullanılmaktadır (bir ila dört yıldız alan film incelemeleri gibi). Parametrik olmayan yöntemlerin kullanılması, verilerin bir sıralaması olduğunda ancak tercihleri değerlendirirken olduğu gibi net bir sayısal yorum bulunmadığında gerekli olabilir . Ölçüm seviyeleri açısından, parametrik olmayan yöntemler sıralı verilerle sonuçlanır .

Parametrik olmayan yöntemler daha az varsayım yaptığından, uygulanabilirliği karşılık gelen parametrik yöntemlerden çok daha geniştir. Özellikle söz konusu uygulama hakkında daha az bilindiği durumlarda uygulanabilir. Ayrıca, daha az varsayıma güvenilmesi nedeniyle parametrik olmayan yöntemler daha sağlamdır .

Parametrik olmayan yöntemlerin kullanımının bir başka gerekçesi de basitliktir. Bazı durumlarda, parametrik yöntemlerin kullanımı gerekçelendirilse bile, parametrik olmayan yöntemlerin kullanımı daha kolay olabilir. Hem bu basitlik hem de daha sağlam olmaları nedeniyle, parametrik olmayan yöntemler bazı istatistikçiler tarafından yanlış kullanım ve yanlış anlama için daha az alan bırakıyor olarak görülmektedir.

Parametrik olmayan testlerin daha geniş uygulanabilirliği ve artan sağlamlığının bir bedeli vardır: parametrik bir testin uygun olacağı durumlarda, parametrik olmayan testler daha az güce sahiptir . Başka bir deyişle, aynı derecede güvenle sonuç çıkarmak için daha büyük bir örneklem büyüklüğü gerekebilir.

Parametrik olmayan modeller

Parametrik olmayan modeller farklı parametrik model yapısı belirtilen olmadığını modelleri önsel ancak bunun yerine verilerden belirlenir. Parametrik olmayan terimi , bu tür modellerin tamamen parametrelerden yoksun olduğu anlamına gelmez, ancak parametrelerin sayısının ve doğasının esnek olduğunu ve önceden sabitlenmediğini ifade eder.

Yöntemler

Parametrik olmayan (veya dağılımdan bağımsız ) çıkarımsal istatistiksel yöntemler , parametrik istatistiklerin aksine , değerlendirilen değişkenlerin olasılık dağılımları hakkında hiçbir varsayımda bulunmayan istatistiksel hipotez testi için matematiksel prosedürlerdir . En sık kullanılan testler şunları içerir:

Tarih

Erken parametrik olmayan istatistikler arasında medyan (13. yüzyıl veya öncesi, Edward Wright tarafından tahmini kullanım , 1599; bkz. Medyan § Tarih ) ve doğumda insan cinsiyet oranının analizinde John Arbuthnot (1710) tarafından yapılan işaret testi (bkz. İşaret testi § Tarih ).

Ayrıca bakınız

Notlar

Genel referanslar