Model seçimi - Model selection

Model seçimi , veri verilen bir dizi aday modelden istatistiksel bir model seçme görevidir . En basit durumlarda, önceden var olan bir veri kümesi dikkate alınır. Ancak, görev de içerebilir deneylerin tasarımı şekilde toplanan veriler modeli seçimi sorununa çok uygundur. Benzer tahmin veya açıklama gücüne sahip aday modeller verildiğinde, en basit modelin en iyi seçim olması muhtemeldir ( Occam'ın usturası ).

Konishi & Kitagawa (2008 , s. 75) " İstatistiksel çıkarımdaki problemlerin çoğunluğu istatistiksel modelleme ile ilgili problemler olarak kabul edilebilir" demektedir. Bununla ilgili olarak Cox (2006 , s. 197), "Konu probleminden istatistiksel modele çevirinin nasıl yapıldığı genellikle bir analizin en kritik kısmıdır" demiştir .

Model seçimi, belirsizlik altında karar verme veya optimizasyon amacıyla geniş bir hesaplamalı model kümesinden birkaç temsili model seçme sorununa da işaret edebilir .

Giriş

Bilimsel gözlem döngüsü.

En temel biçimlerinde model seçimi, bilimsel araştırmanın temel görevlerinden biridir . Bir dizi gözlemi açıklayan ilkenin belirlenmesi, genellikle bu gözlemleri öngören matematiksel bir modelle doğrudan bağlantılıdır. Örneğin, Galileo onun gerçekleştirilen eğik düzlem deneyleri, o topları hareketi yaptığı model tarafından tahmin parabol donatılmış olduğunu göstermiştir.

Verileri üretebilecek sayısız olası mekanizma ve süreç arasından en iyi modeli seçmeye nasıl başlanabilir? Yaygın olarak benimsenen matematiksel yaklaşım, bir dizi aday model arasında karar verir; bu set araştırmacı tarafından seçilmelidir. Genellikle , en azından başlangıçta, polinomlar gibi basit modeller kullanılır. Burnham ve Anderson (2002) , kitaplarında, verilerin altında yatan fenomenolojik süreçlerin veya mekanizmaların (örneğin, kimyasal reaksiyonlar) anlaşılması gibi sağlam bilimsel ilkelere dayalı modeller seçmenin önemini vurgular.

Aday modeller bir kez seçildikten sonra, istatistiksel analiz bu modellerin en iyisini seçmemizi sağlar. En iyi ile kastedilen şey tartışmalıdır. İyi bir model seçim tekniği , uyumun iyiliği ile basitliği dengeleyecektir . Daha karmaşık modeller, şekillerini verilere uyacak şekilde daha iyi uyarlayabilecektir (örneğin, beşinci dereceden bir polinom altı noktaya tam olarak uyabilir), ancak ek parametreler yararlı hiçbir şeyi temsil etmeyebilir. (Belki de bu altı nokta bir düz çizgi etrafında gerçekten rastgele dağılmıştır.) Uyum iyiliği genellikle bir olabilirlik oranı yaklaşımı veya bunun bir tahmini kullanılarak belirlenir ve bir ki-kare testine yol açar . Karmaşıklık genellikle modeldeki parametre sayısı sayılarak ölçülür .

Model seçim teknikleri , verilen verileri üreten modelin olasılığı gibi bazı fiziksel niceliklerin tahmin edicileri olarak düşünülebilir . Önyargı ve varyans bu tahmincisi kalitesinin ikisi de önemli önlemlerdir; verimlilik de sıklıkla düşünülür.

Model seçimi standart bir örnek olmasıdır eğri uydurma noktaları ve diğer arka plan bilgisi bir dizi (örneğin, noktalar bir sonucudur verilen, IID örnekleri), biz noktaları oluşturulan bu işlevi tanımlayan bir eğri seçmek gerekir.

Model seçiminin iki yönü

Çıkarsama ve verilerden öğrenmede iki temel amaç vardır. Biri bilimsel keşif, temel veri üretme mekanizmasının anlaşılması ve verilerin doğasının yorumlanması içindir. Verilerden öğrenmenin bir başka amacı da gelecekteki veya görünmeyen gözlemleri tahmin etmektir. İkinci hedefte, veri bilimcisi, verilerin kesin bir olasılıksal açıklamasıyla ilgilenmez. Elbette her iki yöne de ilgi duyulabilir.

İki farklı amaç doğrultusunda, model seçiminin iki yönü de olabilir: çıkarım için model seçimi ve tahmin için model seçimi. İlk yön, tercihen bilimsel yorum için belirsizlik kaynaklarının güvenilir bir karakterizasyonunu sağlayacak olan veriler için en iyi modeli belirlemektir. Bu amaç için seçilen modelin örneklem büyüklüğüne çok duyarlı olmaması oldukça önemlidir. Buna göre, model seçimini değerlendirmek için uygun bir kavram, seçim tutarlılığıdır; bu, en sağlam adayın, yeterli sayıda veri örneği verildiğinde tutarlı bir şekilde seçileceği anlamına gelir .

İkinci yön, mükemmel tahmin performansı sunmak için makine olarak bir model seçmektir. Bununla birlikte, ikincisi için seçilen model birkaç yakın rakip arasında şanslı kazanan olabilir, ancak tahmine dayalı performans yine de mümkün olan en iyi olabilir. Eğer öyleyse, model seçimi ikinci hedef (tahmin) için iyidir, ancak seçilen modelin içgörü ve yorumlama için kullanılması ciddi şekilde güvenilmez ve yanıltıcı olabilir. Ayrıca, bu şekilde seçilen çok karmaşık modeller için, seçimin yapıldığı verilerden yalnızca biraz farklı olan veriler için tahminler bile mantıksız olabilir.

Aday modellerin seçilmesine yardımcı olacak yöntemler

Kriterler

Aşağıda model seçimi için kriterlerin bir listesi bulunmaktadır. En yaygın olarak kullanılan kriterler (i) Akaike bilgi kriteri ve (ii) Bayes faktörü ve/veya Bayes bilgi kriteridir (bir dereceye kadar Bayes faktörüne yaklaşır), inceleme için bakınız Stoica & Selen (2004) .

Bu kriterler arasında çapraz doğrulama, denetimli öğrenme problemleri için tipik olarak en doğru ve hesaplama açısından en pahalı olanıdır.

Burnham & Anderson (2002 , §6.3) şunları söylüyor:

Çeşitli model seçim yöntemleri vardır. Ancak, bir yöntemin istatistiksel performansı ve kullanımının amaçlanan bağlamı açısından, yalnızca iki farklı yöntem sınıfı vardır: Bunlar verimli ve tutarlı olarak etiketlenmiştir . (...) Model seçimi için sık kullanılan paradigma altında, genellikle üç ana yaklaşım vardır: (I) bazı seçim kriterlerinin optimizasyonu, (II) hipotez testleri ve (III) geçici yöntemler.

Ayrıca bakınız

Notlar

Referanslar