Gauss-Markov teoremi - Gauss–Markov theorem

Gelen istatistik , Gauss-Markov teoremi (veya basitçe Gauss teoremi bazı yazarlar için) belirtiyor sıradan en küçük kareler (EKK) tahmin edicisi en düşük sahip örnekleme varyansını içinde sınıfın içinde doğrusal tarafsız Tahmincilerin eğer hatalar içinde lineer regresyon modeli olan ilintisiz , eşit varyanslara ve sıfır beklenti değerine sahiptir. Hataların normal olması veya bağımsız ve aynı şekilde dağılmış olmaları gerekmez (sadece ortalama sıfır ile ilişkisiz ve sonlu varyanslı homoskedastik). Önyargılı tahmin ediciler daha düşük varyansa sahip olduğundan, tahmin edicinin yansız olması şartı kaldırılamaz. Örneğin, James-Stein tahmincisi (aynı zamanda doğrusallığı düşürür), ridge regresyonu veya herhangi bir dejenere tahmin edicisine bakın.

Teorem, Gauss'un çalışması Markov'unkinden önemli ölçüde önce olmasına rağmen, Carl Friedrich Gauss ve Andrey Markov'un adını almıştır . Ancak Gauss, sonucu bağımsızlık ve normallik varsayımı altında elde ederken, Markov varsayımları yukarıda belirtilen forma indirdi. Küresel olmayan hatalar için bir başka genelleme Alexander Aitken tarafından yapılmıştır .

Beyan

Diyelim ki matris notasyonumuz var,

genişleyen,

burada rastlantısal olmayan ama olan un gözlemlenebilir parametreler tesadüfi olmayan ve ( "açıklayıcı değişkenler" olarak adlandırılır) gözlemlenebilir, rasgele ve çok rasgele. Rastgele değişkenler "bozulma", "gürültü" veya basitçe "hata" olarak adlandırılır (makalede daha sonra "artık" ile karşılaştırılacaktır; istatistiklerdeki hatalara ve artıklara bakın ). Yukarıdaki modele bir sabit eklemek için , X'in yeni tanıtılan son sütunu bir olacak şekilde, yani herkes için sabiti bir değişken olarak eklemeyi seçebilirsiniz . Örnek yanıtlar olarak gözlemlenebilir olmasına rağmen , varsayımlar, kanıtlar ve diğerleri dahil olmak üzere aşağıdaki ifadeler ve argümanların sadece bilme koşulu altında varsayıldığına, ancak bilinmediğine dikkat edin.

Gauss-Markov varsayımları hata rasgele değişkenlerin, kümesi ilgilendiren :

  • Ortalama sıfırları var:
  • Bunlar homoskedastik : hepsi aynı sonlu varyansa sahip olduğunu, herkes için ve
  • Belirgin hata terimleri korelasyonsuzdur:

Bir doğrusal tahmin arasında doğrusal bir kombinasyonudur

katsayıların gözlemlenebilir olmadığından temel katsayılara bağlı olmasına izin verilmez , ancak bu veriler gözlemlenebilir olduğundan değerlere bağlı olmalarına izin verilir . (Katsayıların her birine bağımlılığı tipik olarak doğrusal değildir; tahmin edici her birinde doğrusaldır ve dolayısıyla her rastgelede bu nedenle bu "doğrusal" regresyondur .) Tahmincinin yansız olduğu söylenir, ancak ve ancak

değerlerinden bağımsız olarak . Şimdi, katsayıların bir lineer kombinasyonu olsun . O zaman karşılık gelen tahminin ortalama kare hatası

başka bir deyişle, tahmin ediciler ve tahmin edilecek karşılık gelen parametreler arasındaki farkların ağırlıklı toplamının (parametreler arası) karesinin beklentisidir. (Tüm parametre tahminlerinin yansız olduğu durumu düşündüğümüz için, bu ortalama karesel hata, doğrusal kombinasyonun varyansı ile aynıdır.) Parametre vektörünün en iyi doğrusal yansız kestiricisi (MAVİ), en küçük olanıdır. doğrusal kombinasyon parametrelerinin her vektörü için ortalama kare hatası . Bu, şu koşula eşdeğerdir:

diğer her doğrusal yansız tahmin edici için pozitif bir yarı tanımlı matristir .

En küçük kareler tahmini (OLS) fonksiyonudur

of ve (burada ' nin devriğini gösterir ) , artıkların karelerinin toplamını en aza indirir (yanlış tahmin miktarları):

Teorem şimdi OLS tahmincisinin bir MAVİ olduğunu belirtir. İspatın ana fikri, en küçük kareler tahmin edicisinin sıfırın her doğrusal yansız tahmincisi ile, yani katsayıları gözlemlenemeyene bağlı olmayan ancak beklenen değeri her zaman sıfır olan her doğrusal kombinasyonla ilişkisiz olmasıdır.

Açıklama

OLS'nin gerçekten de artıkların karelerinin toplamını MİNİMUM ETTİĞİNİN kanıtı, Hess matrisinin hesaplanmasıyla ve bunun pozitif tanımlı olduğunu göstererek aşağıdaki gibi ilerleyebilir .

Küçültmek istediğimiz MSE işlevi

p değişkenli çoklu regresyon modeli için . İlk türev
burada X, tasarım matrisidir

Hessian matris ikinci türevleri olan

Sütunlarının doğrusal olarak bağımsız olduğunu ve bunun tersinin mümkün olduğunu varsayarsak , let , o zaman

Şimdi bir özvektörü olsun .

Vektör çarpımı açısından, bu şu anlama gelir:

karşılık gelen özdeğer nerede . Dahası,

Son olarak, özvektör keyfi olduğundan, tüm özdeğerleri pozitiftir, dolayısıyla pozitif tanımlıdır. Böylece,

aslında yerel bir minimumdur.

Kanıt

Sıfır olmayan bir matrisin nerede olduğu ile ilgili başka bir doğrusal tahmin edici olsun . Biz kısıtlayan konum olarak tarafsız tahmin ediciler, asgari ortalama kare hata asgari varyansı ima eder. Bu nedenle amaç, böyle bir tahmin edicinin, OLS tahmin edicisinden daha küçük olmayan bir varyansa sahip olduğunu göstermektir . Hesaplıyoruz:

Çünkü nedenle, bir un gözlemlenebilir, ancak ve ancak tarafsız olduğunu . Sonra:

Yana DD' , bir pozitif yarı kesin matristir aşan bir pozitif yarı kesin bir matris ile.

Kanıt üzerine açıklamalar

Daha önce belirtildiği gibi, pozitif bir yarı tanımlı matristir koşulu, en iyi lineer yansız tahmin edicinin is özelliğine eşdeğerdir (minimum varyansa sahip olması anlamında en iyisidir). Bunu görmek için, başka bir doğrusal yansız tahmin ediciye izin verin .

Ayrıca, eşitlik ancak ve ancak . hesaplıyoruz

Bu, eşitliğin ancak ve ancak OLS tahmin edicisinin benzersizliğini MAVİ olarak veriyorsa geçerli olduğunu kanıtlar .

Genelleştirilmiş en küçük kareler tahmincisi

Genelleştirilmiş en küçük kareler tarafından geliştirilen (GLS), Aitken hata vektörü matris kovaryans bir sayıl olmayan sahip olduğu, durumda Gauss-Markov teoremi uzanır. Aitken tahmincisi de MAVİ'dir.

Ekonometride belirtildiği gibi Gauss-Markov teoremi

OLS'nin çoğu işlemlerinde, tasarım matrisindeki regresörlerin (ilgilenen parametreler) tekrarlanan örneklerde sabitlendiği varsayılır. Bu varsayım, ekonometri gibi ağırlıklı olarak deneysel olmayan bir bilim için uygun görülmemektedir . Bunun yerine, Gauss-Markov teoreminin varsayımları koşullu olarak ifade edilir .

doğrusallık

Bağımlı değişkenin, modelde belirtilen değişkenlerin doğrusal bir fonksiyonu olduğu varsayılır. Spesifikasyon, parametrelerinde doğrusal olmalıdır. Bu, bağımsız ve bağımlı değişkenler arasında doğrusal bir ilişki olması gerektiği anlamına gelmez. Parametreler doğrusal olduğu sürece bağımsız değişkenler doğrusal olmayan biçimler alabilir. Denklem doğrusal olarak nitelendirilirken, başka bir parametre ile değiştirilerek doğrusal hale dönüştürülebilir , örneğin . Bağımsız bir değişkene bağlı bir parametreye sahip bir denklem, örneğin bir fonksiyonun nerede olduğu gibi doğrusal olarak nitelendirilmez .

Veri dönüşümleri genellikle bir denklemi doğrusal bir forma dönüştürmek için kullanılır. Örneğin, ekonomide sıklıkla kullanılan Cobb-Douglas işlevi doğrusal değildir:

Ancak her iki tarafın doğal logaritmasını alarak doğrusal biçimde ifade edilebilir :

Bu varsayım aynı zamanda belirtim konularını da kapsar: uygun işlevsel formun seçildiğini ve atlanmış değişkenlerin olmadığını varsayarsak .

Bununla birlikte, dönüştürülmüş denklemin kalıntılarını en aza indiren parametrelerin orijinal denklemin kalıntılarını mutlaka en aza indirmediği bilinmelidir.

katı dışsallık

Tüm gözlemler için, hata teriminin -regresörlere bağlı olarak- beklentisi sıfırdır:

i . gözlem için regresörlerin veri vektörü nerede ve sonuç olarak veri matrisi veya tasarım matrisidir.

Geometrik olarak, bu varsayım ifade eder ve olan ortogonal bunların böylece, birbirlerine , iç ürün (diğer bir deyişle, kendi çapraz an) sıfırdır.

Açıklayıcı değişkenler stokastik ise, örneğin hatayla ölçüldüğünde veya içsel olduğunda bu varsayım ihlal edilir . İçsellik, nedenselliğin hem bağımlı hem de bağımsız değişken arasında ileri geri aktığı eşzamanlılığın sonucu olabilir . Enstrümantal değişken teknikleri bu sorunu çözmek için yaygın olarak kullanılmaktadır.

Tam rütbe

Örnek veri matrisi tam sütun sıralamasına sahip olmalıdır .

Aksi takdirde tersine çevrilemez ve OLS tahmincisi hesaplanamaz.

Bu varsayımın ihlali, mükemmel çoklu bağlantıdır , yani bazı açıklayıcı değişkenler doğrusal olarak bağımlıdır. Bunun meydana geleceği bir senaryo, kukla değişkenler ile sabit terim arasında mükemmel bir korelasyon ile sonuçlanan bir temel kukla değişken ihmal edilmediğinde "kukla değişken tuzağı" olarak adlandırılır.

Çoklu doğrusallık ("mükemmel" olmadığı sürece) daha az verimli, ancak yine de tarafsız bir tahminle sonuçlanabilir. Tahminler daha az kesin olacak ve belirli veri kümelerine karşı oldukça hassas olacaktır. Çoklu doğrusallık, diğer testlerin yanı sıra koşul numarasından veya varyans şişirme faktöründen tespit edilebilir .

Küresel hatalar

Dış ürün hata vektörünün küresel olmalıdır.

Bu, hata teriminin tek tip varyansa ( eş- varyanslılık ) sahip olduğunu ve seri bağımlılığı olmadığını gösterir. Bu varsayım ihlal edilirse, OLS hala tarafsızdır, ancak verimsizdir. "Küresel hatalar" terimi, çok değişkenli normal dağılımı tanımlayacaktır: eğer çok değişkenli normal yoğunluktaysa, o zaman denklem , n boyutlu uzayda yarıçapı σ olan μ merkezli bir topun formülüdür .

Heteroskedastisite , hata miktarı bağımsız bir değişkenle ilişkilendirildiğinde ortaya çıkar. Örneğin, gıda harcaması ve gelirine ilişkin bir regresyonda, hata gelirle ilişkilidir. Düşük gelirli insanlar genellikle gıdaya benzer miktarda harcama yaparken, yüksek gelirli insanlar çok büyük miktarda veya düşük gelirli insanların harcadıkları kadar az harcama yapabilir. Heteroskedastik ayrıca ölçüm uygulamalarındaki değişikliklerden de kaynaklanabilir. Örneğin, istatistik ofisleri verilerini iyileştirdikçe ölçüm hatası azalır, dolayısıyla hata terimi zamanla azalır.

Otokorelasyon olduğunda bu varsayım ihlal edilir . Bitişik gözlemler de uygun regresyon çizgisinin üzerinde yer alıyorsa, belirli bir gözlemin uygun bir çizginin üzerinde olması daha muhtemel olduğunda, bir veri grafiğinde otokorelasyon görselleştirilebilir. Bir veri serisinin "atalet" yaşayabileceği zaman serisi verilerinde otokorelasyon yaygındır. Bir bağımlı değişkenin bir şoku tamamen emmesi biraz zaman alıyorsa. Mekansal otokorelasyon da meydana gelebilir, coğrafi bölgelerde de benzer hatalar olması muhtemeldir. Otokorelasyon, yanlış fonksiyonel formun seçilmesi gibi yanlış tanımlamaların sonucu olabilir. Bu durumlarda, belirtimi düzeltmek, otokorelasyonla başa çıkmanın olası bir yoludur.

Küresel hataların varlığında, genelleştirilmiş en küçük kareler tahmincisi MAVİ olarak gösterilebilir.

Ayrıca bakınız

Diğer tarafsız istatistikler

Referanslar

daha fazla okuma

Dış bağlantılar