Açıklanan kareler toplamı - Explained sum of squares

Olarak istatistik , karelerinin toplamını açıklanmıştır ( ESS alternatif olarak da bilinir), kareler model toplamı ya da bağlı gerileme karelerinin toplamının ( SSR - ile karıştırılmamalıdır kareler kalıntı toplamı (RSS) ya da hataların kareleri toplamı) , bir modelin, genellikle bir regresyon modelinin , modellenen verileri ne kadar iyi temsil ettiğini açıklamakta kullanılan bir niceliktir . Özellikle, açıklanan kareler toplamı, modellenen değerlerde ne kadar varyasyon olduğunu ölçer ve bu, gözlemlenen verilerde ne kadar varyasyon olduğunu ölçen toplam kareler toplamı (TSS) ve kalan toplamı ile karşılaştırılır. gözlemlenen veriler ve modellenen değerler arasındaki hata varyasyonunu ölçen kareler .

Tanım

Açıklanan kareler toplamı (ESS), standart bir regresyon modelinde bir yanıt değişkeninin ortalama değerinden tahmin edilen değerlerin sapmalarının karelerinin toplamıdır - örneğin, y i = a + b 1 x 1 i + b 2 x 2 i + ... + ε i , burada y ı olan i inci gözlenmesi , yanıt değişkeni , x ji olan i inci gözlenmesi j inci açıklayıcı değişken , bir ve b j olan katsayıları , i endeksler 1 ila gözlemler , n ve ε i olan i  inci değeri hata terimi . Genel olarak, ESS ne kadar büyük olursa, tahmin edilen model o kadar iyi performans gösterir.

Tahmini katsayılar ise ve ise , o zaman

olduğu i  inci yanıt değişkenin tahmini değer. ESS daha sonra:

burada regresyon çizgisi tarafından tahmin edilen değer.

Bazı durumlarda (aşağıya bakınız): toplam kareler toplamı  (TSS) = açıklanan kareler toplamı (ESS) + kalan kareler toplamı  (RSS).

Basit doğrusal regresyonda bölümleme

Toplam kareler toplamının (TSS) kalan kareler toplamına (=SSE : tahmin hatalarının karelerinin toplamı) artı açıklanan kareler toplamına (SSR : regresyon veya açıklanan kareler toplamı) eşit olduğunu belirten aşağıdaki eşitlik karelerin toplamı), basit doğrusal regresyonda genellikle doğrudur:

Basit türetme

Her iki tarafın karesini alın ve tüm i'leri toplayın :

Yukarıdaki son terimin basit doğrusal regresyondan nasıl sıfır olduğu aşağıda açıklanmıştır.

Yani,

Bu nedenle,

Genel sıradan en küçük kareler modelinde bölümleme

İlki katsayısı regresyon kesişimi olan sabit bir birim vektör olan n gözlem ve k açıklayıcı içeren genel regresyon modeli ,

burada Y , bir olduğu , n x bağımlı değişken gözlemler 1 vektörü, her bir sütun n x k matris x isimli birinde gözlemler için bir vektör k explanators, a, K x gerçek katsayılarının 1 vektörü, ve E bir bir n x Gerçek temel hataların 1 vektörü. En küçük kareler için tahmin edici IS

Kalıntı vektör olup , bu rezidüel kareler toplamı basitleştirilmesi sonra, olduğu,

Tüm öğeleri, y vektöründeki bağımlı değişken değerlerinin örnek ortalaması olan sabit vektör olarak belirtin . O zaman toplam kareler toplamı

y'nin gözlenen ortalamasından tahmin edilen değerlerin sapmalarının karelerinin toplamı olarak tanımlanan, açıklanan kareler toplamı ,

Bunda kullanmak ve elde etmeyi basitleştirmek , TSS = ESS + RSS, ancak ve ancak . Bunun sol tarafı çarpı y öğelerinin toplamıdır ve sağ taraf çarpı öğelerinin toplamıdır , bu nedenle koşul, y'nin öğelerinin toplamının öğelerinin toplamına eşit olması veya buna eşdeğer olmasıdır. tahmin hatalarının (artıklar) toplamı sıfırdır. Bunun doğru olduğu, k × 1 vektörünün iyi bilinen OLS özelliğine dikkat edilerek görülebilir : X'in ilk sütunu bir birler vektörü olduğundan, bu vektörün ilk öğesi artıkların toplamıdır ve eşittir sıfır. Bu, koşulun TSS = ESS + RSS sonucu için geçerli olduğunu kanıtlar .

Lineer cebir terimlerinde, , , var . Kanıt şuna dikkat edilerek basitleştirilebilir . Kanıt aşağıdaki gibidir:

Böylece,

bu da yine TSS = ESS + RSS sonucunu verir , çünkü .

Ayrıca bakınız

Notlar

Referanslar

  • SE Maxwell ve HD Delaney (1990), "Deney tasarlama ve verileri analiz etme: Bir model karşılaştırma perspektifi". Wadsworth. s. 289–290.
  • GA Milliken ve DE Johnson (1984), "Dağınık verilerin analizi", Cilt. I: Tasarlanmış deneyler. Van Nostrand Reinhold'un fotoğrafı. s. 146-151.
  • BG Tabachnick ve LS Fidell (2007), "ANOVA kullanarak deneysel tasarım". Duxbury. s. 220.
  • BG Tabachnick ve LS Fidell (2007), "Çok değişkenli istatistiklerin kullanılması", 5. baskı. Pearson Eğitimi. s. 217–218.