Kök-ortalama-kare sapma - Root-mean-square deviation
İstatistik |
---|
Kök-ortalama-kare sapma ( RMSD ) ya da kök-ortalama-kare hata ( RMSE ) değerleri (numune veya nüfus değerleri) bir model veya bir ile tahmin arasındaki farkların sıklıkla kullanılan bir ölçüdür tahmin ve gözlenen değerler. RMSD, tahmin edilen değerler ile gözlemlenen değerler arasındaki farkların ikinci örnek momentinin karekökünü veya bu farkların ikinci dereceden ortalamasını temsil eder. Bu sapmalar , hesaplamalar tahmin için kullanılan veri örneği üzerinden yapıldığında artıklar olarak adlandırılır ve örnek dışı hesaplandığında hatalar (veya tahmin hataları) olarak adlandırılır . RMSD, çeşitli veri noktaları için tahminlerdeki hataların büyüklüklerini tek bir tahmin gücü ölçüsünde toplamaya hizmet eder. RMSD, ölçeğe bağlı olduğu için veri kümeleri arasında değil, belirli bir veri kümesi için farklı modellerin tahmin hatalarını karşılaştırmak için bir doğruluk ölçüsüdür .
RMSD her zaman negatif değildir ve 0 değeri (pratikte neredeyse hiç elde edilmemiştir) verilere mükemmel uyumu gösterir. Genel olarak, daha düşük bir RMSD, daha yüksek olandan daha iyidir. Ancak, ölçü kullanılan sayıların ölçeğine bağlı olduğundan, farklı veri türleri arasındaki karşılaştırmalar geçersiz olacaktır.
RMSD, karesel hataların ortalamasının kareköküdür. Her hatanın RMSD üzerindeki etkisi, karesi alınan hatanın boyutuyla orantılıdır; dolayısıyla daha büyük hataların RMSD üzerinde orantısız olarak büyük bir etkisi vardır. Sonuç olarak, RMSD aykırı değerlere karşı hassastır.
formül
Tahmin edilen bir parametreye göre bir tahmin edicinin RMSD'si , ortalama kare hatasının karekökü olarak tanımlanır :
Tarafsız bir tahmin edici için RMSD, standart sapma olarak bilinen varyansın kareköküdür .
Bir regresyonun bağımlı değişkeninin T süreleri boyunca gözlemlenen değişkenleri ile t kez tahmin edilen değerlerinin RMSD'si , sapmaların karelerinin ortalamasının karekökü olarak T farklı tahminler için hesaplanır :
( Kesit verileri üzerindeki regresyonlar için , t alt indisi i ile, T ise n ile değiştirilir .)
Bazı disiplinlerde, RMSD, ikisi de "standart" olarak kabul edilmeyen, değişebilen iki şey arasındaki farklılıkları karşılaştırmak için kullanılır. Örneğin, iki zaman serisi ile arasındaki ortalama farkı ölçerken formül şöyle olur:
normalleştirme
RMSD'nin normalleştirilmesi, farklı ölçeklere sahip veri kümeleri veya modeller arasında karşılaştırmayı kolaylaştırır. Literatürde tutarlı bir normalleştirme yolu olmamasına rağmen, ortak seçenekler, ölçülen verilerin ortalaması veya aralığıdır (maksimum değer eksi minimum değer olarak tanımlanır):
- veya .
Bu değere genel olarak normalleştirilmiş ortalama kare sapma veya hata (NRMSD veya NRMSE) denir ve genellikle yüzde olarak ifade edilir, burada daha düşük değerler daha az artık varyansı gösterir. Çoğu durumda, özellikle daha küçük numuneler için, numune aralığının, karşılaştırmaları engelleyebilecek numune büyüklüğünden etkilenmesi muhtemeldir.
RMSD'yi daha kullanışlı bir karşılaştırma ölçüsü yapmak için başka bir olası yöntem, RMSD'yi çeyrekler arası aralığa bölmektir . RMSD'yi IQR ile bölerken, normalleştirilmiş değer, hedef değişkendeki uç değerler için daha az duyarlı hale gelir.
- nerede
ile ve burada CDF -1 olduğu miktarsal fonksiyonu .
Ölçümlerin ortalama değeri ile normalleştirme yapılırken, belirsizliği önlemek için RMSD, CV(RMSD) varyasyon katsayısı terimi kullanılabilir. Bu, standart sapmanın yerini alan RMSD ile varyasyon katsayısına benzer .
Ortalama mutlak hata
Bazı araştırmacılar , Kök Ortalama Kare Sapması yerine Ortalama Mutlak Hatanın (MAE) kullanılmasını önermiştir. MAE, RMSD'ye göre yorumlanabilirlik açısından avantajlara sahiptir. MAE, hataların mutlak değerlerinin ortalamasıdır. MAE'yi anlamak, karesel hataların ortalamasının karekökünü anlamaktan temelde daha kolaydır. Ayrıca, her hata MAE'yi hatanın mutlak değeriyle doğru orantılı olarak etkiler, bu RMSD için geçerli değildir.
Uygulamalar
- In meteoroloji , bir ne kadar etkili görmek matematiksel modelin davranışını tahmin atmosferi .
- Gelen Biyoinformatik , atomik pozisyonları kök-ortalama-kare sapma atomları arasındaki ortalama mesafe ölçümüdür üst üste protein .
- Olarak yapı bazında ilaç tasarımına , RMSD ligandı bir kristal konformasyon arasında farkın bir ölçüsüdür konformasyon ve yerleştirme tahmini.
- Gelen ekonomi , RMSD bir ekonomik modelin uygun olup olmadığını belirlemek için kullanılır ekonomik göstergeler . Bazı uzmanlar, RMSD'nin Göreli Mutlak Hatadan daha az güvenilir olduğunu savundu.
- Gelen deneysel psikoloji , RMSD davranışının matematiksel veya hesaplama modelleri ampirik gözlemlenen davranışlarını açıklamaya ne kadar iyi değerlendirmek için kullanılır.
- Olarak CBS , RMSD mekansal analizi ve uzaktan algılama doğruluğunu değerlendirmek için kullanılan bir ölçüdür.
- Gelen hidrojeolojisi , RMSD ve NRMSD bir yeraltı suyu modeli kalibrasyon değerlendirmek için kullanılır.
- Olarak görüntüleme bilim , RMSD bir parçası olan en yüksek sinyal-gürültü oranı bir metot, orijinal görüntünün göre bir görüntü gerçekleştirir yeniden ne kadar iyi değerlendirmek için kullanılan bir önlem.
- Gelen hesaplamalı nörobilim , RMSD bir sistemin belirli bir model öğrenir ne kadar iyi değerlendirmek için kullanılır.
- Olarak , protein, nükleer manyetik rezonans spektroskopisi , RMSD yapıların elde demetin kalitesi tahmin etmek için bir ölçü olarak kullanılır.
- Netflix Ödülü için yapılan başvurular, test veri setinin açıklanmayan "gerçek" değerlerinden RMSD kullanılarak değerlendirildi.
- Binaların enerji tüketiminin simülasyonunda, modelleri ölçülen bina performansına kalibre etmek için RMSE ve CV(RMSE) kullanılır.
- Gelen X-ışını kristalografisi , RMSD (ve RMSZ) koltuk kütüphane değerleri sapan moleküler iç koordinatlar sapmasını ölçmek için kullanılır.
Ayrıca bakınız
- Kök kare ortalama
- Ortalama mutlak hata
- Ortalama mutlak sapma
- Ortalama işaretli sapma
- Ortalama kare sapma
- kare sapmalar
- İstatistiklerdeki hatalar ve artıklar
Referanslar
- ^ Hyndman, Rob J.; Köhler, Anne B. (2006). "Tahmin doğruluğunun ölçülerine başka bir bakış". Uluslararası Tahmin Dergisi . 22 (4): 679-688. CiteSeerX 10.1.1.154.9771 . doi : 10.1016/j.ijforecast.2006.03.001 .
- ^ a b Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "Gerçek bir değişkeni paylaşan haritalar arasında çoklu çözünürlük karşılaştırması için bilgi bileşenleri". Çevresel Ekolojik İstatistikler . 15 (2): 111–142. doi : 10.1007/s10651-007-0043-y .
- ^ Willmott, Cort; Matsuura, Kenji (2006). "Uzamsal enterpolatörlerin performansını değerlendirmek için boyutlandırılmış hata ölçülerinin kullanımı hakkında". Uluslararası Coğrafi Bilgi Bilimi Dergisi . 20 : 89–102. doi : 10.1080/13658810500286976 .
- ^ "Kıyı Girişleri Araştırma Programı (CIRP) Wiki - İstatistik" . Erişim tarihi: 4 Şubat 2015 .
- ^ "SSS: Varyasyon katsayısı nedir?" . 19 Şubat 2019'da alındı .
- ^ Armstrong, J. Scott; Collopy, Fred (1992). "Tahmin Yöntemleri Hakkında Genelleme İçin Hata Ölçüleri: Ampirik Karşılaştırmalar" (PDF) . Uluslararası Tahmin Dergisi . 8 (1): 69-80. CiteSeerX 10.1.1.423.508 . doi : 10.1016/0169-2070(92)90008-w .
- ^ Anderson, milletvekili; Woessner, WW (1992). Uygulamalı Yeraltı Suyu Modellemesi: Akış Simülasyonu ve Advive Transport (2. baskı). Akademik Basın.
- ^ Topluluk Sinir Ağı Modeli
- ^ ANSI/BPI-2400-S-2012: Enerji Kullanım Geçmişine Kalibrasyona Göre Tüm Ev Enerji Tasarrufu Tahminlerinin Standart Kalifikasyonu için Standart Uygulama