Doğruluk ve hassasiyet - Accuracy and precision

Bir dizi ölçümde doğruluk , ölçümlerin belirli bir değere yakınlığı, kesinlik ise ölçümlerin birbirine yakınlığıdır.

Doğruluğun iki tanımı vardır:

  1. Daha yaygın olarak, sistematik hataların bir tanımı , istatistiksel yanlılığın bir ölçüsüdür ; düşük doğruluk, sonuç ile "doğru" değer arasında bir farka neden olur. ISO bu gerçekliği çağırır .
  2. Alternatif olarak, ISO doğruluğu, yukarıdaki her iki gözlemsel hata türünün (rastgele ve sistematik) bir kombinasyonunu tanımlamak olarak tanımlar , bu nedenle yüksek doğruluk, hem yüksek hassasiyet hem de yüksek doğruluk gerektirir.

Kesinlik , rastgele hataların bir tanımı , istatistiksel değişkenliğin bir ölçüsüdür .

Basit anlamda, aynı miktarda tekrarlanan ölçümlerinden veri noktaları verilen bir dizi, dizi olarak söylenebilir doğru ortalama yakın ise, gerçek değerin grubu olduğu söylenebilir ise, miktarı ölçülür hassas değerler birbirine yakın ise. Yukarıdaki "doğruluk"un ilk ve daha yaygın tanımında, iki kavram birbirinden bağımsızdır, bu nedenle belirli bir veri kümesinin doğru veya kesin veya her ikisi veya hiçbiri olduğu söylenebilir.

Ortak teknik tanım

Doğruluk , ölçüm sonuçlarının gerçek değere yakınlığıdır; kesinlik , değişmeyen koşullar altında tekrarlanan (veya tekrarlanabilir ) ölçümlerin aynı sonuçları gösterme derecesidir .

Bilim ve mühendislik alanlarında, bir ölçüm sisteminin doğruluğu , bir niceliğin ölçümlerinin o miktarın gerçek değerine yakınlık derecesidir . İlgili bir ölçüm sistemi, hassas yeniden üretilebilirlik ve tekrarlanabilirlik değişmeden koşullar altında ölçümler aynı gösteren tekrar derecesidir sonuçları . İki kelime hassasiyet ve doğruluk olabilir, ancak eşanlamlı olarak konuşma kullanımı, kasıtlı bağlamında tezat bilimsel yöntem .

Ölçümlerin yorumlanmasının merkezi bir rol oynadığı istatistik alanı, doğruluk ve kesinlik yerine yanlılık ve değişkenlik terimlerini kullanmayı tercih eder : yanlılık, yanlışlık miktarıdır ve değişkenlik, belirsizlik miktarıdır.

Bir ölçüm sistemi doğru olabilir ancak kesin olmayabilir, kesin olabilir ancak doğru olmayabilir, hiçbiri veya her ikisi birden olabilir. Örneğin, bir deney sistematik bir hata içeriyorsa , örnek boyutunun arttırılması genellikle kesinliği artırır ancak doğruluğu iyileştirmez. Sonuç, kusurlu deneyden elde edilen tutarlı ancak yanlış bir sonuç dizisi olacaktır. Sistematik hatayı ortadan kaldırmak doğruluğu artırır ancak kesinliği değiştirmez.

Bir ölçüm sistemi olarak kabul edilir geçerli hem ise doğru ve kesin . İlgili terimler yanlılığı ( bağımsız değişkenle ilgisi olmayan bir faktör veya faktörlerin neden olduğu rastgele olmayan veya yönlendirilmiş etkiler ) ve hatayı (rastgele değişkenlik) içerir.

Terminoloji aynı zamanda dolaylı ölçümlere, yani gözlemlenen verilerden bir hesaplama prosedürüyle elde edilen değerlere de uygulanır.

Doğruluk ve kesinliğe ek olarak, ölçümler, ölçümde bir yanıt oluşturan temel fiziksel nicelikte en küçük değişiklik olan bir ölçüm çözünürlüğüne de sahip olabilir .

Olarak sayısal analizi , doğruluk gerçek değere bir hesaplama yakınlık da; kesinlik, tipik olarak ondalık veya ikili basamak sayısıyla tanımlanan temsilin çözünürlüğüdür.

Askeri terimlerle, doğruluk, öncelikle ateşin doğruluğuna ( justesse de tir ), hedefin merkezinde ve çevresinde bir grup atışın yakınlığı ile ifade edilen ateşin kesinliğine atıfta bulunur .

miktar belirleme

Endüstriyel enstrümantasyonda doğruluk, enstrümanın ölçüm toleransı veya iletimidir ve enstrüman normal çalışma koşullarında kullanıldığında yapılan hataların sınırlarını tanımlar.

İdeal olarak, bir ölçüm cihazı hem doğru hem de kesindir, ölçümlerin tümü gerçek değere yakın ve sıkıca kümelenmiştir. Bir ölçüm sürecinin doğruluğu ve kesinliği genellikle izlenebilir bir referans standardının tekrar tekrar ölçülmesiyle belirlenir . Bu tür standartlar, Uluslararası Birimler Sisteminde (Fransızca'dan SI kısaltılmıştır: Système international d'unités ) tanımlanır ve Amerika Birleşik Devletleri'ndeki Ulusal Standartlar ve Teknoloji Enstitüsü gibi ulusal standart kuruluşları tarafından korunur .

Bu, ölçümler tekrarlandığında ve ortalaması alındığında da geçerlidir. Bu durumda, standart hata terimi düzgün bir şekilde uygulanır: ortalamanın kesinliği, işlemin bilinen standart sapmasının ortalaması alınan ölçüm sayısının kareköküne bölünmesine eşittir. Ayrıca, merkezi limit teoremi , ortalaması alınan ölçümlerin olasılık dağılımının , bireysel ölçümlerinkinden daha normal bir dağılıma daha yakın olacağını gösterir.

Doğruluk ile ilgili olarak şunları ayırt edebiliriz:

  • ölçümlerin ortalaması ile referans değeri arasındaki fark , sapma . Kalibrasyon için önyargının oluşturulması ve düzeltilmesi gereklidir .
  • bunun ve kesinliğin birleşik etkisi.

Bilim ve mühendislikte yaygın bir gelenek, kesinliği ve/veya kesinliği anlamlı rakamlar aracılığıyla dolaylı olarak ifade etmektir . Açıkça belirtilmediği durumlarda, hata payı, son önemli yerin değerinin yarısı olarak anlaşılır. Örneğin, 843,6 m veya 843,0 m veya 800,0 m'lik bir kayıt 0,05 m'lik bir marj anlamına gelir (son önemli yer onuncu sıradır), 843 m'lik bir kayıt ise 0,5 m'lik bir hata marjı anlamına gelir ( son anlamlı rakamlar birimlerdir).

Sondaki sıfırlar ve ondalık noktası olmayan 8.000 m'lik bir okuma belirsizdir; sondaki sıfırlar anlamlı rakamlar olarak tasarlanabilir veya tasarlanmayabilir. Bu belirsizlik önlemek için, sayı bilimsel gösterimde temsil edilebilir: 8.0 x 10 3  m ilk sıfır önemli olduğunu gösterir (50 m, dolayısıyla bir marj) x 10 8.000 ise 3  m üç sıfır önemli olduğu, veren gösterir 0,5 m kenar boşluğu. Benzer şekilde, temel ölçüm biriminin katları kullanılabilir: 8,0 km, 8,0 × 10 3  m'ye eşittir . 0,05 km'lik (50 m) bir marjı gösterir. Ancak, bu kurala güvenmek, ona uymayan kaynaklardan veri kabul ederken yanlış kesinlik hatalarına yol açabilir . Örneğin, +/- 5.000 hassasiyetle 153.753 gibi bir sayı bildiren bir kaynak, +/- 0,5 hassasiyete sahip gibi görünür. Sözleşmeye göre, 154.000'e yuvarlanırdı.

Alternatif olarak, bilimsel bağlamda, hata payının daha kesin olarak belirtilmesi istenirse, 7.54398(23) × 10 −10 m gibi bir gösterim kullanılabilir , yani 7.54375 ile 7.54421 × 10 −10 arasında bir aralık m.

Hassasiyet şunları içerir:

  • tekrarlanabilirlik – aynı alet ve operatör kullanılarak ve kısa bir süre içinde tekrarlanarak koşulları sabit tutmak için tüm çabalar gösterildiğinde ortaya çıkan varyasyon; ve
  • tekrarlanabilirlik — farklı enstrümanlar ve operatörler arasında ve daha uzun zaman dilimlerinde aynı ölçüm sürecinin kullanılmasından kaynaklanan varyasyon.

Mühendislikte, hassasiyet genellikle, ölçümlerin %99,73'ünün meydana gelebileceği aralığı temsil eden, alınan ölçümlerin Standart Sapmasının üç katı olarak alınır. Örneğin, insan vücudunu ölçen bir ergonomist, elde edilen ölçümlerin %99,73'ünün - GRYPHON işleme sistemi kullanılıyorsa - ± 0,7 cm - veya işlenmemiş veriler kullanılıyorsa ± 13 cm - aralığında olduğundan emin olabilir.

ISO tanımı (ISO 5725)

ISO 5725-1'e göre Doğruluk, doğruluk (ölçüm sonuçlarının gerçek değere yakınlığı) ve kesinlikten (ölçümün tekrarlanabilirliği veya tekrarlanabilirliği) oluşur.

Bu terimlerin anlamında bir değişiklik, 1994 yılında ISO 5725 serisi standartların yayınlanmasıyla ortaya çıktı ve bu, "BIPM Uluslararası Metroloji Sözlüğü"nün (VIM) 2008 sayısına, 2.13 ve 2.14. maddelerine de yansıdı.

ISO 5725-1'e göre, "doğruluk" genel terimi, bir ölçümün gerçek değere yakınlığını tanımlamak için kullanılır. Terim, aynı ölçülen büyüklüğün ölçüm setlerine uygulandığında , rastgele hatanın bir bileşenini ve sistematik hatanın bir bileşenini içerir. Bu durumda doğruluk, bir dizi ölçüm sonucunun ortalamasının gerçek (doğru) değere yakınlığıdır ve kesinlik, bir dizi sonuç arasındaki uyuşmanın yakınlığıdır.

ISO 5725-1 ve VIM , tıp ve hukukta olduğu gibi bilim ve mühendislik alanları dışında farklı çağrışımlara sahip olduğundan, daha önce BS 5497-1'de belirtilen " yanlılık " teriminin kullanımından da kaçınır .

İkili sınıflandırmada

Doğruluk , bir ikili sınıflandırma testinin bir koşulu ne kadar iyi tanımladığını veya hariç tuttuğunu gösteren istatistiksel bir ölçü olarak da kullanılır . Kendisine, doğruluk doğru tahminler (her ikisi de oranı olan gerçek pozitif ve gerçek negatif incelenen vakaların sayısı arasında). Bu nedenle, test öncesi ve sonrası olasılık tahminlerini karşılaştırır . Anlambilim tarafından bağlamı açıklığa kavuşturmak için, genellikle "Rand doğruluğu" veya " Rand indeksi " olarak adlandırılır. Testin bir parametresidir. İkili doğruluğu ölçmek için formül:

burada TP = Gerçek pozitif ; FP = Yanlış pozitif ; TN = Gerçek negatif ; FN = Yanlış negatif

Bu bağlamda, ISO 5725-1 tarafından tanımlanan doğruluk ve kesinlik kavramlarının geçerli olmadığını unutmayın. Bunun bir nedeni, bir miktarın tek bir "gerçek değeri" olmaması, bunun yerine her durum için iki olası gerçek değer olması, doğruluğun ise tüm durumlar için bir ortalama olması ve bu nedenle her iki değeri de hesaba katmasıdır. Bununla birlikte, kesinlik terimi bu bağlamda bilgi alma alanından kaynaklanan farklı bir metrik anlamında kullanılır ( aşağıya bakınız ).

Psikometri ve psikofizikte

Gelen Psikometrinin ve psikofizik terimi doğruluğu birbirlerinin yerine kullanılır geçerlilik ve sabit bir hata . Kesinlik , güvenilirlik ve değişken hata ile eş anlamlıdır . Bir ölçüm aracının veya psikolojik testin geçerliliği, deney veya davranışla korelasyon yoluyla belirlenir. Güvenilirlik, çeşitli istatistiksel tekniklerle, klasik olarak , ilgili soru setlerinin ilgili yanıtlara sahip olduğundan emin olmak için Cronbach's alpha gibi bir iç tutarlılık testi ve ardından bu ilgili soruların referans ve hedef popülasyon arasında karşılaştırılması yoluyla kurulur .

mantık simülasyonunda

In mantık simülasyonu , doğru modellerin değerlendirilmesinde yaygın bir hatadır bir karşılaştırmaktır mantık simülasyon modeli a transistör devre simülasyon modeli . Bu, doğruluktaki değil, kesinlikteki farklılıkların bir karşılaştırmasıdır. Hassasiyet ayrıntıya göre, doğruluk ise gerçeğe göre ölçülür.

bilgi sistemlerinde

Veritabanları ve web arama motorları gibi bilgi erişim sistemleri, bazıları sonuçları gerçek pozitiflere (doğru şekilde alınan belgeler), gerçek negatiflere (doğru şekilde alınmayan belgelere) bölen karışıklık matrisinden türetilen birçok farklı metrik tarafından değerlendirilir. yanlış pozitifler (belgeler yanlış alındı) ve yanlış negatifler (belgeler hatalı olarak alınmadı). Yaygın olarak kullanılan metrikler, kesinlik ve hatırlama kavramlarını içerir . Bu bağlamda, kesinlik, insanlar tarafından seçilen bir dizi kesin gerçekle ilgili sonuç kullanılarak, sorguyla ilgili alınan belgelerin oranı (doğru pozitifler bölü doğru+yanlış pozitifler) olarak tanımlanır . Geri çağırma, ilgili belgelerin toplam sayısına kıyasla alınan ilgili belgelerin oranı olarak tanımlanır (gerçek pozitiflerin doğru pozitifler+yanlış negatiflere bölünmesi). Daha az yaygın olarak, doğruluk ölçüsü kullanılır, toplam doğru sınıflandırma sayısının (gerçek pozitifler artı gerçek negatifler) toplam belge sayısına bölümü olarak tanımlanır.

Bu metriklerin hiçbiri sonuçların sıralamasını hesaba katmaz. Sıralama, web arama motorları için çok önemlidir, çünkü okuyucular nadiren sonuçların ilk sayfasını geçerler ve web'de, belirli bir aramaya dahil edilip edilmemeleri veya hariç tutulmaları konusunda manuel olarak sınıflandırmak için çok fazla belge vardır. Belirli sayıda sonuca bir sınır eklemek, bir dereceye kadar sıralamayı hesaba katar. Örneğin, k'deki ölçü kesinliği, yalnızca ilk on (k=10) arama sonucuna bakan bir kesinlik ölçüsüdür. İndirimli kümülatif kazanç gibi daha karmaşık metrikler, her bir sıralamayı dikkate alır ve bunun önemli olduğu yerlerde daha yaygın olarak kullanılır.

Ayrıca bakınız

Referanslar

Dış bağlantılar