Rand endeksi - Rand index

kMeans (solda) ve Mean shift (sağda) algoritmalarıyla bir veri kümesi için örnek kümelemeler . Bu iki kümeleme için hesaplanan Düzeltilmiş Rand endeksi

Rand göstergesi veya Rand ölçü olarak (William M. Rand olarak adlandırılır) istatistik ve özellikle veri kümeleme , iki arasındaki benzerliğin bir ölçüsüdür veri kümelenmelerinin . Öğelerin şansa göre gruplandırılması için ayarlanmış bir Rand indeksi formu tanımlanabilir, bu ayarlanmış Rand indeksidir . Matematiksel bir bakış açısından, Rand indeksi doğrulukla ilişkilidir , ancak sınıf etiketleri kullanılmadığında bile geçerlidir.

Rand endeksi

Tanım

Verilen Bir dizi bir elemanları ve iki bölüm arasında , karşılaştırma , bir bölüm S içine r alt grupları ve , bir bölüm S içine ler alt kümeleri, aşağıdaki tanımlar:

  • , Eleman çiftlerinin sayısı özellik olarak aynı olarak alt- ve aynı alt grubunda
  • , Eleman çiftlerinin sayısı özellik olarak , farklı olarak alt grupları ve farklı olarak alt-
  • , içinde aynı alt kümede ve farklı alt kümelerde bulunan eleman çiftlerinin sayısı
  • , Eleman çiftlerinin sayısı özellik olarak , farklı olarak alt grupları ve aynı alt grubunda

Rand endeksi, ,:

Sezgisel, aralarında anlaşmaların sayısı olarak kabul edilebilir ve ve aralarında anlaşmazlıklar sayısı olarak ve .

Payda çiftlerinin sayısı olduğu, Rand göstergesi temsil ortaya çıkma sıklığını toplam çiftleri veya olasılık üzerinde anlaşmaları ve rasgele seçilen çift kabul edecektir.

olarak hesaplanır .


Benzer şekilde, Rand indeksi algoritma tarafından verilen doğru kararların yüzdesinin bir ölçüsü olarak da görülebilir. Aşağıdaki formül kullanılarak hesaplanabilir:

nerede gerçek pozitif sayıdır, sayısıdır gerçek negatifler , sayısıdır yanlış pozitif ve sayısıdır yanlış negatifler .

Özellikleri

Rand indeksi, 0 ile 1 arasında bir değere sahiptir; 0, iki veri kümelemesinin herhangi bir nokta çifti üzerinde uyuşmadığını ve 1, veri kümelemelerinin tamamen aynı olduğunu belirtir.

Matematiksel olarak a, b, c, d aşağıdaki gibi tanımlanır:

  • , nerede
  • , nerede
  • , nerede
  • , nerede

bazı

Sınıflandırma doğruluğu ile ilişki

Rand indeksi, içindeki eleman çiftleri üzerindeki ikili sınıflandırma doğruluğu prizması aracılığıyla da görüntülenebilir . İki sınıf etiketlerdir " ve aynı alt kümesi olan ve " ve " ve farklı alt grupları vardır ve ".

Bu ayarda, aynı alt kümeye ait olarak doğru şekilde etiketlenen çiftlerin sayısıdır ( gerçek pozitifler ) ve farklı alt kümelere ait olarak doğru şekilde etiketlenen çiftlerin sayısıdır ( gerçek negatifler ).

Düzeltilmiş Rand endeksi

Düzeltilmiş Rand endeksi, Rand endeksinin şansa göre düzeltilmiş versiyonudur. Böyle bir şans düzeltmesi, rastgele bir model tarafından belirtilen kümelemeler arasındaki tüm ikili karşılaştırmaların beklenen benzerliğini kullanarak bir temel oluşturur. Geleneksel olarak Rand Endeksi, kümelemeler için Permütasyon Modeli kullanılarak düzeltildi (bir kümeleme içindeki kümelerin sayısı ve boyutu sabittir ve tüm rastgele kümelemeler, öğelerin sabit kümeler arasında karıştırılmasıyla oluşturulur). Ancak, permütasyon modelinin öncülleri sıklıkla ihlal edilmektedir; birçok kümeleme senaryosunda, kümelerin sayısı veya bu kümelerin boyut dağılımı büyük ölçüde değişir. Örneğin, K-ortalamasında kümelerin sayısının uygulayıcı tarafından sabitlendiğini, ancak bu kümelerin boyutlarının verilerden çıkarıldığını düşünün . Ayarlanmış Rand Endeksinin varyasyonları, farklı rastgele kümeleme modellerini hesaba katar.

Rand Endeksi yalnızca 0 ile +1 arasında bir değer verebilse de, endeks beklenen endeksten düşükse düzeltilmiş Rand endeksi negatif değerler verebilir.

Acil durum tablosu

Verilen bir dizi S ve N elemanlar ve iki grubu ya da bölmeler ( örneğin, yani, bu elemanların kümelenmemeler) ve arasındaki örtüşme X ve Y , bir acil durum tabloda özetlenmiştir edilebilir her bir giriş ile ortak nesne sayısını işaret eder ve  : .

Tanım

Permütasyon Modelini kullanan orijinal Düzeltilmiş Rand Endeksi,

olasılık tablosundaki değerler nerede .

Ayrıca bakınız

Referanslar

Dış bağlantılar