Bregman ayrışması - Bregman divergence
Gelen matematik , özellikle istatistik ve bilgi geometrisi , bir Bregman sapma veya Bregman mesafe bir katı cinsinden tanımlanmaktadır iki nokta arasındaki farkın bir ölçüsüdür konveks fonksiyonu ; önemli bir farklılık sınıfını oluştururlar . Noktalar olasılık dağılımları olarak yorumlandığında – özellikle ya bir parametrik modelin parametresinin değerleri olarak ya da gözlemlenen değerlerin bir veri seti olarak – ortaya çıkan mesafe istatistiksel bir mesafedir . En temel Bregman sapması kare Öklid mesafesidir .
Bregman sapmaları metriklere benzer , ancak ne üçgen eşitsizliğini (hiç) ne de simetriyi (genel olarak) karşılamaz. Bununla birlikte, Pisagor teoreminin bir genellemesini sağlarlar ve bilgi geometrisinde karşılık gelen istatistiksel manifold (ikili) düz bir manifold olarak yorumlanır . Bu, birçok optimizasyon teorisi tekniğinin , geometrik olarak en küçük karelerin genellemeleri olarak Bregman sapmalarına genelleştirilmesine izin verir .
Bregman farklılıkları, 1967'de kavramı tanıtan Lev M. Bregman'ın adını almıştır .
Tanım
Izin sürekli türevlenebilir, katı şekilde dışbükey fonksiyonu kapalı tanımlanan dışbükey grubu .
İle ilişkili Bregman mesafe F noktaları için değeri arasındaki fark , F noktasında p ve birinci sıra değerinin Taylor açılımı arasında F noktası çevresinde q noktasında değerlendirilir p :
Özellikler
- Olumsuzluk : tüm p, q için. Bu, F'nin dışbükeyliğinin bir sonucudur.
- Convexity : ilk argümanında dışbükeydir, ancak ikinci argümanda mutlaka olması gerekmez (bkz. )
- Lineerlik : Bregman mesafesini F fonksiyonu üzerinde bir operatör olarak düşünürsek, negatif olmayan katsayılara göre lineerdir. Başka bir deyişle, kesinlikle dışbükey ve türevlenebilir ve ,
- Dualite : F fonksiyonunun dışbükey bir eşleniği vardır . ile ilgili olarak tanımlanan Bregman mesafesinin ilginç bir ilişkisi vardır.
- Burada ve p ve q'ya karşılık gelen ikili noktalardır.
- Küçültücü olarak ortalama : Bregman sapmaları ile ilgili önemli bir sonuç, rastgele bir vektör verildiğinde, ortalama vektörün, rastgele vektörden beklenen Bregman sapmasını en aza indirmesidir. Bu sonuç, bir kümenin ortalamasının kümedeki öğelere toplam karesel hatayı en aza indirdiği ders kitabı sonucunu genelleştirir. Bu sonuç vektör durumu için (Banerjee et al. 2005) tarafından kanıtlanmıştır ve (Frigyik et al. 2008) tarafından fonksiyonlar/dağılımlar durumuna kadar genişletilmiştir. Bu sonuç önemlidir, çünkü özellikle Bayes tahmininde, rastgele bir kümenin temsilcisi olarak bir ortalamanın kullanılmasını daha da doğrular.
Örnekler
- Kare Öklid mesafesi , dışbükey fonksiyon tarafından üretilen bir Bregman mesafesinin kanonik örneğidir.
- Kare Mahalanobis mesafe , dışbükey işlev ile oluşturulur . Bu, yukarıda karesi alınmış Öklid mesafesinin bir genellemesi olarak düşünülebilir.
- Genelleştirilmiş Kullback-Leibler ayrışması
- negatif entropi fonksiyonu
tarafından üretilir
- dışbükey fonksiyon tarafından üretilir
Projektif dualitenin genelleştirilmesi
Hesaplamalı geometride önemli bir araç, noktaları ve üst-alt ilişkilerini korurken, noktaları hiper düzlemlere eşleyen ve bunun tersini yapan yansıtmalı ikilik fikridir . Projektif ikilinin sayısız analitik biçimi vardır: ortak bir biçim, noktayı hiper düzleme eşler . Bu eşleme (hiper düzlemi normaliyle özdeşleştirerek), p noktasını ikili noktasına götüren dışbükey eşlenik eşleme olarak yorumlanabilir , burada F d -boyutlu paraboloidi tanımlar .
Şimdi paraboloidi keyfi bir dışbükey fonksiyonla değiştirirsek, standart projektif dualin insidansını ve yukarıda-aşağıda özelliklerini koruyan farklı bir ikili eşleme elde ederiz. Bu, Voronoi diyagramları ve Delaunay üçgenlemeleri gibi hesaplamalı geometrideki doğal ikili kavramların, keyfi bir Bregman diverjansı tarafından tanımlanan uzaklık uzaylarında anlamlarını koruduğu anlamına gelir. Böylece, "normal" geometriden gelen algoritmalar doğrudan bu uzaylara uzanır (Boissonnat, Nielsen ve Nock, 2010).
Bregman sapmalarının genelleştirilmesi
Bregman sapmaları, çarpık Jensen sapmalarının sınır durumları olarak yorumlanabilir (bkz. Nielsen ve Boltz, 2011). Jensen sapmaları, karşılaştırmalı dışbükeylik kullanılarak genelleştirilebilir ve bu çarpık Jensen sapmaları genellemelerinin sınır durumları, genelleştirilmiş Bregman sapmalarını verir (bkz. Nielsen ve Nock, 2017). Bregman akor ayrımı, teğet bir çizgi yerine bir akor alınarak elde edilir.
Diğer nesnelerde Bregman sapması
Bregman sapmaları matrisler arasında, fonksiyonlar arasında ve ölçüler (dağılımlar) arasında da tanımlanabilir. Matrisler arasındaki Bregman sapmaları, Stein kaybını ve von Neumann entropisini içerir . Fonksiyonlar arasındaki Bregman sapmaları, toplam kare hatası, göreli entropi ve kare yanlılığı içerir; bkz. Frigyik ve ark. tanımlar ve özellikler için aşağıda. Benzer şekilde, Bregman sapmaları da , bir dışbükey işlevin ayrık analoğu olarak bilinen bir alt modüler küme işlevi aracılığıyla kümeler üzerinde tanımlanmıştır . Alt modüler Bregman sapmaları, Hamming mesafesi , kesinlik ve geri çağırma , karşılıklı bilgi ve alt modüler Bregman'ın daha fazla ayrıntı ve özellikleri için bazı diğer küme tabanlı mesafe ölçümleri (bkz.
Ortak matris Bregman sapmalarının bir listesi için Tablo 15.1'e bakın.
Uygulamalar
Makine öğreniminde, gürültülü veri kümeleriyle softmax işlevinden daha iyi performans gösteren iki kademeli lojistik kaybı hesaplamak için Bregman sapmaları kullanılır .
Referanslar
- Banerjee, Arindam; Merugu, Srujana; Dhillon, Inderjit S.; Ghosh, Joydeep (2005). "Bregman sapmaları ile Kümeleme" . Makine Öğrenimi Araştırmaları Dergisi . 6 : 1705-1749.
- Bregman, LM (1967). "Dışbükey kümelerin ortak noktalarını bulmanın gevşeme yöntemi ve dışbükey programlamadaki problemlerin çözümüne uygulanması". SSCB Hesaplamalı Matematik ve Matematiksel Fizik . 7 (3): 200–217. doi : 10.1016/0041-5553(67)90040-7 .
- Frigyik, Bela A.; Srivastava, Santosh; Gupta, Maya R. (2008). "Fonksiyonel Bregman Iraksaklıkları ve Dağılımların Bayes Tahmini" (PDF) . Bilgi Teorisi Üzerine IEEE İşlemleri . 54 (11): 5130-5139. arXiv : cs/0611123 . doi : 10.1109/TIT.2008.929943 . S2CID 1254 . Orijinalinden (PDF) 2010-08-12 tarihinde arşivlendi .
- Iyer, Rishabh.; Bilmes, Jeff (2012). "Uygulamalar ile Submodüler-Bregman sapmaları ve Lovász-Bregman sapmaları". Sinirsel Bilgi İşleme Sistemleri Konferansı .
- Frigyik, Bela A.; Srivastava, Santosh; Gupta, Maya R. (2008). Fonksiyonel Türevlere Giriş (PDF) . UWEE Teknik Raporu 2008-0001. Washington Üniversitesi, Elektrik Mühendisliği Bölümü. Arşivlenmiş orijinal (PDF) 2017-02-17 tarihinde . 2014-03-20 alındı .
- Harremoës, Peter (2017). "Dışbükey Optimizasyon için Iraksama ve Yeterlilik" . entropi . 19 (5): 206. arXiv : 1701.01010 . Bibcode : 2017Entrp..19..206H . doi : 10.3390/e19050206 .
- Nielsen, Frank; Nock, Richard (2009). "Temsil Bregman sapmalarına göre ikili Voronoi diyagramları" (PDF) . Proc. 6. Uluslararası Voronoi Diyagramları Sempozyumu . IEEE. doi : 10.1109/ISVD.2009.15 .
- Nielsen, Frank; Nock, Richard (2007). "Simetrileştirilmiş Bregman Iraksamalarının Merkezleri Üzerine". arXiv : 0711.3242 [ cs.CG ].
- Nielsen, Frank; Boissonnat, Jean-Daniel; Nock, Richard (2007). "Bregman Voronoi diyagramlarını Görselleştirme Üzerine" . Proc. 23. ACM Hesaplamalı Geometri Sempozyumu (video parçası) . doi : 10.1145/1247069.1247089 .
- Boissonnat, Jean-Daniel; Nielsen, Frank; Nock, Richard (2010). "Bregman Voronoi Diyagramları" . Kesikli ve Hesaplamalı Geometri . 44 (2): 281–307. arXiv : 0709.2196 . doi : 10.1007/s00454-010-9256-1 . S2CID 1327029 .
- Nielsen, Frank; Nock, Richard (2006). "En küçük çevreleyen Bregman Toplarına yaklaşma hakkında". Proc. 22. ACM Hesaplamalı Geometri Sempozyumu . s. 485–486. doi : 10.1145/1137856.1137931 .
- Nielsen, Frank; Boltz, Sylvain (2011). "Burbea-Rao ve Bhattacharyya merkezleri". Bilgi Teorisi Üzerine IEEE İşlemleri . 57 (8): 5455-5466. arXiv : 1004.5049 . doi : 10.1109/TIT.2011.2159046 . S2CID 14238708 .
- Nielsen, Frank; Nock, Richard (2017). "Karşılaştırmalı Dışbükeylik ile Skew Jensen Diverjansları ve Bregman Diverjanslarının Genelleştirilmesi". IEEE Sinyal İşleme Harfleri . 24 (8): 1123-1127. arXiv : 1702.04877 . Bibcode : 2017ISPL...24.1123N . doi : 10.1109/LSP.2017.2712195 . S2CID 31899023 .