Chernoff bağlı - Chernoff bound

In olasılık teorisi , Chernoff bağlı adını, Herman Chernoff , fakat Herman Rubin için katlanarak üzerinde sınırlarını azalan verir kuyruk dağılımları bağımsız rasgele değişkenlerin toplamlarının. Markov'un eşitsizliği veya Chebyshev'in eşitsizliği gibi bilinen birinci veya ikinci moment tabanlı kuyruk sınırlarından daha keskin bir sınırdır ve yalnızca kuyruk çürümesinde güç yasası sınırları verir. Bununla birlikte, Chernoff sınırı, değişkenlerin bağımsız olmasını gerektirir - Chebyshev'in eşitsizliği değişkenlerin ikili olarak bağımsız olmasını gerektirmesine rağmen, ne Markov'un eşitsizliğinin ne de Chebyshev'in eşitsizliğinin gerektirmediği bir koşuldur.

(tarihsel olarak önceki) Bernstein eşitsizlikleri ve Hoeffding'in eşitsizliği ile ilgilidir .

genel sınır

Genel Chernoff rastgele değişken giden X uygulanarak elde edilir Markov eşitsizliği için E Tx . Her biri için :

Ne zaman X'in toplamıdır n rastgele değişkenlerin X 1 , ..., X n , herhangi için olsun t > 0,

Özellikle, t üzerinde optimizasyon yaparak ve X i'nin bağımsız olduğunu varsayarak , şunu elde ederiz:

 

 

 

 

( 1 )

Benzer şekilde,

ve bu yüzden,

Belirli Chernoff sınırları , temel değişkenlerin belirli örnekleri için hesaplanarak elde edilir .

Gauss kuyruk bağlı

İzin ver . Bir Gauss rastgele değişkeni için moment üreten fonksiyonu kullanarak, tüm

Örnek

Let X 1 , ..., x , n , bağımsız olarak Bernoulli rastgele değişkenler olan toplamıdır, X , her biri olasılık s Bernoulli değişken için 1'e eşit olma:

Yani:

Herhangi biri için , alır ve verir:

ve

ve genel Chernoff sınırı şunları verir:

p > 1/2 varsayın . { X k = 1} olaylarının n / 2'sinden fazlasının aynı anda meydana gelme olasılığı kesin bir değere sahiptir:

Bu olasılığa ilişkin bir alt sınır, Chernoff'un eşitsizliğine dayalı olarak hesaplanabilir:

Gerçekten de, μ = np olduğunu fark ederek , Chernoff sınırının çarpımsal biçimini elde ederiz (aşağıya bakın veya Sinclair'in sınıf notlarında Sonuç 13.3'e bakın),

Bu sonuç, aşağıda özetlendiği gibi çeşitli genellemeleri kabul etmektedir. Chernoff sınırlarının birçok çeşidiyle karşılaşılabilir: orijinal toplamsal form ( mutlak hata üzerinde bir sınır verir ) veya daha pratik çarpımsal form ( hatayı ortalamaya göre sınırlar ).

Katkı formu (mutlak hata)

Aşağıdaki Teorem Wassily Hoeffding'e bağlıdır ve bu nedenle Chernoff-Hoeffding teoremi olarak adlandırılır.

Chernoff-Hoeffding teoremi. Varsayalım X 1 , ..., x , n olan IID değerleri alan rastgele değişkenler, {0, 1}. Let p = E [ X 1 ] ve ε > 0 .
nerede
olan Kullback-Leibler diverjans arasında Bernoulli dağıtılmış parametreleri ile rastgele değişkenler X ve y , sırasıyla. Eğer p 1/2, o zaman bu ne anlama gelir

Daha basit bir bağ kullanılarak teoremi gevşeterek aşağıdaki D ( p + ε || p ) ≥ 2 ε 2 çıkan sonuç, dışbükey bir D ( p + ε || p ) ve aslında bu

Bu sonuç Hoeffding eşitsizliğinin özel bir durumudur . Bazen, sınırlar

p < için hangisi daha güçlüdür1/8, da kullanılır.

Çarpımsal biçim (göreceli hata)

Çarpımsal Chernoff bağlı. Varsayalım X 1 , ..., x , n olan bağımsız değerlere alan rastgele değişkenler {0, 1}. Let X göstermektedirler bunların toplamı ve izin μ = E [ X ] göstermektedirler toplamın beklenen değerini. Sonra herhangi bir δ > 0 için ,

Bunu göstermek için benzer bir kanıt stratejisi kullanılabilir.

Yukarıdaki formül pratikte genellikle hantaldır, bu nedenle aşağıdaki daha gevşek fakat daha uygun sınırlar sıklıkla kullanılır:

hangi eşitsizlik dan izleyin gelen logaritmik eşitsizlikler listesinde . Ya da daha gevşek:

Bağımsız Sınırlı Rastgele Değişkenlerin Toplamları

Chernoff sınırları, dağılımlarından bağımsız olarak, bağımsız, sınırlı rastgele değişkenlerin genel toplamlarına da uygulanabilir; bu Hoeffding eşitsizliği olarak bilinir . Kanıt, diğer Chernoff sınırlarına benzer bir yaklaşım izler, ancak moment üreten fonksiyonları sınırlamak için Hoeffding'in lemmasını uygular (bkz. Hoeffding'in eşitsizliği ).

Hoeffding eşitsizliği . Varsayalım X 1 , ..., x , n olan bağımsız değerlere alan rastgele değişkenler [a, b]. Let X göstermektedirler bunların toplamı ve izin μ = E [ X ] göstermektedirler toplamın beklenen değerini. Sonra herhangi bir δ > 0 için ,

Uygulamalar

Chernoff sınırları içinde çok faydalı uygulamalara sahip set dengeleme ve paket yönlendirme de seyrek ağlar.

İstatistiksel deneyler tasarlanırken küme dengeleme problemi ortaya çıkar. Tipik olarak istatistiksel bir deney tasarlarken, deneydeki her bir katılımcının özellikleri göz önüne alındığında, katılımcıları her bir özelliğin iki grup arasında kabaca mümkün olduğunca dengeli olacağı şekilde 2 ayrı gruba nasıl böleceğimizi bilmemiz gerekir.

Chernoff sınırları, paketleri seyrek ağlarda yönlendirirken ağ tıkanıklığını azaltan permütasyon yönlendirme sorunları için sıkı sınırlar elde etmek için de kullanılır .

Chernoff sınırları, hesaplamalı öğrenme teorisinde , bir öğrenme algoritmasının muhtemelen yaklaşık olarak doğru olduğunu kanıtlamak için kullanılır , yani yüksek olasılıkla, algoritmanın yeterince büyük bir eğitim veri setinde küçük hataya sahip olması.

Chernoff sınırları, bir uygulamanın/algoritmanın "sağlamlık düzeyini", pertürbasyon alanını rastgeleleştirme ile keşfederek değerlendirmek için etkin bir şekilde kullanılabilir. Chernoff sınırının kullanılması, kişinin güçlü - ve çoğunlukla gerçekçi olmayan - küçük tedirginlik hipotezini (tedirginlik büyüklüğü küçüktür) terk etmesine izin verir. Sağlamlık seviyesi, belirli bir algoritmik seçimi, bir donanım uygulamasını veya yapısal parametreleri belirsizliklerden etkilenen bir çözümün uygunluğunu doğrulamak veya reddetmek için kullanılabilir.

matris bağlı

Rudolf Ahlswede ve Andreas Winter , matris değerli rastgele değişkenler için bir Chernoff sınırı tanıttı. Eşitsizliğin aşağıdaki versiyonu Tropp'un çalışmasında bulunabilir.

Let M 1 , ..., M t ölçüde bağımsız matris değerli rastgele değişkenler ve . Matrisin operatör normu ile gösterelim . Eğer neredeyse kesinlikle herkes için geçerlidir her için, sonra £ değerinin > 0

0'dan sapmanın yüksek olasılıkla ε ile sınırlandığı sonucuna varmak için logaritması ile orantılı bir dizi örnek seçmemiz gerektiğine dikkat edin . Genel olarak, ne yazık ki, bir bağımlılık kaçınılmazdır: örneğin, boyutun bir köşegen rastgele işaret matrisini alın . t bağımsız örneklerin toplamının operatör normu , tam olarak t uzunluğundaki d bağımsız rastgele yürüyüş arasındaki maksimum sapmadır . Sabit olasılıkla maksimum sapma üzerinde sabit bir sınır elde etmek için , bu senaryoda t'nin logaritmik olarak d ile büyümesi gerektiğini görmek kolaydır .

Boyutlara bağımlılıktan kaçınmak için M'nin düşük sıralı olduğu varsayılarak aşağıdaki teorem elde edilebilir .

Boyutlara bağımlı olmayan teorem

Let 0 < ε <1 ve M rastgele simetrik gerçek matris olmak ve hemen hemen kesin. M'nin desteğindeki her elemanın en fazla r derecesine sahip olduğunu varsayın . Ayarlamak

Eğer o zaman, neredeyse kesinlikle tutar

nerede M 1 , ..., M t ait istatistiksel bağımsız kopyalarıdır M .

Tamamen rastgele olmayan matrislerle teorem

Garg, Lee, Song ve Srivastava, Wigderson ve Xiao'dan kaynaklanan bir varsayımı doğrulayarak, bir genişletici üzerinde rastgele bir yürüyüş yoluyla örneklenen matris değerli rastgele değişkenlerin toplamları için Chernoff tipi bir sınır olduğunu kanıtladı.

Kyng ve Song, rastgele yayılan ağaçların Laplacian matrisinin toplamları için Chernoff tipi bir sınır kanıtladı.

Örnekleme varyantı

Aşağıdaki Chernoff sınırı varyantı, bir popülasyondaki çoğunluğun bir örneklemde azınlık haline gelme olasılığını sınırlamak için kullanılabilir veya bunun tersi de geçerlidir.

Diyelim ki genel bir A popülasyonu ve bir BA alt popülasyonu var . Alt popülasyonun göreli boyutunu (| B |/| A |) r ile işaretleyin .

Bir k tamsayısını ve k boyutunda rastgele bir SA örneğini seçtiğimizi varsayalım . Örnekteki alt popülasyonun göreli boyutunu (| BS |/| S |) r S ile işaretleyin .

Ardından, her d ∈[0,1] kesri için :

Özellikle, B , A'da çoğunluk ise (yani r > 0.5), B'nin S'de çoğunluk olarak kalma olasılığını ( r S >0.5) aşağıdakileri alarak bağlayabiliriz: d = 1 - 1 / (2 r ):

Bu sınır elbette hiç sıkı değil. Örneğin, r = 0,5 olduğunda, önemsiz bir bağlı Prob > 0 elde ederiz .

Kanıtlar

Chernoff-Hoeffding teoremi (toplamsal form)

Let q = p + ε . ( 1 ) içinde a = nq alarak , şunu elde ederiz:

Şimdi, Pr( X i = 1) = p , Pr( X i = 0) = 1 − p olduğunu bilerek , elimizde

Bu nedenle, hesabı kullanarak infimumu kolayca hesaplayabiliriz:

Denklemi sıfıra ayarlayıp çözüyoruz,

Böylece

Böylece,

As q = p + ε > p bunu görmek t > 0 bizim bağlı tarihinde memnun olduğunu, böylece t . t için çözdükten sonra , bunu bulmak için yukarıdaki denklemlere geri dönebiliriz.

Artık istediğimiz sonuca ulaştık,

Simetrik durum için ispatı tamamlamak için, Y i = 1 − X i rastgele değişkenini tanımlarız , aynı ispatı uygularız ve onu kendi sınırımıza ekleriz.

çarpım formu

Set Pr( X ben = 1) = p ben . ( 1 ) 'e göre,

Yukarıdaki üçüncü satır , e t değerini p i olasılıkla ve 1 değerini 1 - p i olasılıkla aldığı için bunu takip eder . Bu, katkı formu (mutlak hata) için Teoremin ispatındaki yukarıdaki hesaplama ile aynıdır .

Yeniden Yazma olarak ve bu hatırlatarak (sıkı eşitsizlik varsa ile x > 0 ), biz set . Aynı sonuç, doğrudan değiştirilmesi ile elde edilebilir bir ile bağlanan Chernoff'un için denklemde (1 + δ ) u .

Böylece,

t = log(1 + δ ) 'yi δ > 0 yerine t > 0 olacak şekilde ayarlarsak , yerine koyabilir ve bulabiliriz

Bu istenen sonucu kanıtlar.

Ayrıca bakınız

Referanslar

daha fazla okuma