Marjinal dağılım - Marginal distribution

Gelen olasılık teorisi ve istatistik , marjinal dağılım a alt kümesi a koleksiyonu arasında rasgele değişkenlerin olan olasılık dağılımı alt kümesinde bulunan değişkenlerin. Diğer değişkenlerin değerlerine başvurmadan alt kümedeki değişkenlerin çeşitli değerlerinin olasılıklarını verir. Bu , diğer değişkenlerin değerlerine bağlı olasılıkları veren koşullu bir dağılımla çelişir .

Marjinal değişkenler , tutulan değişkenlerin alt kümesindeki değişkenlerdir. Bu kavramlar "marjinaldir" çünkü bir tablodaki değerleri satırlar veya sütunlar boyunca toplayarak ve toplamı tablonun kenarlarına yazarak bulunabilirler. Marjinal değişkenlerin dağılımı (marjinal dağılım), atılan değişkenlerin dağılımı üzerinden marjinalize edilerek - yani marjdaki toplamlara odaklanılarak - elde edilir ve atılan değişkenlerin marjinalleştirildiği söylenir .

Buradaki bağlam, üstlenilen teorik çalışmaların veya yapılan veri analizinin daha geniş bir rastgele değişkenler grubunu içermesi, ancak dikkatin bu değişkenlerin azaltılmış sayısıyla sınırlı olmasıdır. Birçok uygulamada, bir analiz, belirli bir rastgele değişkenler topluluğu ile başlayabilir, daha sonra ilk olarak yenilerini tanımlayarak (orijinal rastgele değişkenlerin toplamı gibi) kümeyi genişletebilir ve son olarak, bir alt küme (toplam gibi). Her biri farklı bir değişken alt kümesini marjinal değişkenler olarak ele alan birkaç farklı analiz yapılabilir.

Tanım

Marjinal olasılık kütle fonksiyonu

Bilinen verilen ortak dağıtımı iki ayrık rastgele değişkenlerin diyelim ki, X ve Y, - her iki değişkenin marjinal dağılım X - örneğin bir olasılık dağılımı arasında X değerleri Y dikkate alınmamaktadır. Bu, tüm Y değerleri üzerinden ortak olasılık dağılımı toplanarak hesaplanabilir . Doğal olarak, tersi de doğrudur: Y için marjinal dağılım , X'in ayrı değerleri üzerinden toplanarak elde edilebilir .

, ve

X
Y
x 1 x 2 x 3 x 4 p Y ( y ) ↓
y 1 4/32 2/32 1/32 1/32   8/32
y 2 3/32 6/32 3/32 3/32 15/32
y 3 9/32 0 0 0   9/32
p X ( x ) → 16/32 8/32 4/32 4/32 32/32
Tablo. 1 Bir çift ayrık rastgele değişkenin, X ve Y'nin birleşik ve marjinal dağılımları , bağımlı, dolayısıyla sıfırdan farklı karşılıklı bilgiye sahip I ( X ; Y ). Eklem dağılımının değerleri 3×4 dikdörtgen içindedir; marjinal dağılımların değerleri sağ ve alt kenar boşlukları boyuncadır.

Bir bileşen olasılık her zaman olduğu gibi yazılabilir beklenen değere :

Sezgisel olarak, X'in marjinal olasılığı, belirli bir Y değeri verilen X'in koşullu olasılığını inceleyerek ve ardından bu koşullu olasılığın tüm Y değerlerinin dağılımı üzerinden ortalaması alınarak hesaplanır .

Bu, beklenen değerin tanımından çıkar ( bilinçsiz istatistikçi yasasını uyguladıktan sonra )

Bu nedenle, marjinalleştirme, bir rastgele değişken Y ve başka bir rastgele değişken X  =  g ( Y ) olasılık dağılımının dönüşümü için kuralı sağlar :

Marjinal olasılık yoğunluk fonksiyonu

Verilen iki sürekli rastgele değişkenler X ve Y'nin ortak dağılım bilinen, daha sonra marjinal olasılık yoğunluk fonksiyonu entegre ederek elde edilebilir ortak olasılık , dağıtım üzerinde Y, ve tersi de geçerlidir. Yani

ve

nerede ve .

Marjinal kümülatif dağılım işlevi

Ortak kümülatif dağılım fonksiyonundan marjinal kümülatif dağılım fonksiyonunu bulmak kolaydır. Hatırlamak:

  • İçin ayrık rastgele değişkenlerin ,
  • İçin sürekli rasgele değişkenlerin ,

X ve Y ortaklaşa [ a , b ] × [ c , d ] üzerinde değerler alırsa , o zaman

ve

Eğer d olduğunu ∞, o zaman bu sınırı olan . için de aynı şekilde .

Marjinal dağılıma karşı koşullu dağılım

Tanım

Marjinal olasılık diğer olaylar bağımsız olarak oluşan tek bir olayın olasılığı vardır. Bir şartlı olasılık , diğer taraftan, bir olay bir özel olay verilen oluşur olasılığıdır zaten oluştu. Bu, bir değişken için hesaplamanın başka bir değişkene bağlı olduğu anlamına gelir.

Başka bir değişken verilen bir değişkenin koşullu dağılımı, her iki değişkenin ortak dağılımının diğer değişkenin marjinal dağılımına bölünmesidir. Yani,

  • İçin ayrık rastgele değişkenlerin ,
  • İçin sürekli rasgele değişkenlerin ,

Misal

200 öğrencilik sınıftan çalışılan süre ( X ) ve doğru yüzde ( Y ) hakkında veri olduğunu varsayalım . Varsayılarak X ve Y, kesikli rasgele değişkenler, ortak dağıtımı olan X ve Y tüm olası değerleri listesi ile tanımlanabilir p ( x i , y j Tablo 3'de gösterildiği gibi).

X
Y
Çalışılan süre (dakika)
% doğru x 1 (0-20) x 2 (21-40) x 3 (41-60) x 4 (>60) p Y ( y ) ↓
y 1 (0-20) 2/200 0 0 8/200 10/200
y 2 (21-40) 10/200 2/200 8/200 0 20/200
Y 3 (41-59) 2/200 4/200 32/200 32/200 70/200
Y 4 (60-79) 0 20/200 30/200 10/200 60/200
Y 5 (80-100) 0 4/200 16/200 20/200 40/200
p X ( x ) → 14/200 30/200 86/200 70/200 1
Tablo.3 200 kişilik bir sınıfta çalışılan süre ile doğru yüzde arasındaki ilişkinin iki yönlü veri kümesi tablosu

Marjinal dağılım : 20 veya altına attı kaç öğrencilere belirlemek için kullanılabilir 10 öğrenci veya% 5 anlam.

Koşullu dağılım daha fazla 60 dakika araştırma veya bir öğrenci 20 veya altında puan elde etmesi olasılığını belirlemek için kullanılabilir en az 60 dakika süre ile inceledikten sonra puanlama 20 bir% 11 olasılık ile ilgili olduğu, yani.

Gerçek dünya örneği

Bir yaya geçidinde, trafik ışığına dikkat etmeden karşıdan karşıya geçerken bir yayaya araba çarpması olasılığının hesaplanacağını varsayalım. H , {Hit, Not Hit}'den bir değer alan ayrık bir rastgele değişken olsun. L (trafik ışığı için), {Kırmızı, Sarı, Yeşil}'den bir değer alan ayrı bir rastgele değişken olsun.

Gerçekçi olarak, H, L'ye bağlı olacaktır. Yani, P(H = Hit), L'nin kırmızı, sarı veya yeşil olmasına bağlı olarak farklı değerler alacaktır (ve aynı şekilde P(H = Hit Değil) için). Örneğin, bir kişiye, dikey trafik için ışıklar yeşilken karşıdan karşıya geçmeye çalışırken bir arabanın çarpması, kırmızı ışıktan çok daha olasıdır. Başka bir deyişle, H ve L için verilen herhangi bir olası değer çifti için , yaya ışığın durumunu görmezden gelirse, bu olay çiftinin birlikte meydana gelme olasılığını bulmak için H ve L' nin ortak olasılık dağılımını göz önünde bulundurmak gerekir .

Ancak, P(H = Vuruş) marjinal olasılığını hesaplamaya çalışırken , L'nin özel değerinin bilinmediği ve yayanın ışığın durumunu görmezden geldiği durumda H = Vuruş olasılığı aranır. . Genel olarak, ışıklar kırmızıysa VEYA ışıklar sarıysa VEYA ışıklar yeşilse bir yayaya çarpılabilir. Bu nedenle, marjinal olasılığın cevabı, L'nin tüm olası değerleri için P(H | L) toplanarak bulunabilir, L'nin her değeri, oluşma olasılığı ile ağırlıklandırılır.

Işıkların durumuna bağlı olarak, çarpmanın koşullu olasılıklarını gösteren bir tablo. (Bu tablodaki sütunların toplamının 1 olması gerektiğini unutmayın, çünkü ışığın durumuna bakılmaksızın vurulma veya vurulmama olasılığı 1'dir.)

Koşullu dağıtım:
L
H
Kırmızı Sarı Yeşil
Vurulmamak 0.99 0.9 0,2
vur 0.01 0.1 0,8

Ortak olasılık dağılımını bulmak için daha fazla veri gereklidir. Örneğin, P(L = kırmızı) = 0,2, P(L = sarı) = 0,1 ve P(L = yeşil) = 0,7 olduğunu varsayalım. Koşullu dağılımdaki her sütunun, o sütunun oluşma olasılığıyla çarpılması, merkezi 2x3 giriş bloğunda verilen H ve L'nin ortak olasılık dağılımıyla sonuçlanır. (Bu 2×3 bloktaki hücrelerin toplamının 1 olduğunu unutmayın).

Ortak dağıtım:
L
H
Kırmızı Sarı Yeşil Marjinal olasılık P( H )
Vurulmamak 0.198 0.09 0.14 0.428
vur 0.002 0.01 0,56 0.572
Toplam 0,2 0.1 0.7 1

Marjinal olasılık P(H = İsabet), bu ortak dağılım tablosunun H = İsabet satırı boyunca 0,572 toplamıdır, çünkü bu, ışıklar kırmızı VEYA sarı VEYA yeşil olduğunda vurulma olasılığıdır. Benzer şekilde, P(H = Vurulmadı) marjinal olasılığı H = Vurulmadı satırındaki toplamdır.

Çok değişkenli dağılımlar

İki değişkenli normal dağılımdan birçok örnek. Marjinal dağılımlar kırmızı ve mavi olarak gösterilmiştir. X'in marjinal dağılımı, Y koordinatları dikkate alınmadan X koordinatlarının bir histogramı oluşturularak da yaklaştırılır.

İçin çok değişkenli dağılımlar , benzer formül, sembolleri ile uygulanır X ve / veya Y'nin vektörler olarak yorumlanır. Özellikle, her toplama veya entegrasyon, X içinde bulunanlar dışındaki tüm değişkenler üzerinde olacaktır .

Yani, Eğer X 1 , X 2 , ..., x , n olan ayrık rastgele değişkenler , daha sonra marjinal olasılık yoğunluk fonksiyonu olmalıdır

Eğer X 1 , X 2 , ..., x , n olan sürekli rastgele değişkenler , daha sonra marjinal olasılık yoğunluk fonksiyonu olmalıdır

Ayrıca bakınız

Referanslar

bibliyografya