Etkileşim (istatistikler) - Interaction (statistics)

Eğitim ve ideolojinin deniz seviyesinin yükselmesi endişesi üzerindeki etkileşim etkisi

Olarak istatistik , bir etkileşim üç ya da daha çok değişken arasında bir ilişki göz önüne alındığında ortaya çıkan ve bir sonuca, bir nedensel değişken etkisi olan bir ikinci nedensel değişken durumuna bağlıdır (bir durumu tarif edilebilir, iki etkisi nedenler ek değildir ). Genellikle nedensel ilişkiler açısından düşünülse de, etkileşim kavramı nedensel olmayan ilişkileri de tanımlayabilir. Etkileşimler genellikle regresyon analizleri veya faktöriyel deneyler bağlamında değerlendirilir .

Etkileşimlerin varlığı, istatistiksel modellerin yorumlanması için önemli etkilere sahip olabilir. İlgilenilen iki değişken etkileşirse, etkileşen değişkenlerin her biri ile üçüncü bir "bağımlı değişken" arasındaki ilişki, etkileşen diğer değişkenin değerine bağlıdır. Pratikte bu, özellikle etkileşime girdiği değişkenlerin ölçülmesi veya kontrol edilmesi zor ise, bir değişkenin değerini değiştirmenin sonuçlarını tahmin etmeyi daha da zorlaştırır.

"Etkileşim" kavramı, sosyal ve sağlık bilimleri araştırmalarında yaygın olan ılımlılık kavramıyla yakından ilişkilidir : açıklayıcı bir değişken ile çevresel bir değişken arasındaki etkileşim, açıklayıcı değişkenin etkisinin çevresel değişken tarafından yönetildiğini veya değiştirildiğini gösterir. .

Giriş

Bir etkileşim değişkeni veya etkileşim özelliği , mevcut etkileşimin tamamını veya bir kısmını temsil etmeye çalışmak için orijinal bir değişkenler kümesinden oluşturulan bir değişkendir. Keşfedici istatistiksel analizlerde, etkileşimin daha sonraki bir aşamada diğer daha gerçekçi etkileşim değişkenlerini ikame etme olasılığı ile mevcut olup olmadığını test etmenin temeli olarak orijinal değişkenlerin ürünlerini kullanmak yaygındır. İkiden fazla açıklayıcı değişken olduğunda, ikili etkileşimleri temsil eden ikili ürünler ve daha yüksek dereceli etkileşimleri temsil eden daha yüksek dereceli ürünler ile birkaç etkileşim değişkeni oluşturulur.

İkili faktör A ve nicel değişken X , sonuç değişkeni Y'ye göre analiz edildiğinde etkileşime girer (toplamsal değildir) .

Böylece, bir Y yanıtı ve iki değişken x 1 ve x 2 için toplamsal bir model şöyle olacaktır:

Buna zıt olarak,

Bir olan bir modelin bir örneği etkileşim değişkenler arasında x 1 ve x 2 ( "hata" terimi rastgele değişkenin değeri hangi olmasıdır Y den farklıdır beklenen değer arasında Y , bakınız istatistik hataları ve artıkları ). Çoğu zaman, modeller etkileşim terimi olmadan sunulur , ancak bu, ana etki ile etkileşim etkisini karıştırır (yani, etkileşim terimini belirtmeden, bulunan herhangi bir ana etkinin aslında bir etkileşimden kaynaklanması mümkündür).

modellemede

ANOVA'da

Etkileşimlerin ortaya çıkabileceği basit bir ayar , Varyans Analizi (ANOVA) kullanılarak analiz edilen iki faktörlü bir deneydir . Diyelim ki iki ikili faktörümüz var A ve B . Örneğin, bu faktörler, bir hastaya iki tedaviden birinin uygulanıp uygulanmadığını, tedavilerin tek başına mı yoksa kombinasyon halinde mi uygulandığını gösterebilir. Daha sonra, uygulanan tedavi kombinasyonunun bir fonksiyonu olarak her hasta için ortalama tedavi yanıtını (örneğin tedaviyi takiben semptom seviyeleri) düşünebiliriz. Aşağıdaki tablo olası bir durumu göstermektedir:

B  = 0 B  = 1
bir  = 0 6 7
bir  = 1 4 5

Bu örnekte, iki tedavi arasında herhangi bir etkileşim yoktur - etkileri ilavedir. Bunun nedeni, bu konular arasında ortalama karşılık olarak fark tedavisi alan olduğunu bir ve bu alıcı olmayan tedavi bir -2 bağımsız tedavi olmadığı B uygulanır (-2 = 4-6) ya da (-2 = 5-7 ). Not otomatik olarak bu konular arasında ortalama karşılık olarak fark tedavisi alan izler olduğu B ve tedavi olmayanlardan B bağımsız olarak tedavi olup, aynı olan bir tatbik edilir (7 - 6 = 5-4).

Buna karşılık, aşağıdaki ortalama yanıtlar gözlenirse

B  = 0 B  = 1
bir  = 0 1 4
bir  = 1 7 6

o zaman tedaviler arasında bir etkileşim vardır - etkileri ilave değildir. Daha büyük sayıların daha iyi bir cevaba tekabül ettiğini varsayarsak, bu durumda süje aynı zamanda tedavi A almıyorsa ortalama olarak B tedavisi yararlıdır , ancak tedavi A ile birlikte verildiğinde ortalama olarak zararlıdır . Tedavi A bakılmaksızın tedavi olmadığının ortalama yararlıdır B de uygulanır, daha ziyade tedavi ile birlikte daha yalnız verilirse hem mutlak ve nispi olarak daha yararlıdır B . Bir sonraki bölümde bu özel örnek için benzer gözlemler yapılmıştır.

Niteliksel ve niceliksel etkileşimler

Birçok uygulamada nitel ve nicel etkileşimler arasında ayrım yapmak yararlıdır. Arasında bir miktar etkileşim A ve B etkisinin büyüklüğü bir durum B değerine bağlıdır A , ama etkisi yönü B tüm sabittir A . Arasında niteliksel etkileşim A ve B , her değişkenin etkinin büyüklüğü ve yönü hem de başka bir değişkenin değerine bağlı bir duruma karşılık gelir.

Soldaki araçlarının tablo, aşağıda, Şekil kantitatif etkileşim - işleme bir faydalıdır her iki durumda B verilir ve zaman B verilmemiştir, ancak yarar zaman daha büyüktür B verilmez (yani zaman bir tek başına verilmiştir) . Sağdaki ortalamalar tablosu niteliksel bir etkileşimi gösterir. Bir zaman zararlı B verilir, ancak zaman faydalıdır B verilmez. A'nın verilip verilmemesine bağlı olarak B'nin faydasını düşünürsek, aynı yorumun geçerli olacağına dikkat edin.

B  = 0 B  = 1 B  = 0 B  = 1
bir  = 0 2 1 bir  = 0 2 6
bir  = 1 5 3 bir  = 1 5 3

Nitel ve nicel etkileşimler arasındaki ayrım, değişkenlerin dikkate alındığı sıraya bağlıdır (tersine, toplamsallık özelliği değişkenlerin sırasına göre değişmez). Aşağıdaki tabloda, A tedavisinin etkisine odaklanırsak, nicel bir etkileşim vardır - A tedavisinin verilmesi , B tedavisinin verilip verilmediğine bakılmaksızın ortalama olarak sonucu iyileştirecektir (ancak tedavi edilirse yarar daha fazladır). A tek başına verilir). Bununla birlikte, B tedavisinin etkisine odaklanırsak, nitel bir etkileşim vardır - halihazırda A tedavisi gören bir deneğe B tedavisi vermek (ortalama olarak) işleri daha da kötüleştirirken, B tedavisini almayan bir deneğe vermek. A tedavisi sonucu ortalama olarak iyileştirecektir.

B  = 0 B  = 1
bir  = 0 1 4
bir  = 1 7 6

Birim tedavi katkı

En basit formunda, gözlenen etkisi bu işleme birimi toplamsallık durumlarının varsayım y ij deney biriminden i alan tedavi j toplamı olarak yazılabilir y ij  =  y i  +  t J . Birim işlem toplanabilirliği varsayımı, her işlemin her deney birimi üzerinde tam olarak aynı toplamsal etkiye sahip olduğu anlamına gelir. Herhangi bir deneysel birim, işlemlerden yalnızca birine maruz kalabileceğinden, Cox ve Kempthorne'a göre birim işlem toplanabilirliği varsayımı doğrudan yanlışlanamayan bir hipotezdir.

Bununla birlikte, tedavi ünitesi ilavesinin birçok sonucu tahrif edilebilir. Rastgele bir deney için, işlem toplanabilirliği varsayımı, varyansın tüm işlemler için sabit olduğu anlamına gelir. Bu nedenle, aksi halde, birim işlem toplamsallığı için gerekli bir koşul, varyansın sabit olmasıdır.

Birim işlem toplamsallığının özelliği, bir ölçek değişikliği altında değişmez değildir, bu nedenle istatistikçiler genellikle birim işlem toplamsallığını elde etmek için dönüşümleri kullanır. Yanıt değişkeninin bir parametrik olasılık dağılımları ailesini izlemesi bekleniyorsa, istatistikçi (deney veya gözlemsel çalışmanın protokolünde) yanıtların varyansı stabilize etmek için dönüştürüleceğini belirtebilir. Çoğu durumda, bir istatistikçi, çarpımsal bir modeli takip ettiğine inanılan yanıtlara logaritmik dönüşümlerin uygulanmasını belirtebilir.

Birim işlem toplanabilirliği varsayımı, Kempthorne ve Cox tarafından deneysel tasarımda dile getirildi. Kempthorne'un birim tedavi eklemeliliği ve randomizasyon kullanımı, sonlu nüfus anketi örneklemesinin tasarım tabanlı analizine benzer.

Son yıllarda Donald Rubin'in karşı olgusal ifadeler kullanan terminolojisini kullanmak yaygınlaştı. Bazı y niteliklerine göre iki grup insanı karşılaştırdığımızı varsayalım . Örneğin, birinci grup, tıbbi bir durum için standart bir tedavi uygulanan kişilerden, ikinci grup ise etkisi bilinmeyen yeni bir tedavi gören kişilerden oluşabilir. "Karşıolgusal" bir bakış açısıyla, özniteliği birinci gruba aitse y değerine sahip bir bireyi , ikinci gruba aitse özniteliği τ ( y ) değerine sahip bir bireyi düşünebiliriz . "Birim işlem eklenebilirliği" varsayımı, τ ( y ) =  τ'dir , yani "tedavi etkisi" y'ye bağlı değildir . Belirli bir birey için hem y hem de τ( y )' yi gözlemleyemeyeceğimiz için, bu bireysel düzeyde test edilemez. Bununla birlikte, birim işleme toplamsallık imples bu kümülatif dağılım fonksiyonları F 1 ve F 2 , iki grup için tatmin F 2 ( y ) =  F 1 ( - τ Y grupları 1 bireylerin atama sürece) ve 2 bağımsızdır etkileyen diğer faktörler y (hiçbir vardır, yani karıştırıcılar ). Birim işleme eklenebilirliğinin olmaması, tedavi ataması (örneğin grup 1 veya 2'ye) ile başlangıç ​​veya işlenmemiş y değeri arasındaki bir etkileşim biçimi olarak görülebilir .

Kategorik değişkenler

Bazen etkileşimli değişkenler gerçek sayılar yerine kategorik değişkenlerdir ve bu durumda çalışma bir varyans analizi sorunu olarak ele alınabilir . Örneğin, bir nüfusun üyeleri din ve mesleğe göre sınıflandırılabilir. Bir kişinin boyunu yalnızca kişinin dinine ve mesleğine dayalı olarak tahmin etmek isterse, basit bir eklemeli model, yani etkileşimsiz bir model, genel ortalama boy uzunluğuna belirli bir din için ve belirli bir meslek için başka bir ayarlama ekler. Etkileşimli bir model , katkılı bir modelden farklı olarak , o din ile o meslek arasındaki "etkileşim" için daha fazla düzenleme ekleyebilir. Bu örnek, etkileşim kelimesinin yanlış bir adlandırma olduğundan şüphelenmesine neden olabilir .

İstatistiksel olarak, kategorik değişkenler arasında bir etkileşimin varlığı genellikle bir çeşit varyans analizi (ANOVA) kullanılarak test edilir . Bununla birlikte, bir veya daha fazla değişken doğası gereği sürekli ise, tipik olarak ılımlı çoklu regresyon kullanılarak test edilir. Bu, moderatör diğer iki değişken arasındaki ilişkinin gücünü etkileyen bir değişken olduğu için sözdedir.

Tasarlanmış deneyler

Genichi Taguchi , uygun tepki değişkeni ve dönüşüm seçimi ile bir sistemden etkileşimlerin ortadan kaldırılabileceğini iddia etti . Ancak George Box ve diğerleri bunun genel olarak böyle olmadığını savundu.

Model boyutu

Verilen n tahminci, bir sabiti, her tahmin ediciyi ve her olası etkileşimi içeren doğrusal bir modeldeki terimlerin sayısıdır . Bu miktar katlanarak büyüdüğü için, kolayca uygulanamayacak kadar büyük hale gelir. Modelin boyutunu sınırlamanın bir yöntemi, etkileşimlerin sırasını sınırlamaktır. Örneğin, yalnızca iki yönlü etkileşimlere izin verilirse, terim sayısı olur . Aşağıdaki tablo, her bir tahminci sayısı için terim sayısını ve maksimum etkileşim sırasını gösterir.

Terim sayısı
tahmin ediciler Kadar dahil m -way etkileşimler
2 3 4 5
1 2 2 2 2 2
2 4 4 4 4 4
3 7 8 8 8 8
4 11 15 16 16 16
5 16 26 31 32 32
6 22 42 57 63 64
7 29 64 99 120 128
8 37 93 163 219 256
9 46 130 256 382 512
10 56 176 386 638 1.024
11 67 232 562 1.024 2.048
12 79 299 794 1.586 4.096
13 92 378 1.093 2.380 8.192
14 106 470 1.471 3.473 16.384
15 121 576 1.941 4.944 32.768
20 211 1.351 6.196 21.700 1.048.576
25 326 2.626 15.276 68.406 33.554.432
50 1.276 20.876 251.176 2.369.936 10 15
100 5.051 166.751 4.087.976 79.375.496 10 30
1.000 500.501 166,667,501 10 10 10 12 10 300

regresyonda

Etkileşim etkilerini modellemeye yönelik en genel yaklaşım, yukarıda verilen temel versiyondan başlayarak regresyonu içerir:

burada etkileşim terimi , iki (veya daha fazla) değişkeni çarparak veya Stata gibi modern istatistiksel paketlerde örtük olarak faktöriyel gösterimi kullanarak açıkça oluşturulabilir . x 1 ve x 2 bileşenleri , herhangi bir kombinasyonda ölçümler veya {0,1} kukla değişkenler olabilir . Bir ölçüm değişkeni ile çarpılan bir kukla değişkeni içeren etkileşimler, 0 ve 1 grupları arasındaki eğim farkını tahmin edip test ettikleri için eğim kukla değişkenleri olarak adlandırılır .

Ölçme değişkenleri etkileşimlerde kullanıldığında, genellikle değişkenin ortalamasının (veya diğer makul bir merkezi değerin) sıfır olarak ayarlandığı merkezli versiyonlarla çalışmak istenir. Merkezleme , etkileşim terimi ile ana etkiler arasındaki çoklu bağlantıyı azalttığı için etkileşim modellerindeki ana etkileri daha yorumlanabilir hale getirebilir . Katsayısı bir Yukarıdaki denklemde, örneğin, etkisini temsil x 1 olduğunda X 2 sıfıra eşittir.

İklim değişikliği ile ilgili inançları etkileyen eğitim ve siyasi parti etkileşimi

Etkileşim modellemesine yönelik regresyon yaklaşımları çok geneldir, çünkü ek tahmin edicileri ve sıradan en küçük karelerin ötesinde birçok alternatif belirtimi veya tahmin stratejisini barındırabilirler . Sağlam , nicel ve karışık etkiler ( çok düzeyli ) modeller, geniş bir kategorik, sıralı, sayılmış veya başka türlü sınırlı bağımlı değişkenleri kapsayan genelleştirilmiş doğrusal modelleme gibi olasılıklar arasındadır . Grafik, anket verilerinin olasılık ağırlıklı logit regresyon analizinden bir eğitim*politika etkileşimini gösterir .

Etkileşim grafikleri

Etkileşim grafikleri, değişkenler arasındaki olası etkileşimleri gösterir.

Örnek: Türlerin ve hava sıcaklığının etkileşimi ve bunların vücut sıcaklığına etkisi

Fahrenheit derece cinsinden farklı hava sıcaklıklarında farklı türlerin vücut sıcaklıklarını inceleyen bir çalışma düşünün. Veriler aşağıdaki tabloda gösterilmiştir.

Vücut ısısı tür verileri

Etkileşim grafiği, x ekseni olarak hava sıcaklığını veya türleri kullanabilir. İkinci faktör, etkileşim grafiğindeki çizgilerle temsil edilir.

etkileşim grafiği vücut sıcaklığı

etkileşim grafiği vücut sıcaklığı 2

Tepki (vücut sıcaklığı) üzerindeki etkilerinde iki faktör (hava sıcaklığı ve türler) arasında bir etkileşim vardır, çünkü hava sıcaklığının etkisi türe bağlıdır. Çizgiler paralel olmadığı için etkileşim çizimde belirtilmiştir.

Örnek: inme şiddeti ve tedavinin iyileşme üzerindeki etkisi

İkinci bir örnek olarak, felç şiddeti ile bir ilacın hastanın sağkalımı üzerindeki etkinliği arasındaki etkileşim üzerine bir klinik deneyi ele alalım. Veriler aşağıdaki tabloda gösterilmiştir.

etkileşim inme sağkalım verileri

etkileşim arsa inme hayatta kalma

Etkileşim grafiğinde, hafif ve orta felç grupları için çizgiler paraleldir, bu da ilacın her iki grupta da aynı etkiye sahip olduğunu, dolayısıyla etkileşim olmadığını gösterir. Şiddetli inme grubu için çizgi diğer çizgilerle paralel değildir, bu da inme şiddeti ile sağkalım üzerindeki ilaç etkisi arasında bir etkileşim olduğunu gösterir. Şiddetli inme grubu için çizgi düzdür; bu, bu hastalar arasında, ilaç ve plasebo tedavileri arasında hayatta kalma açısından bir fark olmadığını gösterir. Buna karşılık, hafif ve orta inme grupları için çizgiler sağa doğru eğimlidir, bu da bu hastalar arasında plasebo grubunun ilaçla tedavi edilen gruba göre daha düşük sağkalıma sahip olduğunu gösterir.

Etkileşimler için hipotez testleri

Önemli etkileşimleri test etmek için varyans analizi ve regresyon analizi kullanılır.

Örnek: Kurabiye pişirmede sıcaklık ve zamanın etkileşimi

İyi kurabiyelerin verimi, pişirme sıcaklığından ve fırında kalma süresinden etkilenir mi? Tablo, 8 grup çerez için verileri gösterir.

etkileşim çerezi verim verileri

etkileşim arsa kurabiye pişirme

Veriler, iyi çerezlerin veriminin, (i) sıcaklık yüksek olduğunda ve fırında kalma süresi kısa olduğunda veya (ii) sıcaklık düşük olduğunda ve fırında kalma süresi uzun olduğunda en iyi olduğunu göstermektedir. Kurabiyeler fırında uzun süre yüksek sıcaklıkta bırakılırsa yanmış kurabiyeler vardır ve verim düşüktür.

Grafikten ve verilerden, çizgilerin paralel olmadığı, bir etkileşim olduğunu gösterir. Bu, varyans analizi (ANOVA) kullanılarak test edilebilir. İlk ANOVA modeli etkileşim terimini içermeyecektir. Yani, ilk ANOVA modeli olası etkileşimi yok sayar. İkinci ANOVA modeli etkileşim terimini içerecektir. Yani, ikinci ANOVA modeli, etkileşim için açık bir şekilde bir hipotez testi gerçekleştirir.

ANOVA modeli 1: etkileşim terimi yok; verim ~ sıcaklık + zaman

çerez anova modeli 1

Etkileşimi göz ardı eden ANOVA modelinde, ne sıcaklık ne de zaman verim üzerinde önemli bir etkiye sahip değildir (p=0,91), bu da açıkça yanlış bir sonuçtur. Daha uygun olan ANOVA modeli, olası etkileşimi test etmelidir.

ANOVA model 2: etkileşim terimini içerir; verim ~ sıcaklık * zaman

Çerez anova modeli 2

Sıcaklık:zaman etkileşim terimi önemlidir (p=0.000180). Etkileşim testi ve etkileşim grafiğine dayanarak, zamanın verim üzerindeki etkisinin sıcaklığa bağlı olduğu ve bunun tersi olduğu görülmektedir.

Örnekler

Gerçek dünyadaki etkileşim örnekleri şunları içerir:

  • Kahveye şeker ekleme ve kahveyi karıştırma arasındaki etkileşim . İki bağımsız değişkenin hiçbiri tatlılık üzerinde fazla bir etkiye sahip değildir, ancak ikisinin bir kombinasyonu yapar.
  • Etkileşim ekleme arasındaki karbon için çelik ve su verme . İkisinin de tek başına güç üzerinde çok fazla etkisi yoktur, ancak ikisinin kombinasyonu dramatik bir etkiye sahiptir.
  • Sigara içmek ve asbest liflerini teneffüs etmek arasındaki etkileşim : Her ikisi de akciğer kanseri riskini artırır, ancak asbeste maruz kalmak sigara içenlerde ve içmeyenlerde kanser riskini çoğaltır . Burada asbest solumanın ve sigara içmenin ortak etkisi , her iki etkinin toplamından daha fazladır.
  • Tip 2 diyabet ve diyet için genetik risk faktörleri arasındaki etkileşim (özellikle "batılı" bir diyet modeli). Batı diyet modelinin, yüksek "genetik risk puanı" olan denekler için diyabet riskini artırdığı, ancak diğer denekler için olmadığı gösterilmiştir.
  • Eğitim ve siyasi yönelim arasındaki etkileşim , iklim değişikliği ile ilgili genel kamuoyu algılarını etkiliyor. Örneğin, ABD anketleri genellikle antropojenik iklim değişikliği gerçeğinin kabulünün ılımlı veya liberal anket katılımcıları arasında eğitimle arttığını, ancak en muhafazakarlar arasında eğitimle azaldığını ortaya koymaktadır. Benzer etkileşimlerin bazı iklim dışı bilim veya çevresel algıları etkilediği ve eğitim yerine bilim okuryazarlığı veya diğer bilgi göstergeleri ile çalıştığı gözlemlenmiştir.

Ayrıca bakınız

Referanslar

daha fazla okuma

Dış bağlantılar