Sahte ilişki - Spurious relationship

Bir arabulucu nedensel zincirde (1) bir faktör iken, bir karıştırıcı, yanlış bir şekilde nedenselliği ima eden sahte bir faktördür (2)

Olarak istatistik , bir sahte bir ilişki ya da sahte bir korelasyon a, matematiksel bir ilişki iki veya daha fazla olay veya değişkenlerin edildiği ilişkili ancak olmayan nedensel olarak ilişkili ya tesadüf ya da belirli bir üçüncü varlığı nedeniyle, görünmeyen faktörü ( "ortak yanıt olarak adlandırılır değişken", "karıştırıcı faktör" veya " gizlenen değişken ").

Örnekler

Sahte bir ilişkinin bir örneği bulunabilir zaman serisi , bir literatür, sahte regresyon bir istatistiksel kanıt yanıltıcı sağlayan bir gerileme doğrusal bir ilişki bağımsız arasında sabit olmayan değişken. Aslında durağan olmama durumu her iki değişkende de birim kök bulunmasından kaynaklanıyor olabilir . Özellikle, herhangi iki nominal ekonomik değişkenin , biri diğeri üzerinde nedensel bir etkisi olmasa bile, birbiriyle ilişkili olması muhtemeldir, çünkü her biri gerçek bir değişken çarpı fiyat düzeyine eşittir ve ikisinde de fiyat düzeyinin ortak varlığı. veri serileri onlara korelasyon verir. (Ayrıca , oranların sahte korelasyonuna bakın .)

Sahte bir ilişkiye başka bir örnek, bir şehrin dondurma satışlarını inceleyerek görülebilir . Şehir yüzme havuzlarında boğulma oranı en yüksek olduğunda satışlar en yüksek olabilir . Dondurma satışlarının boğulmaya neden olduğunu ya da tam tersini iddia etmek, ikisi arasında sahte bir ilişki olduğunu ima etmek olur. Gerçekte, bir ısı dalgası her ikisine de neden olmuş olabilir. Isı dalgası, karıştırıcı değişken olarak da bilinen gizli veya görünmeyen bir değişkenin bir örneğidir .

Yaygın olarak belirtilen bir başka örnek, bir dizi kaynakta yuva yapan leyleklerin sayısı ile o sırada doğan insan bebeklerinin sayısı arasında pozitif bir ilişki olduğunu gösteren bir dizi Hollanda istatistiğidir. Elbette nedensel bir bağlantı yoktu; sadece gözlemlerden dokuz ay önceki hava durumuyla ilişkili oldukları için birbirleriyle ilişkiliydiler. Ancak Höfer ve ark. (2004), yeniden birleşme sonrası Almanya'da, klinik doğumların sayısının leylek popülasyonundaki artışla bağlantılı olmasa da, hastane dışı doğumların leylek popülasyonuyla ilişkili olduğunu gösterebildiği gibi, korelasyonun sadece hava değişikliklerinden daha güçlü olduğunu gösterdi.

Nadir durumlarda, Washington Redskins profesyonel futbol takımının her cumhurbaşkanlığı seçiminden önceki belirli bir maçtaki başarısı ile görevdeki Başkanın siyasi partisinin başarısı arasında olduğu gibi, hiçbir kafa karıştırıcı değişken olmaksızın tamamen alakasız iki değişken arasında sahte bir ilişki ortaya çıkabilir. söz konusu seçimde. 1940 ve 2000 yılları arasında art arda yapılan 16 seçim için Redskins Kuralı , görevdeki Başkanın siyasi partisinin Başkanlığı elinde tutup tutmayacağını doğru bir şekilde eşleştirdi. Kural , 2000 yılında Elias Spor Bürosu korelasyonu keşfettikten kısa bir süre sonra başarısız oldu ; 2004, 2012 ve 2016'da Redskins oyununun ve seçimin sonuçları eşleşmedi. İçeren benzer sahte ilişkisinde Ulusal Futbol Ligi , 1970'lerde, Leonard Koppett borsanın yönü ve o yılın kazanan konferansında arasında bir korelasyona işaret Super Bowl , Super Bowl göstergesi ; ilişki , 21. yüzyılda daha rastgele davranışlara geri dönmeden önce, 20. yüzyılın büyük bir bölümünde kendini korumuştur .

Hipotez testi

Genellikle kişi, iki değişken arasında korelasyon olmayan boş bir hipotezi test eder ve eğer boş hipotez doğru olsaydı, bir veri örneğinden hesaplanan korelasyon, veri örneklerinin (örneğin) %5'inden daha azında meydana gelmiş olsaydı, hipotezi önceden reddetmeyi seçer. Gerçek bir sıfır hipotezi zamanın %95'inde kabul edilirken, gerçek bir korelasyonsuz sıfıra sahip zamanın diğer %5'i yanlış bir şekilde reddedilecek ve bu da sahte bir korelasyonun kabul edilmesine neden olacaktır ( Tip olarak bilinen bir olay). hata veririm ). Burada örnekteki sahte korelasyon, temel alınan popülasyonun gerçek özelliklerini yansıtmayan bir örneğin rastgele seçilmesinden kaynaklanmaktadır.

Sahte ilişkileri algılama

"Sahte ilişki" terimi, istatistikte ve özellikle her ikisi de doğrudan nedensel ilişkileri (X → Y) anlamaya ve tahmin etmeye çalışan deneysel araştırma tekniklerinde yaygın olarak kullanılır . Nedensel olmayan bir korelasyon, her ikisine de (W → X ve W → Y) neden olan bir öncül tarafından sahte bir şekilde oluşturulabilir. Aracı değişkenler (X → W → Y), tespit edilmezse, aracı değişken M için düzeltme yapmadan doğrudan etki yerine toplam etkiyi tahmin edin. Bu nedenle, deneysel olarak tanımlanmış korelasyonlar , sahte ilişkiler göz ardı edilemedikçe nedensel ilişkileri temsil etmez.

deneyler

Deneylerde, olası karıştırıcı faktörler olarak teorik olarak tanımlanmış olanlar da dahil olmak üzere, diğer faktörler kontrol edilerek sahte ilişkiler sıklıkla tanımlanabilir . Örneğin, yeni bir ilacın bakterileri öldürüp öldürmediğini belirlemeye çalışan bir araştırmacıyı düşünün; araştırmacı ilacı bir bakteri kültürüne uyguladığında bakteri ölür. Ancak, kafa karıştırıcı bir değişkenin varlığını ortadan kaldırmaya yardımcı olmak için, başka bir kültür, ilk bahsedilen kültürle karşı karşıya olanlarla mümkün olduğunca neredeyse aynı olan koşullara tabi tutulur, ancak ikinci kültür ilaca tabi tutulmaz. Bu koşullarda görülmeyen bir kafa karıştırıcı faktör varsa, bu kontrol kültürü de ölecektir, böylece ilk kültürün sonuçlarından ilacın etkinliği hakkında bir sonuç çıkarılamaz. Öte yandan, kontrol kültürü ölmezse, araştırmacı ilacın etkili olduğu hipotezini reddedemez.

Deneysel olmayan istatistiksel analizler

Ekonomi gibi verileri çoğunlukla deneysel olmayan disiplinler, nedensel ilişkiler kurmak için genellikle gözlemsel veriler kullanır. Ekonomide kullanılan istatistiksel tekniklerin bütününe ekonometri denir . Ekonometrideki temel istatistiksel yöntem, çok değişkenli regresyon analizidir . Tipik olarak doğrusal bir ilişki, örneğin

ki burada, hipotezi (kaynaklanan değişken olduğu varsayılmış) bağımlı değişken, bir için j  = 1, ...,  k, bir j inci (nedensel bir değişken olduğu varsayılmış) bağımsız değişken ve hata terimi (ihtiva eden dahil edilen bağımsız değişkenlerle ilişkisiz olması gereken diğer tüm nedensel değişkenlerin birleşik etkileri). s'nin hiçbirinin y'den kaynaklanmadığına inanmak için bir neden varsa , katsayıların tahminleri elde edilir. Reddedilen sıfır hipotezi, y'ye neden olan ve eşdeğerde olan alternatif hipotez reddedilemez. Öte yandan, reddedilemeyen sıfır hipotezi, aynı şekilde y üzerinde nedensel etkisinin olmadığı hipotezi de reddedilemez. Burada nedensellik kavramı, katkıda bulunan nedensellik kavramından biridir : Eğer gerçek değer ise , bu durumda, regresyona dahil edilen veya hata teriminde örtük olarak bulunan başka bazı nedensel değişken(ler) olmadıkça , y'deki bir değişiklik y'de bir değişikliğe neden olacaktır . etkisini tam olarak dengeleyecek şekilde; Bu şekilde bir değişiklik olan yeterli değildir değişimi için  y . Benzer şekilde, bir değişiklik olduğunu gerekli değildir değişimi için y bir değişiklik nedeniyle, y hata terimi olarak kapalı (ya da modele dahil başka etken açıklayıcı değişken olarak) bir maddeden kaynaklanıyor olabilir.

Regresyon analizi, diğer ilgili değişkenleri regresör (açıklayıcı değişkenler) olarak dahil ederek kontrol eder. Bu, hem potansiyel olarak neden olan değişkeni hem de potansiyel olarak neden olan değişkeni etkileyen üçüncü bir altta yatan değişkenin varlığından dolayı nedenselliğin yanlış çıkarımını önlemeye yardımcı olur: potansiyel olarak neden olan değişken üzerindeki etkisi, doğrudan regresyona dahil edilerek yakalanır, bu nedenle bu etki, potansiyel olarak nedensel ilgi değişkeninin sahte bir etkisi olarak algılanmayacaktır. Ek olarak, çok değişkenli regresyon kullanımı, örneğin x 1'in (örneğin, x 1x 2y ) dolaylı bir etkisinin doğrudan bir etki ( x 1y ) olduğu şeklinde yanlış bir çıkarım yapmaktan kaçınmaya yardımcı olur .

Bir deneycinin her karıştırıcı faktörü kontrol eden bir deneysel tasarım kullanmaya dikkat etmesi gerektiği gibi, çoklu regresyon kullanıcısı da tüm karıştırıcı faktörleri regresörler arasına dahil ederek kontrol etmeye dikkat etmelidir. Regresyonda bir karıştırıcı faktör atlanırsa, etkisi varsayılan olarak hata teriminde yakalanır ve ortaya çıkan hata terimi, dahil edilen bir (veya daha fazla) regresörle ilişkilendirilirse, tahmin edilen regresyon yanlı veya tutarsız olabilir ( bkz ihmal değişken sapma ).

Regresyon analizine ek olarak, veriler Granger nedenselliğinin var olup olmadığını belirlemek için incelenebilir . Granger nedenselliğinde varlığı hem de göstermektedir X önce gelir y ve bu X tanımlanmasında içeren  y .

Diğer ilişkiler

İstatistiksel analizde aşağıdaki gibi tanımlanan birkaç başka ilişki vardır.

Ayrıca bakınız

Dipnotlar

Referanslar

Dış bağlantılar