Google Grip Trendleri - Google Flu Trends

Google Grip Trendleri verileri, Güney Afrika

Google Grip Trendleri ( GFT ), Google tarafından işletilen bir web hizmetiydi . 25'ten fazla ülke için influenza aktivitesi tahminleri sağladı . Toplayarak Google Arama sorgularını, grip etkinliği hakkında doğru tahminlerde bulunabilmesi için çalıştı. Bu proje ilk olarak 2008'de Google.org tarafından grip salgınlarının tahmin edilmesine yardımcı olmak için başlatıldı.

Google Grip Trendleri, 9 Ağustos 2015'te mevcut tahminleri yayınlamayı durdurdu. Geçmiş tahminler hâlâ indirilebilir durumda ve güncel veriler, beyan edilen araştırma amaçları için sunulmaktadır.

Tarih

Google Grip Trendleri'nin ardındaki fikir, milyonlarca kullanıcının çevrimiçi sağlık izleme davranışlarını izleyerek, toplanan çok sayıda Google arama sorgusunun bir popülasyonda grip benzeri bir hastalık olup olmadığını ortaya çıkarmak için analiz edilebilmesiydi. Google Grip Trendleri, bu bulguları, karşılık gelen bölge için influenza aktivitesinin tarihi bir başlangıç ​​seviyesiyle karşılaştırdı ve ardından aktivite seviyesini minimum, düşük, orta, yüksek veya yoğun olarak bildirdi. Bu tahminler, genel olarak hem ulusal hem de bölgesel olarak sağlık kurumları tarafından toplanan geleneksel sürveyans verileriyle tutarlıdır.

Roni Zeiger , Google Grip Trendleri'nin geliştirilmesine yardımcı oldu.

yöntemler

Google Grip Trendleri, grip eğilimleri hakkında bilgi toplamak için aşağıdaki yöntemi kullanmak olarak tanımlandı.

İlk olarak, 2003'ten 2008'e kadar Amerika Birleşik Devletleri'nde haftalık olarak girilen yaklaşık 50 milyon ortak sorgu için bir zaman serisi hesaplanır. Bir sorgunun zaman serisi, her bir durum için ayrı olarak hesaplanır ve her sorgunun sayısı, sorgu sayısına bölünerek bir kesre normalleştirilir. tüm sorgular bu durumda. Her aramayla ilişkili IP adresi belirlenerek, bu sorgunun girildiği durum belirlenebilir.

Grip benzeri hastalık (ILI) doktor ziyaretinin günlük oranlarını ve ILI ile ilgili arama sorgusunun günlük oranlarını hesaplamak için doğrusal bir model kullanılır:

P , ILI doktor ziyaretinin yüzdesidir ve Q , önceki adımlarda hesaplanan ILI ile ilgili sorgu fraksiyonudur. β 0 kesişim ve β 1 katsayıdır, ε ise hata terimidir.

50 milyon sorgunun her biri, tek bir sorgudan hesaplanan sonucun ABD Hastalık Kontrol ve Önleme Merkezlerinden (CDC) elde edilen gerçek geçmiş ILI verileriyle eşleşip eşleşmediğini görmek için Q olarak test edilir . Bu süreç, doğrusal model kullanıldığında CDC ILI verilerinin en doğru tahminlerini veren en önemli sorguların bir listesini üretir. Ardından ilk 45 sorgu seçilir, çünkü bu sorgular bir araya toplandığında geçmiş verilerine en doğru şekilde uyar. ILI ile ilgili en iyi 45 sorgunun toplamını kullanarak, katsayı elde edilebilmesi için doğrusal model, 2003 ve 2007 yılları arasındaki haftalık ILI verilerine uyarlanır. Son olarak, eğitilmiş model, Amerika Birleşik Devletleri'ndeki tüm bölgelerde grip salgınını tahmin etmek için kullanılır.

Bu algoritma daha sonra kısmen doğrulukla ilgili endişelere yanıt olarak Google tarafından revize edildi ve sonuçlarını çoğaltma girişimleri, algoritma geliştiricilerin "tanımlanan gerçek arama terimlerini gizlemek için açıklanmamış bir ihtiyaç hissettiklerini" öne sürdü.

Mahremiyet endişeleri

Google Grip Trendleri, aramayı gerçekleştiren kişileri tanımlamadan yalnızca milyonlarca anonim arama sorgusunu bir araya getirerek gizlilik ihlallerinden kaçınmaya çalışır. Arama günlükleri, arama sorgusunun orijinal olarak gönderildiği bölgeye geri dönmek için kullanılabilecek kullanıcının IP adresini içerir. Google, verilere erişmek ve hesaplamak için bilgisayarlarda programlar çalıştırır, böylece sürece hiçbir insan dahil olmaz. Google, 9 ay sonra arama günlüklerinde IP adresini anonimleştirme politikasını da uyguladı.

Ancak, Google Grip Trendleri, bazı gizlilik grupları arasında gizlilikle ilgili endişeleri artırdı. Elektronik Mahremiyet Bilgi Merkezi ve Hasta Mahremiyeti Hakları , 2008 yılında, o dönemde Google'ın CEO'su olan Eric Schmidt'e bir mektup gönderdi . Kullanıcı tarafından oluşturulan verilerin kullanılmasının halk sağlığı çabalarını önemli ölçüde destekleyebileceğini kabul ettiler, ancak "kullanıcıya özel soruşturmaların, Google'ın itirazı üzerine bile mahkeme emri veya Başkanlık makamı tarafından zorunlu kılınabileceği" konusundaki endişelerini dile getirdiler.

Darbe

GFT için ilk motivasyon, hastalık aktivitesini erken tespit edip hızlı bir şekilde yanıt verebilmenin mevsimsel ve pandemik influenza etkisini azaltabilmesiydi. Bir rapor, Google Grip Trendleri'nin bölgesel grip salgınlarını CDC (Hastalık Kontrol ve Önleme Merkezleri) tarafından rapor edilmeden 10 gün öncesine kadar tahmin edebildiğiydi.

In 2009 gribi salgını Google Grip Trendleri ABD'de gribi hakkında bilgi izlenir. Şubat 2010'da CDC, Amerika Birleşik Devletleri'nin orta Atlantik bölgesinde yükselen grip vakalarını tespit etti. Ancak, Google'ın grip belirtileriyle ilgili arama sorgularına ilişkin verileri, CDC raporunun yayınlanmasından iki hafta önce aynı artışı gösterebildi.

CDC'nin grip bölümünde sürveyans sorumlusu Dr. Lyn Finelli, “Uyarı ne kadar erken, önleme ve kontrol önlemleri o kadar erken alınabilir ve bu grip vakalarını önleyebilir” dedi. “Ülke nüfusunun yüzde 5 ila 20'si her yıl grip oluyor ve ortalama olarak yaklaşık 36.000 ölüme yol açıyor.”

Google Grip Trendleri, eğilimleri belirlemek ve tahminleri hesaplamak için kullanılabilecek bir toplu zeka örneğidir . Arama motorları tarafından toplanan veriler, arama sorguları insanların filtrelenmemiş istek ve ihtiyaçlarını temsil ettiğinden, önemli ölçüde anlayışlıdır. MIT'de Sloan School of Management'ta profesör olan Thomas W. Malone, "Bu, dünyadaki aksi takdirde görünmez olan kalıpları görmek için Google kullanıcıları tarafından kasıtsız olarak oluşturulan verileri kullanmanın gerçekten akıllıca bir yolu gibi görünüyor" dedi. “Bence kolektif zeka ile mümkün olanın yüzeyini kazıyoruz.”

Kesinlik

İlk Google makalesi, Google Grip Trendleri tahminlerinin CDC verileriyle karşılaştırıldığında %97 doğru olduğunu belirtti. Ancak müteakip raporlar, Google Grip Trendleri'nin tahminlerinin bazen çok yanlış olduğunu iddia etti - özellikle 2011-2013 aralığında, göreceli grip insidansını sürekli olarak fazla tahmin ettiğinde ve 2012-2013 grip sezonundaki bir aralıkta, iki kat daha fazla doktor ziyareti öngördü CDC'nin kaydettiği gibi.

Sorunların bir kaynağı, griple ilgili Google aramaları yapan kişilerin gribin nasıl teşhis edileceği konusunda çok az şey bilmeleridir; grip veya grip belirtileri için yapılan aramalar, grip ile benzer ancak aslında grip olmayan hastalık belirtilerini araştırıyor olabilir. Ayrıca, "ateş" ve "öksürük" gibi Google tarafından izlendiği bildirilen arama terimlerinin analizinin yanı sıra arama algoritmalarında zaman içinde yapılan değişikliklerin etkileri, tahminlerin anlamı hakkında endişelere yol açtı. 2013 sonbaharında Google, daha önce çarpık sonuçlar verdiği tespit edilen haberlerde gribin öne çıkması nedeniyle aramalardaki artışları telafi etmeye çalıştı. Bununla birlikte, bir analiz, "GFT ve gecikmeli CDC verilerini birleştirerek ve GFT'yi dinamik olarak yeniden kalibre ederek, GFT'nin veya yalnızca CDC'nin performansını önemli ölçüde iyileştirebileceğimiz" sonucuna varmıştır. Daha sonraki bir çalışma, Google arama verilerinin gerçekten de tahminleri iyileştirmek için kullanılabileceğini ve yalnızca CDC verilerini kullanan bir modelde görülen hataları yüzde 52,7'ye kadar azaltabileceğini gösteriyor.

Araştırmacılar, orijinal GFT modelini yeniden değerlendirerek, modelin farklı sağlık koşulları hakkında sorguları bir araya getirdiğini ortaya çıkardı; bu, ILI oranlarının aşırı tahmin edilmesine yol açabilecek bir şey; aynı çalışmada, ILI modellemeye yönelik bir dizi daha gelişmiş doğrusal ve doğrusal olmayan daha iyi performans gösteren yaklaşım önerilmiştir.

İlgili sistemler

Böyle Bilişsel Bilimler Osnabrück enstitüsü tarafından grip tahmin projesi olarak benzer projeler birleştirerek, ileriye temel fikri taşıyan sosyal medya verilerin örneğin Twitter ile CDC mekansal ve zamansal hastalığın yayılmasını anlaması bu verilerin ve yapısal modeller.

Referanslar

Dış bağlantılar