Turing testi -Turing test

Turing testinin "standart yorumu"nda, sorgulayıcı olan C oyuncusuna hangi oyuncunun - A mı yoksa B mi - bilgisayar ve hangisinin insan olduğunu belirlemeye çalışma görevi verilir. Sorgulayıcı, karar vermek için yazılı sorulara verilen yanıtları kullanmakla sınırlıdır.

İlk olarak 1950'de Alan Turing tarafından taklit oyunu olarak adlandırılan Turing testi , bir makinenin bir insana eşdeğer veya insandan ayırt edilemez akıllı davranış sergileme yeteneğinin bir testidir. Turing, bir insan değerlendiricisinin, bir insan ile insan benzeri tepkiler üretmek için tasarlanmış bir makine arasındaki doğal dil konuşmalarını yargılayacağını öne sürdü. Değerlendirici, konuşmadaki iki ortaktan birinin bir makine olduğunun ve tüm katılımcıların birbirinden ayrılacağının farkında olacaktır. Konuşma, bilgisayar klavyesi ve ekranı gibi salt metin içeren bir kanalla sınırlı olacaktır, dolayısıyla sonuç, makinenin sözcükleri konuşma olarak işleme yeteneğine bağlı olmayacaktır. Değerlendirici, makineyi insandan güvenilir bir şekilde ayırt edemezse, makinenin testi geçtiği söylenebilir. Test sonuçları, makinenin sorulara doğru yanıtlar verme yeteneğine değil , yalnızca yanıtlarının bir insanın vereceği yanıtlara ne kadar benzediğine bağlı olacaktır.

Test, Turing tarafından Manchester Üniversitesi'nde çalışırken 1950 tarihli " Bilgisayar Makineleri ve İstihbarat " başlıklı makalesinde tanıtıldı . Şu sözlerle açılır: "'Makineler düşünebilir mi? ' sorusunu ele almayı öneriyorum . nispeten açık kelimeler." Turing, sorunun yeni biçimini, iki oyuncunun doğru cinsiyetini belirlemek için bir sorgulayıcının başka bir odadaki bir erkek ve bir kadına sorular sorduğu "taklit oyunu" adı verilen üç kişilik bir oyun olarak tanımlar. Turing'in yeni sorusu şudur: " Taklit oyununda başarılı olabilecek hayal edilebilir dijital bilgisayarlar var mı?" Turing, bu sorunun aslında cevaplanabilecek bir soru olduğuna inanıyordu. Makalenin geri kalanında, "makineler düşünebilir" önermesine yönelik tüm büyük itirazlara karşı çıktı.

Turing testini tanıttığından beri hem çok etkili oldu hem de geniş çapta eleştirildi ve yapay zeka felsefesinde önemli bir kavram haline geldi . John Searle'nin Çin odası gibi eleştirilerinden bazıları tartışmalıdır.

Tarih

felsefi arka plan

Makinelerin düşünmesinin mümkün olup olmadığı sorusunun, düalist ve materyalist zihin görüşleri arasındaki ayrıma sıkı sıkıya bağlı olan uzun bir tarihi vardır . René Descartes , 1637'de Metod Üzerine Söylev'inde Turing testinin çeşitli yönlerini şöyle yazar:

[Nasıl] insan endüstrisi tarafından birçok farklı otomat veya hareketli makine yapılabilir ... Çünkü bir makinenin, sözcükleri söyleyebilmesi ve hatta onun üzerinde bedensel bir tür eyleme bazı tepkiler vermesi için oluşturulmasını kolayca anlayabiliriz. organlarında değişiklik meydana getiren; örneğin, belirli bir yere dokunulduğunda, ona ne söylemek istediğimizi sorabilir; eğer başka bir bölümde canının yandığını haykırabilir, vb. Ancak, huzurunda söylenebilecek her şeye, en aşağı tipteki insanın bile yapabileceği gibi, uygun şekilde cevap vermek için konuşmasını çeşitli şekillerde düzenlemesi asla olmaz.

Burada Descartes, otomatların insan etkileşimlerine yanıt verebildiğini belirtir, ancak bu tür otomatların, kendi mevcudiyetlerinde söylenen şeylere herhangi bir insanın yapabileceği şekilde uygun şekilde yanıt veremeyeceğini savunur. Bu nedenle Descartes, uygun dilsel tepkinin yetersizliğini insanı otomattan ayıran şey olarak tanımlayarak Turing testini önceden şekillendirir. Descartes, gelecekteki otomatların bu tür yetersizliğin üstesinden gelebileceği olasılığını göz önünde bulundurmaz ve bu nedenle, kavramsal çerçevesini ve kriterini önceden tasarlamış olsa bile, Turing testini bu şekilde önermez.

Denis Diderot , 1746 tarihli Pensées philosophiques kitabında , önemli örtük sınırlayıcı varsayımın korunmasına rağmen, katılımcıların yaratılmış eserleri düşünmek yerine doğal canlılar olduğuna dair bir Turing testi kriteri formüle eder:

"Her şeye cevap verebilecek bir papağan bulurlarsa, hiç tereddüt etmeden onun zeki bir varlık olduğunu iddia ederim."

Bu, onun buna katıldığı anlamına gelmez, ancak o zamanlar materyalistlerin zaten ortak bir argümanıydı .

Düalizme göre zihin fiziksel değildir (veya en azından fiziksel olmayan özelliklere sahiptir ) ve bu nedenle salt fiziksel terimlerle açıklanamaz. Materyalizme göre zihin fiziksel olarak açıklanabilir, bu da yapay olarak üretilmiş zihinlerin olasılığını açık bırakır.

1936'da filozof Alfred Ayer , diğer zihinlerin standart felsefi sorusunu düşündü : Diğer insanların da bizimle aynı bilinçli deneyimlere sahip olduğunu nasıl bilebiliriz? Ayer, Language, Truth and Logic adlı kitabında, bilinçli bir insan ile bilinçsiz bir makine arasında ayrım yapmak için bir protokol önerdi: "Bilinçli görünen bir nesnenin gerçekten bilinçli bir varlık olmadığını iddia etmek için sahip olabileceğim tek neden, Yalnızca bir kukla ya da makine, bilincin varlığının ya da yokluğunun belirlendiği ampirik testlerden birini yerine getirememesidir." (Bu öneri Turing testine çok benzer, ancak zekadan çok bilinçle ilgilidir. Ayrıca Ayer'in popüler felsefi klasiğinin Turing'e aşina olduğu kesin değildir.) Başka bir deyişle, bir şey, eğer bir şey başarısız olursa bilinçli değildir. bilinç testi.

Alan Turing

Birleşik Krallık'taki araştırmacılar, 1956'da yapay zeka ( AI ) araştırması alanının kurulmasından on yıl öncesine kadar "makine zekasını" araştırıyorlardı. Bu, gayri resmi bir grup olan Ratio Club üyeleri arasında ortak bir konuydu. Alan Turing'in de aralarında bulunduğu İngiliz sibernetik ve elektronik araştırmacılarından.

Turing, özellikle, en az 1941'den beri makine zekası kavramıyla uğraşıyordu ve "bilgisayar zekası" ile ilgili bilinen en eski sözlerden biri, 1947'de kendisi tarafından yapıldı. Turing'in "Akıllı Makineler" raporunda, " makinelerin akıllı davranış göstermesinin mümkün olup olmadığı sorusu" ve bu araştırmanın bir parçası olarak, sonraki testlerinin öncüsü olarak kabul edilebilecek şeyleri önerdi:

Çok da kötü olmayan bir satranç oyunu oynayacak bir kağıt makinesi tasarlamak zor değil. Şimdi deney için denekler olarak üç adam A, B ve C alın. A ve C oldukça zayıf satranç oyuncuları olacak, B kağıt makinesini çalıştıran operatör. ... Hareketleri iletmek için bazı düzenlemelerle iki oda kullanılır ve C ile A veya kağıt makinesi arasında bir oyun oynanır. C hangisinin oynadığını söylemekte oldukça zorlanabilir.

" Bilgisayar Makineleri ve Zeka " ( 1950 ), Turing tarafından yalnızca makine zekasına odaklanan ilk yayınlanmış makaleydi. Turing 1950'deki makalesine " 'Makineler düşünebilir mi? ' sorusunu düşünmeyi öneriyorum" iddiasıyla başlıyor . ". Turing bunu yapmamayı seçer; bunun yerine soruyu "bununla yakından ilgili ve nispeten açık kelimelerle ifade edilen" yeni bir soruyla değiştirir. Özünde, "Makineler düşünebilir mi?" sorusunu değiştirmeyi öneriyor. "Makineler (düşünen varlıklar olarak) yapabileceğimizi yapabilir mi?" Turing'e göre yeni sorunun avantajı, "bir insanın fiziksel ve entelektüel kapasiteleri arasında oldukça keskin bir çizgi" çekmesidir.

Bu yaklaşımı göstermek için Turing , bir erkek ve bir kadının ayrı odalara girdiği ve konukların bir dizi soru yazarak ve daktiloda yazılanları okuyarak onları ayırt etmeye çalıştıkları "taklit oyunu" olarak bilinen bir parti oyunundan esinlenen bir test önermektedir . cevaplar geri gönderildi. Bu oyunda hem erkek hem de kadın, konukları öteki olduklarına ikna etmeyi amaçlar. (Huma Shah, oyunun bu iki insanlı versiyonunun Turing tarafından sadece okuyucuyu makine-insan soru-cevap testine tanıtmak için sunulduğunu savunuyor.) Turing, oyunun yeni versiyonunu şöyle tanımladı:

Şimdi şu soruyu soruyoruz: "Bu oyunda bir makine A'nın yerini aldığında ne olacak?" Sorgulayıcı, oyun bir erkek ve bir kadın arasında oynandığında olduğu gibi, oyun bu şekilde oynandığında da yanlış karar verecek mi? Bu sorular, orijinal "Makineler düşünebilir mi?" sorumuzun yerini alıyor.

Makalenin ilerleyen bölümlerinde Turing, yalnızca bir bilgisayar ve bir erkekle sohbet eden bir yargıcı içeren "eşdeğer" alternatif bir formülasyon önermektedir. Bu formülasyonların hiçbiri Turing testinin bugün daha yaygın olarak bilinen versiyonuyla tam olarak eşleşmezken, 1952'de üçüncü bir formül önerdi. Turing'in BBC radyo yayınında tartıştığı bu versiyonda, bir jüri bir bilgisayar ve rolü hakkında sorular soruyor. Bilgisayarın amacı, jürinin önemli bir bölümünü onun gerçekten bir erkek olduğuna inandırmaktır.

Turing'in makalesi , makalenin yayınlanmasından bu yana geçen yıllarda ortaya atılan yapay zekaya karşı tüm büyük argümanları içeren dokuz olası itirazı değerlendirdi (bkz. " Bilgisayar Makineleri ve Zeka ").

ELİZA ve PARRY

1966'da Joseph Weizenbaum , Turing testini geçen bir program yarattı. ELIZA olarak bilinen program, bir kullanıcının anahtar kelimeler için yazdığı yorumları inceleyerek çalıştı. Bir anahtar kelime bulunursa, kullanıcının yorumlarını dönüştüren bir kural uygulanır ve sonuçta ortaya çıkan cümle döndürülür. Bir anahtar kelime bulunamazsa, ELIZA ya genel bir karşılık vererek ya da önceki yorumlardan birini tekrarlayarak yanıt verir. Ek olarak, Weizenbaum, ELIZA'yı Rogerian bir psikoterapistin davranışını kopyalamak için geliştirdi ve ELIZA'nın "gerçek dünya hakkında neredeyse hiçbir şey bilmeme pozunu üstlenmekte özgür" olmasına izin verdi. Bu tekniklerle, Weizenbaum'un programı bazı insanları gerçek bir insanla konuştuklarına inandırmayı başardı ve bazı denekler "ELIZA'nın [...] insan olmadığına ikna etmek çok zor." Bu nedenle, bazıları tarafından ELIZA'nın Turing testini geçebilen programlardan biri (belki de ilk) olduğu iddia edilmektedir, ancak bu görüş oldukça tartışmalıdır ( aşağıdaki sorgulayıcıların Naïveté'sine bakınız).

Kenneth Colby , 1972'de PARRY'yi "tutumlu ELIZA" olarak tanımlanan bir program yarattı . Weizenbaum tarafından kullanılana benzer (daha gelişmiş olsa da) bir yaklaşım kullanarak paranoyak bir şizofren davranışını modellemeye çalıştı . Çalışmayı doğrulamak için PARRY, 1970'lerin başında Turing testinin bir varyasyonu kullanılarak test edildi. Bir grup deneyimli psikiyatrist, gerçek hastaların ve PARRY'yi teleprinterlar aracılığıyla çalıştıran bilgisayarların bir kombinasyonunu analiz etti . 33 psikiyatristten oluşan başka bir gruba konuşmaların dökümleri gösterildi. Daha sonra iki gruptan hangi "hastaların" insan ve hangilerinin bilgisayar programı olduğunu belirlemeleri istendi. Psikiyatristler, doğru tanımlamayı zamanın yalnızca yüzde 52'sinde yapabildiler - bu rastgele tahminle tutarlı bir rakam.

21. yüzyılda, bu programların (artık " chatbot " olarak bilinen) sürümleri insanları kandırmaya devam ediyor. Bir kötü amaçlı yazılım programı olan "CyberLover", İnternet kullanıcılarını "kimlikleri hakkında bilgi vermeye veya bilgisayarlarına kötü amaçlı içerik gönderecek bir web sitesini ziyaret etmeye yönlendirmeye" ikna ederek onları avlar. Program, "kişisel verilerini toplamak için çevrimiçi ilişkiler arayan" insanlarla flört eden bir "sevgililer günü riski" olarak ortaya çıktı.

Çin odası

John Searle'nin 1980 tarihli Minds, Brains and Programs adlı makalesi " Çin odası " düşünce deneyini önerdi ve Turing testinin bir makinenin düşünüp düşünemeyeceğini belirlemek için kullanılamayacağını savundu. Searle, yazılımın (ELIZA gibi) sadece anlamadıkları sembolleri manipüle ederek Turing testini geçebileceğini belirtti. Anlamadan, insanların yaptığı gibi "düşünme" olarak tanımlanamazlardı. Bu nedenle Searle, Turing testinin makinelerin düşünebildiğini kanıtlayamayacağı sonucuna vardı. Turing testinin kendisi gibi, Searle'nin argümanı da hem geniş çapta eleştirildi hem de onaylandı.

Searle ve diğerleri gibi zihin felsefesi üzerine çalışan argümanlar , zekanın doğası, akıllı makinelerin olasılığı ve 1980'ler ve 1990'lar boyunca devam eden Turing testinin değeri hakkında daha yoğun bir tartışmayı ateşledi.

Loebner Ödülü

Loebner Ödülü, Kasım 1991'de düzenlenen ilk yarışma ile pratik Turing testleri için yıllık bir platform sağlar. Hugh Loebner tarafından yazılmıştır . Amerika Birleşik Devletleri, Massachusetts'teki Cambridge Davranış Araştırmaları Merkezi , 2003 yarışmasına kadar olan ödülleri düzenledi. Loebner'ın açıkladığı gibi, rekabetin yaratılmasının bir nedeni, en azından kısmen, 40 yıldır tartışılmasına rağmen Turing testini uygulamak için adım atmadığından, AI araştırmasının durumunu ilerletmek.

1991'deki ilk Loebner Ödülü yarışması, Turing testinin uygulanabilirliği ve onu takip etmenin değeri hakkında hem popüler basında hem de akademide yeni bir tartışmaya yol açtı. İlk yarışma, saf sorgulayıcıları yanlış kimlik belirleme konusunda kandırmayı başaran, tanımlanabilir hiçbir zekaya sahip olmayan akılsız bir program tarafından kazanıldı. Bu, Turing testinin bazı eksikliklerini vurguladı ( aşağıda tartışıldı ): Kazanan, en azından kısmen, "insan yazım hatalarını taklit edebildiğinden" kazandı; bilgisiz sorgulayıcılar kolayca kandırıldılar; ve AI'daki bazı araştırmacılar, testin yalnızca daha verimli araştırmalardan bir dikkat dağıtıcı olduğunu hissetmeye yönlendirildi.

Gümüş (yalnızca metin) ve altın (ses ve görsel) ödüller hiçbir zaman kazanılmadı. Bununla birlikte, yarışma, hakimlerin görüşlerine göre, o yılın girişleri arasında "en insani" konuşma davranışını gösteren bilgisayar sistemi için her yıl bronz madalya verdi. Yapay Dilsel İnternet Bilgisayar Varlığı (ALICE) son zamanlarda üç kez bronz ödül kazandı (2000, 2001, 2004). Learning AI Jabberwacky 2005 ve 2006'da kazandı.

Loebner Ödülü, konuşma zekasını test eder; Kazananlar genellikle chatterbot programları veya Yapay Konuşma Varlıkları (ACE)'dir . Erken Loebner Ödülü kuralları, konuşmaları kısıtladı: Her giriş ve gizli insan tek bir konu üzerinde sohbet etti, bu nedenle sorgulayıcılar, varlık etkileşimi başına bir sorgulama satırıyla sınırlandırıldı. Kısıtlı konuşma kuralı, 1995 Loebner Ödülü için kaldırıldı. Loebner Ödülleri'nde yargıç ve tüzel kişi arasındaki etkileşim süresi değişiklik göstermiştir. Loebner 2003'te Surrey Üniversitesi'nde, her sorgulayıcıya bir varlık, makine veya gizli insanla etkileşime girmesi için beş dakika izin verildi. 2004 ile 2007 arasında, Loebner Ödüllerinde izin verilen etkileşim süresi yirmi dakikadan fazlaydı.

Sürümler

Alan Turing'in "Bilgisayar Makineleri ve İstihbarat" bölümünde tanımladığı gibi taklit oyun. Oyuncu C, bir dizi yazılı soru aracılığıyla, diğer iki oyuncudan hangisinin erkek, hangisinin kadın olduğunu belirlemeye çalışır. Adam A, oyuncu C'yi yanlış karar vermesi için kandırmaya çalışırken, B oyuncusu C oyuncusuna yardım etmeye çalışır. Şekil Saygın, 2000'den uyarlanmıştır.

Saul Traiger, Turing testinin, ikisi "Bilgisayar Makineleri ve Zeka" bölümünde sunulan ve biri de "Standart Yorum" olarak tanımladığı en az üç temel versiyonu olduğunu savunuyor. "Standart Yorum" un Turing tarafından mı yoksa onun makalesinin yanlış okunmasına mı dayandığı konusunda bazı tartışmalar olsa da, bu üç versiyon eşdeğer olarak kabul edilmez ve güçlü ve zayıf yönleri farklıdır.

Huma Shah, Turing'in kendisinin bir makinenin düşünüp düşünemeyeceğiyle ilgilendiğini ve bunu incelemek için basit bir yöntem sunduğuna dikkat çekiyor: insan-makine soru-cevap oturumları aracılığıyla. Shah, Turing'in tanımladığı ve iki farklı şekilde uygulanabileceğini açıkladığı bir taklit oyunu olduğunu savunuyor: a) bire bir sorgulayıcı-makine testi ve b) bir makinenin bir insanla aynı anda karşılaştırılması, her ikisi de bir sorgulayıcı tarafından paralel olarak sorgulanıyor. Turing testi performans kapasitesinde bir ayırt edilemezlik testi olduğundan, sözlü versiyon doğal olarak sözlü ve sözlü olmayan (robotik) tüm insan performans kapasitesini genelleştirir.

taklit oyunu

Turing'in orijinal makalesi, üç oyuncu içeren basit bir parti oyununu anlatıyor. Oyuncu A bir erkek, oyuncu B bir kadın ve oyuncu C (sorgulayıcı rolünü oynuyor) her iki cinsiyetten de. Taklit oyununda, oyuncu C, oyuncu A'yı veya oyuncu B'yi göremez ve onlarla yalnızca yazılı notlar yoluyla iletişim kurabilir. Oyuncu A ve oyuncu B'ye sorular sorarak, oyuncu C, ikisinden hangisinin erkek hangisinin kadın olduğunu belirlemeye çalışır. Oyuncu A'nın rolü, sorgulayıcıyı yanlış karar vermesi için kandırırken, oyuncu B, sorgulayıcının doğru kararı vermesine yardımcı olmaya çalışır.

Turing daha sonra sorar:

"Bu oyunda bir makine A'nın rolünü aldığında ne olacak? Sorgucu, oyun bu şekilde oynandığında, oyun bir erkek ve bir kadın arasında oynandığında olduğu kadar sık ​​yanlış karar verecek mi?" Bu sorular, orijinal "Makineler düşünebilir mi?" sorumuzun yerini alıyor.

A oyuncusunun bir bilgisayarla değiştirildiği orijinal taklit oyun testi. Bilgisayar şimdi adam rolüyle suçlanırken, B oyuncusu sorgulayıcıya yardım etmeye devam ediyor. Şekil Saygın, 2000'den uyarlanmıştır.

İkinci versiyon daha sonra Turing'in 1950 tarihli makalesinde yayınlandı. Orijinal taklit oyun testine benzer şekilde, oyuncu A'nın rolü bir bilgisayar tarafından gerçekleştirilir. Ancak, B oyuncusu rolünü bir kadın yerine bir erkek oynuyor.

Dikkatimizi belirli bir dijital bilgisayar C'ye sabitleyelim. Bu bilgisayarı yeterli depolamaya sahip olacak şekilde değiştirerek, hareket hızını uygun şekilde artırarak ve ona uygun bir program sağlayarak, C'nin rolü tatmin edici bir şekilde oynamasını sağlayabileceği doğru mu? Taklit oyununda A'nın bir parçası, B'nin bir parçası bir adam tarafından mı alınmış?

Bu versiyonda, hem oyuncu A (bilgisayar) hem de oyuncu B, sorgulayıcıyı yanlış bir karar vermesi için kandırmaya çalışıyor.

Standart kök yorumlama

Standart yorum orijinal belgede yer almamaktadır, ancak hem kabul edilmekte hem de tartışılmaktadır. Yaygın anlayışa göre Turing testinin amacı, bir bilgisayarın sorgulayıcıyı insan olduğuna inandırıp kandıramayacağını belirlemek değil, daha çok bir bilgisayarın bir insanı taklit edip edemeyeceğini belirlemektir . Bu yorumun Turing tarafından tasarlanıp tasarlanmadığı konusunda bazı anlaşmazlıklar olsa da, Sterrett bunun olduğuna inanıyor ve bu nedenle ikinci versiyonu bununla birleştiriyor, oysa Traiger gibi diğerleri bunu yapmıyor - bu yine de " standart yorum." Bu versiyonda, oyuncu A bir bilgisayar ve oyuncu B her iki cinsiyetten bir kişidir. Sorgulayıcının rolü, hangisinin erkek hangisinin kadın olduğunu belirlemek değil, hangisinin bilgisayar hangisinin insan olduğunu belirlemektir. Standart yorumun temel sorunu, sorgulayıcının hangi yanıtlayanın insan hangisinin makine olduğunu ayırt edememesidir. Süreyle ilgili sorunlar var, ancak standart yorum genellikle bu sınırlamayı makul olması gereken bir şey olarak görüyor.

Taklit oyun ve standart Turing testi

Turing'in testin alternatif formülasyonlarından hangisinin amaçlandığı konusunda tartışmalar ortaya çıktı. Sterrett, 1950 tarihli makalesinden iki farklı testin çıkarılabileceğini ve Turing'in sözlerine göre bunların eşdeğer olmadığını savunuyor. Parti oyununu kullanan ve başarı sıklıklarını karşılaştıran teste "Orijinal Taklit Oyun Testi", bir insan yargıcın bir insan ve bir makineyle sohbet etmesinden oluşan teste "Standart Turing Testi" adı verilir. Sterrett'in bunu taklit oyununun ikinci versiyonundan ziyade "standart yorumlama" ile eşitlediğini belirterek. Sterrett, standart Turing testinin (STT) eleştirmenlerinin bahsettiği sorunlara sahip olduğunu kabul eder, ancak tam tersine, bu şekilde tanımlanan orijinal taklit oyun testinin (OIG testi), çok önemli bir fark nedeniyle birçoğuna karşı bağışık olduğunu hisseder: STT, makine zekası için bir kriter belirlemede insan performansını kullanmasına rağmen, insan performansına benzerliği kriter yapmaz. Bir adam OIG testinde başarısız olabilir, ancak başarısızlığın becerikliliğin eksikliğini göstermesinin bir zeka testinin bir erdemi olduğu iddia edilir: OIG testi, yalnızca "insan konuşma davranışının simülasyonunu" değil, zeka ile ilişkili becerikliliği gerektirir. OIG testinin genel yapısı, taklit oyunların sözlü olmayan versiyonlarıyla bile kullanılabilir.

Yine başka yazarlar, Turing'in taklit oyununun parti versiyonunu kullanarak önerdiği testin karşılaştırmalı bir başarı sıklığı kriterine dayandığı şeklindeki ifadesini nasıl dikkate alacağını belirtmeden, Turing'i taklit oyununun kendisinin test olduğunu önerdiği şeklinde yorumladılar. oyunun bir turunda başarılı olma kapasitesinden ziyade o taklit oyununda.

Saygın, belki de orijinal oyunun, bilgisayarın katılımını gizlediği için daha az önyargılı bir deneysel tasarım önermenin bir yolu olduğunu öne sürdü. Taklit oyunu aynı zamanda standart yorumda bulunmayan bir "sosyal hack" içerir, çünkü oyunda hem bilgisayar hem de erkek insan, olmadıkları biri gibi davranarak oynamak zorundadır.

Sorgulayıcı bilgisayar hakkında bilgi sahibi olmalı mı?

Herhangi bir laboratuvar testinin çok önemli bir parçası, bir kontrolün olması gerektiğidir. Turing, testlerinde sorgulayıcının katılımcılardan birinin bilgisayar olduğunun farkında olup olmadığını asla netleştirmez. Sadece oyuncu A'nın bir makine ile değiştirileceğini belirtir, oyuncu C'nin bu değişiklikten haberdar edilmesi gerektiğini değil. Colby, FD Hilf, S Weber ve AD Kramer, PARRY'yi test ederken, sorguyu yapanların, sorgulananlardan bir veya daha fazlasının sorgulama sırasında bir bilgisayar olduğunu bilmelerine gerek olmadığını varsayarak yaptılar. Ayşe Saygın, Peter Swirski ve diğerlerinin vurguladığı gibi, bu, testin uygulanması ve sonucu için büyük bir fark yaratıyor. 1994 ve 1999 yılları arasında Loebner'in bire bir (sorgulayıcı-gizli muhatap) AI yarışmalarının transkriptlerini kullanarak Gricean özdeyiş ihlallerini inceleyen deneysel bir çalışma olan Ayşe Saygın, bilgisayarları bilen ve bilmeyen katılımcıların yanıtları arasında önemli farklılıklar buldu. dahil olmak.

Güçlü

İzlenebilirlik ve basitlik

Turing testinin gücü ve çekiciliği basitliğinden kaynaklanmaktadır. Zihin felsefesi , psikoloji ve modern sinirbilim , "zeka" ve "düşünme"nin makinelere uygulanabilecek kadar kesin ve genel tanımlarını sağlayamadı. Bu tür tanımlar olmadan yapay zeka felsefesinin temel soruları yanıtlanamaz. Turing testi, kusurlu olsa bile, en azından gerçekten ölçülebilen bir şey sağlar. Bu nedenle, zor bir felsefi soruyu yanıtlamak için pragmatik bir girişimdir.

Konunun genişliği

Testin formatı, sorgulayıcının makineye çok çeşitli entelektüel görevler vermesini sağlar. Turing, "soru-cevap yönteminin, dahil etmek istediğimiz hemen hemen her insan çabası alanını tanıtmak için uygun göründüğünü" yazdı. John Haugeland , "kelimeleri anlamak yeterli değil, konuyu da anlamalısınız" diye ekliyor.

İyi tasarlanmış bir Turing testini geçmek için makinenin doğal dili , mantığı kullanması , bilgi sahibi olması ve öğrenmesi gerekir . Test, video girişinin yanı sıra nesnelerin geçilebileceği bir "tarama" içerecek şekilde genişletilebilir: bu, makineyi iyi tasarlanmış görüş ve robotiğin yetenekli kullanımını göstermeye zorlayacaktır . Bunlar birlikte, yapay zeka araştırmalarının çözmek istediği neredeyse tüm büyük sorunları temsil ediyor.

Feigenbaum testi , Turing testi için mevcut olan çok çeşitli konulardan yararlanmak için tasarlanmıştır. Makineyi edebiyat veya kimya gibi belirli alanlardaki uzmanların yetenekleriyle karşılaştıran Turing'in soru-cevap oyununun sınırlı bir şeklidir . IBM'in Watson makinesi , insan bilgisinin bir makineye karşı makine televizyonu bilgi yarışması programında başarıya ulaştı, Jeopardy!

Duygusal ve estetik zekaya vurgu

Bir Cambridge onur derecesi matematik mezunu olarak, Turing'in son derece teknik bir alanda uzmanlık bilgisi gerektiren bir bilgisayar zekası testi önermesi ve bu nedenle konuya daha yeni bir yaklaşım öngörmesi beklenebilirdi . Bunun yerine, daha önce belirtildiği gibi, 1950'deki çığır açıcı makalesinde tanımladığı test, bilgisayarın ortak bir parti oyununda başarılı bir şekilde rekabet edebilmesini gerektirir ve bu, inandırıcı bir şekilde kadın yarışmacı gibi davranın.

İnsan cinsel dimorfizminin en eski konulardan biri olarak statüsü göz önüne alındığında , yukarıdaki senaryoda, cevaplanacak soruların ne uzmanlaşmış olgusal bilgiyi ne de bilgi işleme tekniğini içereceği zımnendir. Bilgisayarın önündeki zorluk, daha ziyade, kadının rolüne empati göstermek ve aynı zamanda karakteristik bir estetik duyarlılık göstermek olacaktır - her ikisi de Turing'in hayal ettiği bu diyalog parçasında sergilenmektedir:

Sorgulayıcı: X lütfen bana saçının uzunluğunu söyler mi?
Yarışmacı: Saçlarım çakıllı ve en uzun teller yaklaşık dokuz inç uzunluğunda.

Turing hayali diyaloglarından birine bazı özel bilgiler kattığında, konu matematik veya elektronik değil şiirdir:

Sorgulayıcı: Sonenizin ilk satırında, "Seni bir yaz gününe benzeteyim mi", "bir bahar günü" de aynı etkiyi yapmaz mı, yoksa daha iyi olmaz mı?
Tanık: Tarama yapmaz .
Sorgulayıcı: "Bir kış günü"ne ne dersiniz? Bu iyi tarama olur.
Tanık: Evet, ama kimse bir kış günüyle karşılaştırılmak istemez.

Turing böylece bir yapay zekanın bileşenleri olarak empati ve estetik duyarlılığa olan ilgisini bir kez daha ortaya koyuyor; ve bir AI run amok'tan gelen tehdidin artan farkındalığı ışığında, bu odaklanmanın belki de Turing'in tarafında kritik bir sezgiyi temsil ettiği, yani duygusal ve estetik zekanın bir " dost AI ". Bununla birlikte, Turing'in bu yönde verebileceği ilhamın ne olursa olsun, orijinal vizyonunun korunmasına bağlı olduğu, yani ayrıca Turing testinin "standart bir yorumunun" ilan edilmesinin -yani, Yalnızca söylemsel bir zekaya odaklanan bir şey, biraz dikkatle değerlendirilmelidir.

zayıf yönler

Turing, Turing testinin " zeka " ya da başka herhangi bir insan kalitesi ölçüsü olarak kullanılabileceğini açıkça belirtmedi . "Düşünme" kelimesine açık ve anlaşılır bir alternatif sağlamak istedi, daha sonra "düşünen makineler" olasılığına yönelik eleştirilere yanıt vermek ve araştırmanın ilerleyebileceği yollar önermek için kullanabilirdi. Bilişsel bilim adamı Gary Marcus da dahil olmak üzere bu alandaki çok sayıda uzman , Turing testinin yalnızca insanları kandırmanın ne kadar kolay olduğunu gösterdiğinde ve makine zekasının bir göstergesi olmadığında ısrar ediyor.

Bununla birlikte, Turing testi, bir makinenin "düşünme yeteneğinin" veya "zekasının" bir ölçüsü olarak önerilmiştir. Bu öneri hem filozoflardan hem de bilgisayar bilimcilerinden eleştiri aldı. Bir sorgulayıcının, davranışını insan davranışıyla karşılaştırarak bir makinenin "düşünüp düşünmediğini" belirleyebileceğini varsayar. Bu varsayımın her öğesi sorgulanmıştır: sorgulayıcının yargısının güvenilirliği, yalnızca davranışı karşılaştırmanın değeri ve makineyi bir insanla karşılaştırmanın değeri. Bu ve diğer hususlar nedeniyle, bazı AI araştırmacıları, testin kendi alanlarıyla olan ilişkisini sorguladı.

Genel olarak insan zekasına karşı zeka

Turing testinin zayıflığı 1.svg

Turing testi, bilgisayarın akıllıca davranıp davranmadığını doğrudan test etmez. Yalnızca bilgisayarın bir insan gibi davranıp davranmadığını test eder. İnsan davranışı ve akıllı davranış tam olarak aynı şey olmadığından, test zekayı iki şekilde doğru bir şekilde ölçmekte başarısız olabilir:

Bazı insan davranışları zekice değil
Turing testi, makinenin akıllı olup olmadıklarına bakılmaksızın tüm insan davranışlarını gerçekleştirebilmesini gerektirir. Hakaretlere yatkınlık, yalan söyleme eğilimi veya basitçe yüksek sıklıkta yazım hataları gibi hiç akıllıca kabul edilmeyen davranışları bile test eder . Bir makine bu akıllı olmayan davranışları ayrıntılı olarak taklit edemezse testi geçemez.
Bu itiraz The Economist tarafından 1992'deki ilk Loebner Ödülü yarışmasından kısa bir süre sonra yayınlanan " yapay aptallık " başlıklı bir makalede dile getirildi. Makale, ilk Loebner kazananının zaferinin, en azından kısmen, "taklit etme" yeteneğine bağlı olduğunu belirtti. insan yazım hataları." Turing'in kendisi, oyunun daha iyi "oyuncuları" olmak için programların çıktılarına hatalar eklemesini önermişti.
Bazı akıllı davranışlar insanlık dışıdır
Turing testi, zor problemleri çözme veya orijinal içgörüler ortaya çıkarma yeteneği gibi son derece zeki davranışları test etmez. Aslında, özellikle makinenin aldatmasını gerektirir: eğer makine bir insandan daha zekiyse, kasıtlı olarak fazla zeki görünmekten kaçınmalıdır. Bir insanın çözmesi neredeyse imkansız olan bir hesaplama problemini çözecek olsaydı, sorgulayıcı programın insan olmadığını bilirdi ve makine testi geçemezdi.
İnsanların yeteneklerinin ötesindeki zekayı ölçemediğinden, test, insanlardan daha zeki sistemler oluşturmak veya değerlendirmek için kullanılamaz. Bu nedenle, süper akıllı sistemleri değerlendirebilecek birkaç test alternatifi önerilmiştir.

Dil Merkezli İtiraz

Turing Testine karşı ileri sürülen bir başka iyi bilinen itiraz, yalnızca dilsel davranışa odaklanmasıyla ilgilidir (yani, diğer tüm bilişsel yetiler test edilmezken, yalnızca “dil temelli” bir deneydir). Bu dezavantaj, psikolog Howard Gardner'ın " çoklu zeka kuramında " dikkate almayı önerdiği , insanlarla ilgili diğer modaliteye özgü "akıllı yeteneklerin" rolünü küçültür (sözlü-dilsel yetenekler bunlardan yalnızca biridir). .

Bilinç ve bilinç simülasyonu

Turing testi, deneğin nasıl davrandığıyla ,  yani makinenin dış davranışıyla yakından ilgilidir. Bu bağlamda, zihin çalışmasına davranışçı veya işlevselci bir yaklaşım getirir. ELIZA örneği , testi geçen bir makinenin, basit (ama büyük) bir mekanik kurallar listesini takip ederek, düşünmeden veya aklı olmadan insan konuşma davranışını simüle edebileceğini göstermektedir.

John Searle , bir makinenin "gerçekten" mi düşündüğünü yoksa sadece "düşünmeyi simüle ettiğini" belirlemek için dış davranışın kullanılamayacağını savundu. Onun Çince oda argümanı, Turing testi zekanın iyi bir operasyonel tanımı olsa bile, makinenin bir zihni , bilinci veya niyeti olduğunu göstermeyebileceğini göstermeyi amaçlamaktadır . (Niyetlilik, düşüncelerin gücünün bir şey "hakkında" olması için kullanılan felsefi bir terimdir.)

Turing, orijinal makalesinde bu eleştiri satırını bekliyordu:

Bilinç hakkında bir gizem olmadığı izlenimini vermek istemiyorum. Örneğin, onu yerelleştirmeye yönelik herhangi bir girişimle bağlantılı bir paradoks vardır. Ancak bu yazıda ilgilendiğimiz soruyu cevaplamadan önce bu gizemlerin mutlaka çözülmesi gerektiğini düşünmüyorum.

Sorgulayıcıların saflığı

Pratikte, testin sonuçları bilgisayarın zekası tarafından değil, soru soran kişinin tutumları, becerileri veya naifliği tarafından kolayca domine edilebilir.

Turing, testin tanımında sorgulayıcının ihtiyaç duyduğu becerileri ve bilgiyi tam olarak belirtmez, ancak "ortalama sorgulayıcı" terimini kullandı: "[ortalama sorgulayıcının] doğruyu yapma şansı yüzde 70'ten fazla olmayacaktır. beş dakikalık sorgulamadan sonra kimlik tespiti".

ELIZA gibi Chatterbot programları, şüphelenmeyen insanları, insanlarla iletişim kurduklarına inanmaları için defalarca kandırdı. Bu durumlarda, "sorgulayıcılar" bilgisayarlarla etkileşime girme olasılığının farkında bile değiller. Başarılı bir şekilde insan görünmesi için, makinenin herhangi bir zekaya sahip olmasına gerek yoktur ve insan davranışına yalnızca yüzeysel bir benzerlik gerekir.

Erken Loebner Ödülü yarışmalarında, makineler tarafından kolayca kandırılan "sofistike olmayan" sorgulayıcılar kullanıldı. 2004'ten beri Loebner Ödülü organizatörleri, sorgulayıcılar arasında filozoflar, bilgisayar bilimcileri ve gazeteciler görevlendirdi. Bununla birlikte, bu uzmanların bazıları makineler tarafından aldatılmıştır.

Turing testinin ilginç bir özelliği, ortak (test edilen) insanların sorgulayıcılar tarafından makineler olarak yanlış tanımlandığı zaman, müttefik etkisinin sıklığıdır. Sorgulayıcıların insan tepkileri olarak beklediklerinin mutlaka insanlara özgü olmadığı öne sürülmüştür. Sonuç olarak, bazı kişiler makineler olarak sınıflandırılabilir. Bu nedenle bu, rakip bir makinenin lehine çalışabilir. İnsanlara "kendi kendilerine davranmaları" talimatı verilir, ancak bazen yanıtları daha çok sorgulayıcının bir makinenin söylemesini beklediğine benzer. Bu, insanların "insan gibi davranmaya" motive olmalarının nasıl sağlanacağı sorusunu gündeme getiriyor.

Sessizlik

Turing testinin kritik bir yönü, bir makinenin kendisini bir makine olarak kendi ifadeleriyle ele vermesi gerektiğidir. Bir sorgulayıcı daha sonra makineyi tam olarak bu olarak doğru bir şekilde tanımlayarak "doğru tanımlamayı" yapmalıdır. Ancak bir makine konuşma sırasında sessiz kalırsa, sorgulayıcının hesaplanmış bir tahmin dışında makineyi doğru bir şekilde tanımlaması mümkün değildir. Testin bir parçası olarak paralel/gizli bir insanı hesaba katmak bile duruma yardımcı olmayabilir, çünkü insanlar sıklıkla bir makine olarak yanlış tanımlanabilmektedir.

Uygulanamazlık ve ilgisizlik: Turing testi ve yapay zeka araştırması

GPT-3 talkbot girişimi

Ana akım yapay zeka araştırmacıları, Turing testini geçmenin daha verimli araştırmalardan yalnızca bir oyalama olduğunu savunuyorlar. Gerçekten de Turing testi, Stuart Russell ve Peter Norvig'in yazdığı gibi, çok fazla akademik veya ticari çabanın aktif bir odak noktası değildir : "Yapay zeka araştırmacıları Turing testini geçmeye çok az ilgi gösterdiler." Birkaç sebep var.

İlk olarak, programlarını test etmenin daha kolay yolları vardır. AI ile ilgili alanlardaki mevcut araştırmaların çoğu, nesne tanıma veya lojistik gibi mütevazı ve belirli hedeflere yöneliktir . Bu sorunları çözen programların zekasını test etmek için, AI araştırmacıları onlara görevi doğrudan verir. Stuart Russell ve Peter Norvig , uçuşun tarihi ile bir benzetme önerirler : Uçaklar, kuşlarla karşılaştırılarak değil, ne kadar iyi uçtuklarıyla test edilir. " Havacılık mühendisliği metinleri," diye yazıyorlar, "alanlarının amacını 'diğer güvercinleri kandırabilecek kadar tam olarak güvercinler gibi uçan makineler yapmak ' olarak tanımlamazlar .

İkincisi, insanların gerçekçi simülasyonlarını yaratmak, yapay zeka araştırmasının temel hedeflerine ulaşmak için çözülmesi gerekmeyen, başlı başına zor bir problemdir. İnandırıcı insan karakterleri bir sanat eserinde, bir oyunda veya karmaşık bir kullanıcı arayüzünde ilginç olabilir , ancak bunlar akıllı makineler, yani sorunları zeka kullanarak çözen makineler yaratma biliminin bir parçası değildir.

Turing, fikrinin programların zekasını test etmek için kullanılmasını amaçlamadı - yapay zeka felsefesinin tartışılmasına yardımcı olmak için açık ve anlaşılır bir örnek sağlamak istedi . John McCarthy , felsefi bir fikrin pratik uygulamalar için işe yaramaz hale gelmesine şaşırmamamız gerektiğini savunuyor. Yapay zeka felsefesinin "AI araştırma pratiği üzerinde, bilim felsefesinin genel olarak bilim pratiği üzerinde sahip olduğundan daha fazla etkiye sahip olma ihtimalinin düşük olduğunu" gözlemliyor.

Varyasyonlar

Turing testinin yukarıda açıklananlar da dahil olmak üzere çok sayıda başka versiyonu yıllar içinde geliştirilmiştir.

Ters Turing testi ve CAPTCHA

Turing testinin, bir veya daha fazla rolün amacının makineler ve insanlar arasında tersine çevrildiği bir modifikasyonu, ters Turing testi olarak adlandırılır. Bir aklın diğeriyle karşılaşmasından kaynaklanan "fırtına"dan özellikle etkilenen psikanalist Wilfred Bion'un çalışmasında bir örnek ima edilir . Edebiyat bilimci Peter Swirski , 2000 yılında yazdığı kitabında, Turing testiyle ilgili diğer birçok orijinal noktanın yanı sıra , Swirski testi olarak adlandırdığı fikri, esasen ters Turing testi olarak ayrıntılı olarak tartıştı. Standart versiyona yönelik tüm standart itirazların olmasa da çoğunun üstesinden geldiğine dikkat çekti.

Bu fikri ileriye taşıyan RD Hinshelwood , zihni bir "zihin tanıma aygıtı" olarak tanımladı. Zorluk, bilgisayarın bir insanla mı yoksa başka bir bilgisayarla mı etkileşime girdiğini belirleyebilmesi olacaktır. Bu, Turing'in yanıtlamaya çalıştığı ama belki de tipik olarak insan olarak tanımladığımız bir şekilde "düşünebilen" bir makineyi tanımlamak için yeterince yüksek bir standart sunacağı orijinal sorunun bir uzantısıdır.

CAPTCHA , ters Turing testinin bir şeklidir. Bir web sitesinde bir işlem yapmasına izin verilmeden önce, kullanıcıya bozuk bir grafik görüntüde alfasayısal karakterler sunulur ve bunları yazması istenir. Bunun amacı, otomatik sistemlerin siteyi kötüye kullanmak için kullanılmasını önlemektir. Bunun mantığı, bozuk görüntüyü doğru bir şekilde okuyacak ve yeniden üretecek kadar gelişmiş bir yazılımın mevcut olmamasıdır (veya ortalama bir kullanıcı için mevcut değildir), bu nedenle bunu yapabilen herhangi bir sistemin bir insan olması muhtemeldir.

CAPTCHA'nın oluşturulmasından hemen sonra, üretici motordaki kalıpları analiz ederek CAPTCHA'yı bir miktar doğrulukla tersine çevirebilen yazılımlar geliştirilmeye başlandı. 2013 yılında Vicarious'taki araştırmacılar , Google , Yahoo! , ve PayPal zamanın %90'ına kadar. 2014'te Google mühendisleri, CAPTCHA zorluklarını %99,8 doğrulukla yenebilecek bir sistem gösterdi. 2015 yılında , Google'ın eski tıklama dolandırıcılığı çarı Shuman Ghosemajumder , çeşitli dolandırıcılık türlerini mümkün kılmak için CAPTCHA zorluklarını bir ücret karşılığında yenebilecek siber suç siteleri olduğunu belirtti.

Konu uzmanı Turing testi

Başka bir varyasyon, bir makinenin yanıtının belirli bir alandaki bir uzmandan ayırt edilemediği, konu uzmanı Turing testi olarak tanımlanır. Bu aynı zamanda bir "Feigenbaum testi" olarak da bilinir ve Edward Feigenbaum tarafından 2003 tarihli bir makalede önerilmiştir.

"Düşük seviyeli" biliş testi

Robert French (1990), bir sorgulayıcının, bilişsel bilim tarafından incelendiği gibi, insan bilişinin düşük seviyeli (yani bilinçsiz) süreçlerini ortaya çıkaran sorular sorarak insan ve insan olmayan muhatapları ayırt edebileceğini iddia eder . Bu tür sorular, düşüncenin insan düzenlemesinin kesin ayrıntılarını ortaya çıkarır ve dünyayı insanlar gibi deneyimlemedikçe bir bilgisayarın maskesini kaldırabilir.

Toplam Turing testi

Bilişsel bilim adamı Stevan Harnad tarafından önerilen Turing testinin "Toplam Turing testi" varyasyonu, geleneksel Turing testine iki gereksinim daha ekler. Sorgulayıcı ayrıca deneğin algısal yeteneklerini ( bilgisayar görüşü gerektiren ) ve deneğin nesneleri manipüle etme yeteneğini ( robot gerektiren ) test edebilir.

Elektronik sağlık kayıtları

Communications of the ACM'de yayınlanan bir mektup , sentetik bir hasta popülasyonu oluşturma kavramını açıklar ve sentetik ve gerçek hastalar arasındaki farkı değerlendirmek için bir Turing testi varyasyonu önerir. Mektupta şu ifadeler yer alıyor: "EHR bağlamında, bir insan doktor sentetik olarak oluşturulmuş ve gerçek canlı insan hastaları kolayca ayırt edebilse de, bir makineye kendi başına böyle bir karar verme zekası verilebilir mi?" ve dahası mektup şöyle diyor: "Sentetik hasta kimlikleri bir halk sağlığı sorunu haline gelmeden önce, meşru EHR pazarı, daha fazla veri güvenilirliği ve tanı değeri sağlamak için Turing Testi benzeri tekniklerin uygulanmasından yararlanabilir. Bu nedenle, herhangi bir yeni teknik, hastaların heterojenliğini göz önünde bulundurmalı ve Allen sekizinci sınıf fen testinin not verebileceğinden daha fazla karmaşıklığa sahip olması muhtemeldir."

Minimum akıllı sinyal testi

Asgari akıllı sinyal testi, Chris McKinstry tarafından "Turing testinin maksimum soyutlaması" olarak önerildi ve burada yalnızca ikili yanıtlara (doğru/yanlış veya evet/hayır) yalnızca düşünce kapasitesine odaklanmak için izin verildi. Antropomorfizm önyargısı gibi metin sohbeti sorunlarını ortadan kaldırır ve akıllı olmayan insan davranışlarının öykünmesini gerektirmez , insan zekasını aşan sistemlere izin verir. Bununla birlikte, soruların her biri kendi başına durmalıdır, ancak bunu bir sorgulamadan çok bir IQ testi gibi yapar. Tipik olarak, yapay zeka programlarının performansının ölçülebileceği istatistiksel verileri toplamak için kullanılır.

Hutter Ödülü

Hutter Ödülü'nün organizatörleri, doğal dil metnini sıkıştırmanın, Turing testini geçmekle eşdeğer, zor bir AI sorunu olduğuna inanıyor.

Veri sıkıştırma testinin, Turing testinin çoğu versiyonuna ve varyasyonuna göre bazı avantajları vardır:

  • İki makineden hangisinin "daha akıllı" olduğunu karşılaştırmak için doğrudan kullanılabilecek tek bir sayı verir.
  • Bilgisayarın hakime yalan söylemesini gerektirmez

Bir test olarak veri sıkıştırma kullanmanın başlıca dezavantajları şunlardır:

  • İnsanları bu şekilde test etmek mümkün değildir.
  • Bu testte hangi belirli "puanın" - eğer varsa - insan düzeyinde bir Turing testini geçmeye eşdeğer olduğu bilinmiyor.

Sıkıştırma veya Kolmogorov karmaşıklığına dayalı diğer testler

1990'ların sonlarında çok daha erken ortaya çıkan Hutter'ın ödülüne ilgili bir yaklaşım, genişletilmiş bir Turing testine sıkıştırma problemlerinin dahil edilmesidir. veya tamamen Kolmogorov karmaşıklığından türetilen testlerle . Bu hattaki diğer ilgili testler Hernandez-Orallo ve Dowe tarafından sunulmaktadır.

Algoritmik IQ veya kısaca AIQ, Legg ve Hutter'dan ( Solomonoff'un endüktif çıkarımına dayanan ) teorik Evrensel Zeka Ölçümünü, çalışan bir pratik makine zekası testine dönüştürme girişimidir.

Bu testlerden bazılarının iki büyük avantajı, insan olmayan zekalara uygulanabilir olmaları ve insan testçileri için bir gereklilik olmamasıdır.

Ebert testi

Turing testi , 2011 yılında film eleştirmeni Roger Ebert tarafından önerilen ve bilgisayar tabanlı sentezlenmiş bir sesin insanları güldürmek için tonlamalar, tonlamalar, zamanlama vb.

Evrensel Turing testi, kara kutu tabanlı makine zekası ölçümlerinden ilham aldı

Akıllı sistemlerin büyük çeşitliliğine dayanarak, makine zekasını ölçebilen ve sistemleri zekalarına göre karşılaştırabilen Turing testinden ilham alan evrensel metrikler kullanılmalıdır. Bir zeka metriğinin bir özelliği, zekadaki değişkenlik yönünün ele alınması olmalıdır. MetrIntPair ve MetrIntPairII gibi kara kutu tabanlı zeka ölçümleri, zekasını ölçtükleri sistemlerin mimarisine bağlı olmadıkları için evrenseldir. MetrIntPair, iki sistemin zekasını aynı anda ölçebilen ve karşılaştırabilen doğru bir ölçümdür. MetrIntPairII, herhangi bir sayıdaki akıllı sistemin zekasını aynı anda ölçebilen ve karşılaştırabilen doğru ve sağlam bir ölçümdür. Her iki metrik de belirli ikili tabanlı zeka ölçümlerini kullanır ve çalışılan sistemleri zeka sınıflarında sınıflandırabilir.

Google LaMDA sohbet robotu

Haziran 2022'de Google LaMDA (Diyalog Uygulamaları için Dil Modeli) sohbet robotu, duyarlılık kazandığına dair iddialarla ilgili geniş bir kapsama aldı. Başlangıçta The Economist Google Araştırma Görevlisi Blaise Agüera y Arcas'taki bir makalede, sohbet robotunun bir dereceye kadar sosyal ilişkiler anlayışı gösterdiğini söyledi. Birkaç gün sonra, Google mühendisi Blake Lemoine, Washington Post ile yaptığı bir röportajda LaMDA'nın duyarlılığa ulaştığını iddia etti. Lemoine, bu yöndeki dahili iddialar nedeniyle Google tarafından izne ayrılmıştı. Agüera y Arcas (Google Başkan Yardımcısı) ve Jen Gennai (Sorumlu İnovasyon Başkanı) iddiaları araştırmış, ancak reddetmiştir. Lemoine'nin iddiası, insan konuşmasını taklit ediyor gibi görünen bir dil modelinin, Turing testini geçmiş gibi görünse de, arkasında herhangi bir zeka olduğunu göstermediğine işaret ederek, alandaki diğer uzmanlar tarafından kesin olarak reddedildi. LaMDA'nın duyarlılığa ulaştığı iddiasının lehinde ve aleyhinde olan savunucuların yaygın tartışması, sosyal medya platformlarında, duyarlılığın anlamının yanı sıra insan olmanın ne anlama geldiğini tanımlamayı da içeren tartışmalara yol açtı.

Konferanslar

Turing Kolokyumu

1990, Turing'in "Bilgisayar Makineleri ve Zeka" makalesinin ilk yayınının kırkıncı yıldönümünü kutladı ve teste yeniden ilgi gördü. O yıl iki önemli olay meydana geldi: Birincisi, Nisan ayında Sussex Üniversitesi'nde düzenlenen ve çok çeşitli disiplinlerden akademisyenleri ve araştırmacıları bir araya getirerek Turing testini geçmişi ve bugünü açısından tartışmak üzere bir araya getiren Turing Kolokyumu oldu. , ve gelecek; ikincisi, yıllık Loebner Ödülü yarışmasının oluşumuydu.

Blay Whitby , Turing testinin tarihinde dört önemli dönüm noktası sıralıyor: 1950'de "Bilgisayar Makineleri ve Zeka"nın yayınlanması, 1966'da Joseph Weizenbaum'un ELIZA'sının duyurulması , Kenneth Colby'nin ilk kez tanımlanan PARRY'yi yaratması. 1972'de ve Turing Kolokyumu 1990'da.

2005 Konuşma Sistemleri Kolokyumu

Kasım 2005'te, Surrey Üniversitesi , Loebner Ödülü'nde pratik Turing testlerinin kazananları: Robby Garner , Richard Wallace ve Rollo Carpenter'ın katıldığı, yapay konuşma varlığı geliştiricilerinin bir günlük açılış toplantısına ev sahipliği yaptı . Davetli konuşmacılar arasında David Hamill , Hugh Loebner ( Loebner Ödülü'nün sponsoru ) ve Huma Shah vardı .

2008 AISB Sempozyumu

Reading Üniversitesi'nde düzenlenen 2008 Loebner Ödülü'ne paralel olarak , Society for the Study of Yapay Zeka ve Davranış Simülasyonu (AISB), John Barnden , Mark Bishop tarafından düzenlenen Turing testini tartışmak için bir günlük bir sempozyuma ev sahipliği yaptı. , Huma Shah ve Kevin Warwick . Konuşmacılar arasında Kraliyet Enstitüsü Direktörü Barones Susan Greenfield , Selmer Bringsjord , Turing'in biyografisini yazan Andrew Hodges ve bilinç bilimcisi Owen Holland vardı . Kanonik bir Turing testi için herhangi bir anlaşma çıkmadı, ancak Bringsjord büyük bir ödülün Turing testinin daha erken geçmesine neden olacağını ifade etti.

Alan Turing Yılı ve 2012'de Turing100

2012 yılı boyunca, Turing'in yaşamını ve bilimsel etkisini kutlamak için bir dizi önemli etkinlik gerçekleşti. Turing100 grubu bu etkinlikleri destekledi ve ayrıca Turing'in doğumunun 100. yıldönümünü kutlamak için 23 Haziran 2012'de Bletchley Park'ta özel bir Turing test etkinliği düzenledi .

Ayrıca bakınız

Notlar

Referanslar

daha fazla okuma

Dış bağlantılar