Referans - Coreference

Gelen dilbilim , coreference , bazen yazılı coreference bir metinde iki veya daha fazla ifadeleri aynı kişi veya şey dediğimiz zaman, ortaya çıkar; aynı referansa sahipler , örneğin Bill geleceğini söyledi ; özel isim Bill ve onun atıfta bulunduğu zamir aynı kişiye, yani Bill'e. İlişkilendirme, sözdizimi alanındaki bağlama fenomenlerinin altında yatan ana kavramdır . Bağlama teorisi, cümlelerdeki ve metinlerdeki eş-gönderimsel ifadeler arasında var olan sözdizimsel ilişkiyi araştırır. İki ifade coreferential olduğunda, bir genellikle tam bir şekilde (bir önceki ) ve diğer kısaltılmış bir şekilde (a, ön-biçimi ya da anaphor). Dilbilimciler örnekte i indeksi olduğu gibi, coreference göstermek için endeksi kullanmak Bill i dedi ben gelirdi . Aynı referansa sahip iki ifade eş- dizinlidir , dolayısıyla bu örnekte Bill ve o eş-gönderimsel olarak yorumlanmaları gerektiğini gösteren eş-dizinlidir.

Türler

Coreference gezinirken, yapılabilir sayısız ayrımlar vardır mesela Artgönderim , cataphora , split öncüllerini, isim cümleleri, vb ile uğraşırken coreferring proforms ( zamir , pro-fiiller yanlısı sıfatlar, vs.), artgönderim arasında bir farklılaşacaktır ve katafor. Proform, atıfta bulunduğu ifadeyi takip ettiğinde, anafora mevcuttur (proform bir anafordur) ve atıfta bulunduğu ifadeden önce geldiğinde, katafor mevcuttur (proform bir katafordur). Bu kavramlar şu şekilde gösterilmektedir:

anafora
a. Müzik ı kadar yüksek sesle olmasıydı o ben zevk edilemedi. -The anaphor bu da atıfta bulunduğu ifade (kendi önceki) izler.
B. Komşularımız i müzik sevmediğim. Eğer onlar ben kızgın, polisler yakında görünecektir. – Atıf yaptığı ifadeyi takip ettikleri anafor (öncülü).
Katafora
a. Eğer onlar ben müzik hakkında kızgın, komşular i polisleri arayacak. - cataphor de bu referans yaptığı ifade (kendi postcedent) önce gelir.
B. Rağmen onu ben zorluk, Wilma i noktayı anlamak için geldi. - cataphor onu bu atıfta bulunduğu ifade (kendi postcedent) önce
Bölünmüş öncüller
a. Carol i anlattı Bob i partiye katılmak için. Onlar i bir araya geldi. - anaphor onlar hem atıfta bulunarak, bir bölünmüş öncülü vardır Carol ve Bob .
B. Ne zaman Carol i yardımcı Bob i ve Bob i yardımcı Carol i , onlar ı herhangi görevi yerine getirebilirsiniz. - anaphor onlar hem atıfta bulunarak, bir bölünmüş öncülü vardır Carol ve Bob .
İsim tamlamaları
a. Proje lideri ı yardımı reddediyor. Pislik i sadece kendini düşünür. – İkinci isim öbeğinin birinciye göre bir yüklem olduğu, isim öbekleri çıkaran.
B. Bazı meslektaşlarımız 1 destek olacak. Bu tür insanlar 1 minnettarlığımızı kazanacaklar. – İkinci isim öbeğinin birinciye göre bir yüklem olduğu, isim öbekleri çıkaran.

Bağlı değişkenlere karşı

Semantikçiler ve mantıkçılar bazen bağıntı ile bağlı değişken olarak bilinen şey arasında bir ayrım yaparlar . Bağlı bir değişkenin bir örneği, eşleme gibi görünebilir, ancak teknik açıdan bakıldığında, gerçekte olmadığı iddia edilebilir. Sınırlı değişkenler, proformun öncülü belirsiz nicelleştirilmiş bir ifade olduğunda ortaya çıkar, örn.

a. Her öğrencinin ı aldı onun i notu. – Onun zamiri , bağlı bir değişken örneğidir
B. Hiçbir öğrenci i ile altüst edildi , onun i sınıftan. – Onun zamiri , bağlı değişkene bir örnektir

Her öğrenci ve hiçbir öğrenci gibi nicel ifadeler , teknik açıdan referans değildir. Konular her öğrencinin ve hiçbir öğrenci dilbilgisi tekil, ancak söylem dünyada tek bildirenlerimizi ayırt yoktur. Böylece iyelik sıfat için öncülleri beri onun referans değil, bir de diyemem onun referans olduğunu. Bunun yerine, onun öncülüne bağlı bir değişken olduğu söylenir. Referansı, söylem dünyasındaki öğrencilerden hangisinin düşünüldüğüne bağlı olarak değişir. Eğer Jack, John ve Jerry, söylem dünyasındaki üç öğrenciyse, onun anlamı , zihin gözünün odak noktasının Jack, John veya Jerry olmasına göre değişir. Bağlı değişkenlerin varlığı, aşağıdaki örnekte belki daha belirgindir:

C. Yalnızca Jack i seven onun i notu. - zamir onun bir sınır değişken olabilir.

Bu cümle belirsizdir. Bu, Jack'in notunu beğendiği, ancak diğer herkesin Jack'in notunu beğenmediği anlamına gelebilir veya daha büyük olasılıkla bu, Jack'in notunu beğendiği, ancak John'un (John'un) notunu beğenmediği ve Jerry'nin (Jerry'nin) notunu beğenmediği anlamına gelebilir. İkinci, daha doğal okuma, bağlı değişken okumasıdır. Koreferans ve bağlı değişkenler arasındaki ayrım gerçek olabilirken, eş indeksleme her ikisini de barındırıyor olarak yorumlanabilir. Diğer bir deyişle, iki veya daha fazla ifadenin ortak indekslenmesi, birinin ortak referans veya bağlı bir değişkenle ilgilendiğini gösterir.

Coreferans çözünürlüğü

Gelen bilgisayarlı dil , coreference çözünürlüğü de iyi çalışılmış bir problemdir söylem . Bir metnin doğru yorumunu elde etmek, hatta bahsedilen çeşitli konuların göreceli önemini tahmin etmek için zamirler ve diğer gönderme ifadeleri doğru kişilerle ilişkilendirilmelidir. Korelasyonları çözmeyi amaçlayan algoritmalar, genellikle ilk önce atıfta bulunan ifadeyle uyumlu olan en yakın önceki bireyi arar. Örneğin, o gibi bir önceki ifadeye eklemek olabilir kadına veya Anne , ama değil Bill . Kendisi gibi zamirlerin çok daha katı kısıtlamaları vardır. Pek çok dilsel görevde olduğu gibi, kesinlik ve geri çağırma arasında bir ödünleşim vardır ve bunların hesaplanması, referans zincirlerinin kalitesini ölçmek için tek bir algoritma olmadığı için değişebilmektedir. Ortak referans çözümleme algoritmalarını değerlendirmek için yaygın olarak kullanılan küme kalite metrikleri Rand indeksi , ayarlanmış Rand indeksi veya farklı karşılıklı bilgi tabanlı yöntemlerdir.

İngilizce'de referans çözümlemesi için klasik bir sorun , birçok kullanıma sahip olan it zamiridir . Bu çok gibi ifade edebilir o ve she , genellikle kurallar aslında daha karmaşıktır (cansız nesneler ifade ettiğini hariç: hayvanlar herhangi biri olabilir o , o , ya o ; gemiler geleneksel olarak o kasırgalar genellikle; o cinsiyet isimleri olmasına rağmen ). Ayrıca varlıklardan ziyade soyutlamalara da atıfta bulunabilir, örneğin Asgari ücret aldı, ama aldırmıyor gibiydi. Son olarak, bu aynı zamanda sahip pleonastic şey özgü atıfta bulunmayan kullanımlarını:

a. O' yağmur yağıyor.
B. Bu' gerçekten büyük utanç.
C. Bu başarılı olmak için bir sürü iş alır.
NS. Bazen o en fazla etkiye sahip kim sesin s.

Pleonastic kullanımlar referans olarak kabul edilmez ve bu nedenle referansın bir parçası değildir.

Referans çözümleme yaklaşımları, genel olarak söz çifti, söz sıralaması veya varlık tabanlı algoritmalara ayrılabilir. Mention-pair algoritmaları, verilen iki sözün bir çifti aynı varlığa aitse ikili kararları içerir . Cinsiyet gibi varlık çapında kısıtlamalar dikkate alınmaz, bu da hata yayılmasına neden olur . Zamirler Örneğin o ya o ikisi ile coreference olasılığının yüksek olabilir öğretmen , ancak birbirleri ile coreferent olamaz. Mansiyon sıralama algoritmaları bu fikri genişletir, ancak bunun yerine bir sözün yalnızca bir (önceki) sözle ilişkili olabileceğini şart koşar. Sonuç olarak, her bir önceki söze bir puan verilmeli ve en yüksek puanlı söz (veya hiç bahsedilmeme) bağlantılıdır. Son olarak, varlık tabanlı yöntemlerde, tek tek atıflar yerine tüm referans zincirinin bilgilerine dayalı olarak bahseder. Değişken genişlikli bir zincirin temsili, söze dayalı yöntemlerden daha karmaşık ve hesaplama açısından pahalıdır, bu da bu algoritmaların çoğunlukla sinir ağı mimarilerine dayalı olmasına yol açar .

Ayrıca bakınız

  • Anaphora (dilbilim)  – Yorumu bağlama bağlı olan bir ifadenin kullanımı
  • Öncül  – Dilbilgisinde bir pro-forma anlamını veren ifade
  • Bağlama  – Anaforik öğelerin dağılımı
  • Katafora  - Daha sonra, daha spesifik bir ifadeyle birlikte atıfta bulunan bir ifadenin veya kelimenin kullanılması
  • En yakın referans
  • Anahtar referansı  – 'bitişik' tümcelerdeki belirli belirgin argümanların eş referanslı olup olmadığını işaret eden herhangi bir yan tümce düzeyinde biçimbirim
  • Kelime-anlam ayrımı  - Kullanılan bir kelimenin anlamının tanımlanması

Notlar

Referanslar

  • Crystal, D. 1997. Dilbilim ve fonetik sözlüğü. 4. baskı. Cambridge, MA: Blackwell Yayıncılık.
  • Jurafsky, D. ve H. Martin 2000. Konuşma ve dil işleme: Doğal dil işleme, hesaplamalı dilbilim ve konuşma tanımaya giriş. Yeni Delhi, Hindistan: Pearson Education.
  • Portner, P. 2005. Anlambilim nedir?: Biçimsel anlambilimin temelleri. Malden, MA: Blackwell Yayıncılık.
  • Radford, A. 2004. İngilizce sözdizimi: Bir giriş . Cambridge, Birleşik Krallık: Cambridge University Press.
  • Yifan, L. S. Musilek, M., reformasyon ve L. Wyard-Scott, 2009 pleonastic tanımlanması bu ağ kullanılarak . Yapay Zeka Araştırmaları Dergisi 34, 339-389.