sözlüksel istatistik - Lexicostatistics

Lexicostatistics , ilişkilerini belirlemek için diller arasındaki sözcük kökenli sözcüklerin yüzdesini karşılaştırmayı içeren bir karşılaştırmalı dilbilim yöntemidir . Sözlüksel istatistik, karşılaştırmalı yöntemle ilgilidir, ancak bir ön -dili yeniden oluşturmaz . İki veya daha fazla dilin ortak bir önceki proto-dilden ayrıldığı zamandan beri geçen süreyi tahmin etmek için sözlük istatistiksel yöntemleri kullanmaya çalışan glotokronolojiden ayırt edilmelidir . Ancak bu, sözlük istatistiğinin yalnızca bir uygulamasıdır; bunun diğer uygulamaları, temel sözlüksel öğeler için sabit bir değişim oranı varsayımını paylaşmayabilir.

"Sözlük istatistik" terimi, matematiksel denklemlerin kullanılması, ancak istatistik kullanılmaması nedeniyle yanıltıcıdır. Bu alışılmadık bir durum olsa da, bir dilin diğer özellikleri sözlük dışında kullanılabilir. Karşılaştırmalı yöntem, alt grupları belirlemek için paylaşılan tanımlanmış yenilikleri kullanırken, sözlük istatistikleri bunları tanımlamaz. Sözlüksel istatistik uzaklığa dayalı bir yöntemdir, karşılaştırmalı yöntem ise doğrudan dil karakterlerini dikkate alır. Sözlüksel istatistik yöntemi, karşılaştırmalı yönteme göre basit ve hızlı bir tekniktir ancak sınırlamaları vardır (aşağıda tartışılmıştır). Her iki yöntemle üretilen ağaçların çapraz kontrolü yapılarak doğrulanabilir.

Tarih

Lexicostatistics, 1950'lerde Morris Swadesh tarafından daha önceki fikirlere dayalı olarak bir dizi makalede geliştirildi . Kavramın bilinen ilk kullanımı, 1834'te çeşitli "Okyanus" dillerini karşılaştıran ve bir ilişki katsayısını hesaplamak için bir yöntem öneren Dumont d'Urville tarafından yapıldı . Hymes (1960) ve Embleton (1986) sözlük istatistiğinin tarihini gözden geçirir.

Yöntem

Kelime listesi oluştur

Amaç, evrensel olarak kullanılan anlamların (el, ağız, gökyüzü, I) bir listesini oluşturmaktır. Daha sonra, ele alınan her dil için bu anlam yuvaları için kelimeler toplanır. Swadesh, daha büyük bir anlam kümesini başlangıçta 200'e indirdi. Daha sonra bunu daha da azaltmanın gerekli olduğunu ancak orijinal listesinde olmayan bazı anlamları ekleyebileceğini ve daha sonraki 100 maddelik listesini verdiğini buldu. Swadesh listesi Vikisözlük içinde çeşitli dillerde toplam 207 anlamlara verir. Dolgopolsky listesi ve Leipzig-Jakarta listesi gibi daha katı kriterler uygulayan alternatif listeler ve ayrıca daha spesifik kapsamı olan listeler oluşturulmuştur; örneğin Dyen, Kruskal ve Black'in dijital biçimde 84 Hint-Avrupa dili için 200 anlamı vardır .

konyakları belirle

Cognacy kararları vermek için eğitimli ve deneyimli bir dilbilimciye ihtiyaç vardır. Ancak, bilgi düzeyi arttıkça kararların rafine edilmesi gerekebilir. Bununla birlikte, sözlüksel istatistik, tüm kararların doğru olmasına dayanmaz. Her bir liste çifti için bir formun benzerliği pozitif, negatif veya belirsiz olabilir. Bazen bir dil bir anlam, örneğin için birden fazla kelime vardır küçük ve Little'ın için büyük değil .

Sözlük istatistik yüzdelerini hesaplayın

Bu yüzde, belirli bir dil çifti için aynı kökenli olan anlamların oranı ile ilgilidir, yani belirsizlik olmaksızın toplama göre. Bu değer, N x N mesafe tablosuna girilir ; burada N, karşılaştırılan dillerin sayısıdır. Bu tablo tamamlandığında üçgen şeklinde yarısı doldurulmuştur . Kanaat oranı ne kadar yüksek olursa, diller o kadar yakın ilişkilidir.

Aile ağacı oluştur

Dil ağacının oluşturulması yalnızca yukarıda bulunan tabloya dayanmaktadır. Dyen, Krustal ve Black tarafından benimsenen çeşitli alt gruplama yöntemleri kullanılabilir:

  • tüm listeler bir havuza yerleştirilir
  • en yakın iki eleman çıkarılır ve havuza yerleştirilen bir çekirdek oluşturur.
  • bu adım tekrarlanır
  • belirli koşullar altında bir çekirdek bir grup haline gelir
  • bu, havuz yalnızca bir grup içerene kadar tekrarlanır.

Hesaplamalar çekirdek ve grup sözcük yüzdelerine göre yapılmalıdır.

Uygulamalar

Sözlük istatistik uygulamasının önde gelen bir temsilcisi Isidore Dyen olmuştur . Austronesian dillerini ve Hint-Avrupa dillerini sınıflandırmak için sözlük istatistiklerini kullandı . İkincisi hakkında önemli bir çalışma Dyen, Kruskal ve Black (1992) tarafından rapor edilmiştir. Kızılderili ve Afrika dilleri üzerinde de çalışmalar yapılmıştır .

Pama-Nyungan

Pama-Nyungan dil ailesi içindeki iç dallanma sorunu, Avustralyalı dilbilim içinde uzun süredir devam eden bir sorun olmuştur ve genel fikir birliği, Pama-Nyungan'ın 25'ten fazla farklı alt grubu arasındaki iç bağlantıların ya yeniden kurulmasının imkansız olduğu ya da alt grupların yeniden yapılandırılmasının imkansız olduğu yönündeydi. aslında genetik olarak hiç ilgili değil. 2012'de Claire Bowern ve Quentin Atkinson , Pama- Nyungan'ın tüm ana alt gruplarını ve izolatlarını temsil eden 194 belge üzerinde hesaplamalı filogenetik yöntemleri uygulamalarının sonuçlarını yayınladılar . Onların modeli, diğer birçok Avustralyalı tarafından daha önce önerilmiş ve kabul edilmiş olan dalların ve bölümlerin çoğunu "kurtardı" ve aynı zamanda Paman (veri eksikliği nedeniyle karmaşık olan) ve Ngumpin- gibi daha sorunlu dallar hakkında bir miktar fikir verdi. Yapa (diller arasındaki çok yüksek borçlanma oranlarının genetik tabloyu gizlediği yer). Veri kümeleri, avcı-toplayıcı dil ailesi için türünün en büyüğünü ve Austronesian'dan sonra genel olarak ikinci en büyüğünü oluşturur ( Greenhill ve diğerleri, 2008 ). Pama-Nyungan dillerinin, dünyanın diğer dil ailelerine başarıyla uygulanmış olan sözlük istatistik yöntemlerine göre istisnai olmadığı sonucuna varmışlardır.

eleştiriler

Hoijer (1956) gibi kişiler, anlam öğelerinin eşdeğerlerini bulmakta güçlükler olduğunu gösterseler de, birçoğu Swadesh'in listelerini değiştirmeyi gerekli bulmuştur. Gudschinsky (1956), evrensel bir liste elde etmenin mümkün olup olmadığını sorguladı.

Ödünç alma , gelenek ve tabu gibi faktörler , diğer yöntemlerde olduğu gibi sonuçları çarpıtabilir. Bazen sözlük istatistikleri, benzerlikleri bulmak için biliş yerine sözcüksel benzerlik kullanılarak kullanılmıştır. Bu daha sonra kütle karşılaştırmasına eşdeğerdir .

Eş anlamlıların seçimi gibi, anlam yuvalarının seçimi de özneldir .

Geliştirilmiş yöntemler

Modern hesaplamalı istatistiksel hipotez test yöntemlerinden bazıları, benzer kelime listeleri ve uzaklık ölçüleri kullandıkları için sözlük istatistiğinin gelişmeleri olarak kabul edilebilir.

Ayrıca bakınız

Referanslar

daha fazla okuma

  • Dobson, Annette (1969). Sözlük İstatistiksel Gruplama. Antropolojik Dilbilim 7, 216-221.
  • Dobson, Annette ve Siyah, Paul (1979). Bazı Sözlük İstatistiksel Verilerin Çok Boyutlu Ölçeklendirilmesi. Matematik Bilimcisi 1979/4, 55-61.
  • McMahon, April ve McMahon, Robert (2005). Sayılara Göre Dil Sınıflandırması. Oxford Üniversitesi Yayınları.
  • Sankov, David (1970). "Kelime-Anlam İlişkilerinin Değiştirilme Oranı Üzerine." Dil 46.564-569.
  • Wittmann, Henri (1969). "Hitit artzamanlılığına sözlük-istatistiksel bir araştırma." Indogermanische Forschungen 74.1-10. [1]
  • Wittmann, Henri (1973). "Fransızca tabanlı Creole dillerinin sözlüksel sınıflandırması." Genetik dilbilimde sözlükbilim: Yale konferansının Tutanakları, 3-4 Nisan 1971 , dir. Isidore Dyen, 89-99. La Haye: Mouton. [2]

Dış bağlantılar