Kladogram - Cladogram

Kökü solda olan yatay bir kladogram
İki dikey kladogram, altta kök

Bir kladogram (dan Yunan clados "dal" ve gramma "karakter") kullanılan bir diyagram cladistics organizmalar arasındaki ilişkileri göstermek için. Bununla birlikte, bir kladogram evrim ağacı değildir, çünkü ataların torunlarla nasıl ilişkili olduğunu göstermez ve ne kadar değiştiklerini göstermez, pek çok farklı evrim ağacı aynı kladogramla tutarlı olabilir. Bir kladogram, farklı yönlerde dallara ayrılan ve son ortak bir ataya sahip bir organizma grubu olan bir kladda biten çizgiler kullanır . Kladogramların birçok şekli vardır, ancak hepsinin diğer çizgilerden ayrılan çizgileri vardır. Çizgiler, dallandıkları yere kadar izlenebilir. Bu dallanma noktaları, üzerindeki terminal taksonlar arasında paylaşılan özellikleri sergilediği sonucu çıkarılabilen varsayımsal bir atayı (gerçek bir varlık değil) temsil eder. Bu varsayımsal ata daha sonra çeşitli özelliklerin evrim sırası, adaptasyon ve atalarla ilgili diğer evrimsel anlatılar hakkında ipuçları sağlayabilir. Geleneksel olarak bu tür kladogramlar büyük ölçüde morfolojik karakterler temelinde oluşturulmuş olsa da, DNA ve RNA dizileme verileri ve hesaplamalı filogenetik , artık tek başına veya morfoloji ile kombinasyon halinde kladogramların oluşturulmasında çok yaygın olarak kullanılmaktadır.

Bir kladogram oluşturma

Moleküler ve morfolojik veriler

Bir kladogram oluşturmak için kullanılan özellikler kabaca morfolojik (sinaps kafatası, sıcak kanlı, notokord , tek hücreli vb.) veya moleküler (DNA, RNA veya diğer genetik bilgiler) olarak kategorize edilebilir. DNA dizilemesinin ortaya çıkmasından önce, kladistik analiz öncelikle morfolojik verileri kullandı. Davranışsal veriler (hayvanlar için) de kullanılabilir.

Olarak DNA dizi daha ucuz ve daha kolay hale geldi, moleküler sistematik filogenetik hipotezleri anlaması için bir daha popüler yöntem haline gelmiştir. Bir cimrilik kriteri kullanmak, moleküler verilerden bir filogeni çıkarmak için birkaç yöntemden sadece biridir. Açık dizi evrim modellerini içeren maksimum olabilirlik gibi yaklaşımlar , dizi verilerini değerlendirmek için Hennigian olmayan yöntemlerdir. Filogenileri yeniden yapılandırmanın bir başka güçlü yöntemi, dizi verilerini rahatsız eden geri dönüş sorununa daha az eğilimli olduğu düşünülen genomik retrotranspozon belirteçlerinin kullanılmasıdır . Ayrıca, bir zamanlar genoma entegrasyonlarının tamamen rastgele olduğu düşünüldüğünden, genellikle düşük bir homoplazi insidansına sahip oldukları varsayılır ; Ancak bu, en azından bazen böyle değil gibi görünüyor.

Kladistikte apomorfi . Bu diyagram atasal durumlar olarak "A" ve "C"yi ve terminal taksonlarda bulunan durumlar olarak "B", "D" ve "E"yi gösterir. Pratikte, atasal koşulların a priori olarak bilinmediğine (bu buluşsal örnekte gösterildiği gibi) dikkat edin, ancak terminallerde gözlemlenen paylaşılan durumların modelinden çıkarılması gerekir. Bu örnekteki her terminalin benzersiz bir durumu olduğu göz önüne alındığında, gerçekte ataların durumları hakkında kesin bir şey çıkaramayız (gözlemlenmeyen "A" ve "C" durumlarının varlığının cimri olmayan çıkarımlar olacağı gerçeği dışında! )

Plesiomorfiler ve sinapomorfiler

Araştırmacılar, hangi karakter durumlarının "atasal" ( plesiomorphies ) ve hangilerinin türetilmiş ( sinapomorfiler ) olduğuna karar vermelidir , çünkü yalnızca sinapomorfik karakter durumları gruplama kanıtı sağlar. Bu belirleme genellikle bir veya daha fazla dış grubun karakter durumlarıyla karşılaştırılarak yapılır . Dış grup ve iç grubun bazı üyeleri arasında paylaşılan durumlar semplesiomorflardır; grubun yalnızca bir alt kümesinde bulunan durumlar sinapomorflardır. Tek bir uçbirime özgü karakter durumlarının (otopomorfiler) gruplama kanıtı sağlamadığını unutmayın. Bir dış grubun seçimi, kladistik analizde çok önemli bir adımdır, çünkü farklı dış gruplar, çok farklı topolojilere sahip ağaçlar üretebilir.

homoplaziler

Bir homoplasy Bazı nedenlerden ötürü iki veya daha fazla taksa tarafından paylaşılan bir karakter durumudur diğer ortak ata daha. İki ana homoplazi türü, yakınsama ("aynı" karakterin en az iki farklı soyda evrimi) ve geri dönüş (atasal karakter durumuna geri dönüş). Kuzey Kutbu memelilerinin farklı soylarındaki beyaz kürk gibi açıkça homoplastik olan karakterler, ilişkileri anlamamıza hiçbir katkıda bulunmadıkları için filogenetik analizde bir karakter olarak dahil edilmemelidir. Bununla birlikte, homoplasti genellikle karakterin kendisinin incelenmesinden (örneğin DNA dizisinde olduğu gibi) belirgin değildir ve daha sonra en cimri bir kladogramda uyuşmazlığı (cimri olmayan dağılım) ile tespit edilir. Homoplastik olan karakterlerin hala filogenetik sinyal içerebileceğini unutmayın .

Yakınsak evrimden kaynaklanan iyi bilinen bir homoplazi örneği, "kanatların varlığı" karakteri olabilir. Kuşların, yarasaların ve böceklerin kanatları aynı işlevi görse de , anatomilerinden de anlaşılacağı üzere her biri birbirinden bağımsız olarak evrimleşmiştir . "Kanatların varlığı" karakteri için bir kuş, yarasa ve kanatlı bir böcek puanlanırsa, veri kümesine bir homoplazi eklenir ve bu potansiyel olarak analizi karıştırabilir ve muhtemelen yanlış bir ilişki hipotezi ile sonuçlanabilir. Tabii ki, bir homoplastinin ilk başta tanınabilir olmasının tek nedeni, homoplastik dağılımını ortaya çıkaran bir ilişki modelini ima eden başka karakterlerin olmasıdır.

kladogram ne değildir

Bir kladogram, taksonları yalnızca sinapomorfiler temelinde gruplandıran bir analizin diyagramatik sonucudur. Verileri biraz farklı şekilde ele alan ve kladograma benzeyen ancak kladogram olmayan filogenetik ağaçlarla sonuçlanan birçok başka filogenetik algoritma vardır. Örneğin, UPGMA ve Neighbor-Joining gibi fenetik algoritmalar, genel benzerliğe göre gruplandırılır ve hem sinapomorfileri hem de semplesiomorfları gruplandırma kanıtı olarak ele alır. Hem dallanma sırasını hem de "dal uzunluğunu" hesaba katan olasılık veya Bayes yaklaşımları), hem sinapomorfileri hem de otopomorfları gruplamanın lehine veya aleyhine kanıt olarak sayar, Bu tür analizlerden elde edilen diyagramlar da kladogram değildir.

Kladogram seçimi

"En iyi" kladogramı belirlemek için çeşitli algoritmalar mevcuttur. Çoğu algoritma , aday bir kladogramın verilerle ne kadar tutarlı olduğunu ölçmek için bir metrik kullanır . Çoğu kladogram algoritması, matematiksel optimizasyon ve minimizasyon tekniklerini kullanır .

Genel olarak, kladogram oluşturma algoritmaları bilgisayar programları olarak uygulanmalıdır, ancak bazı algoritmalar, veri kümeleri mütevazı olduğunda (örneğin, sadece birkaç tür ve birkaç özellik) manuel olarak gerçekleştirilebilir.

Bazı algoritmalar, yalnızca karakteristik veriler moleküler (DNA, RNA) olduğunda faydalıdır; diğer algoritmalar, yalnızca karakteristik veriler morfolojik olduğunda faydalıdır. Karakteristik veriler hem moleküler hem de morfolojik verileri içerdiğinde diğer algoritmalar kullanılabilir.

Kladogramlar veya diğer filogenetik ağaç türleri için algoritmalar arasında en küçük kareler , komşu birleştirme , tutumluluk , maksimum olabilirlik ve Bayes çıkarımı bulunur .

Biyologlar tutumluluk terimini bazen belirli bir tür kladogram oluşturma algoritması için ve bazen de tüm filogenetik algoritmalar için bir şemsiye terim olarak kullanırlar.

Optimizasyon görevlerini (kladogram oluşturma gibi) gerçekleştiren algoritmalar, girdi verilerinin (tür listesi ve özellikleri) sunulma sırasına duyarlı olabilir. Verileri çeşitli sıralarda girmek, aynı algoritmanın farklı "en iyi" kladogramlar üretmesine neden olabilir. Bu durumlarda, kullanıcı verileri çeşitli sıralarda girmeli ve sonuçları karşılaştırmalıdır.

Tek bir veri setinde farklı algoritmalar kullanmak bazen farklı "en iyi" kladogramlar verebilir, çünkü her algoritmanın "en iyi" olduğuna dair benzersiz bir tanımı olabilir.

Olası kladogramların astronomik sayısı nedeniyle, algoritmalar çözümün genel olarak en iyi çözüm olduğunu garanti edemez. Program, istenen global minimum yerine yerel bir minimuma yerleşirse, optimal olmayan bir kladogram seçilecektir. Bu sorunu çözmeye yardımcı olmak için, birçok kladogram algoritması , seçilen kladogramın optimal olma olasılığını artırmak için simüle edilmiş bir tavlama yaklaşımı kullanır.

Bazal konumu köklü bir filogenetik ağaç veya cladogram baz (veya kök) bir yöndür. Bir bazal bölüm, daha büyük bir bölüm içinde dallanan en eski bölümdür (belirli bir taksonomik rütbe[a]).

İstatistik

Uyumsuzluk uzunluk farkı testi (veya bölüm homojenliği testi)

Uyumsuzluk uzunluk farkı testi (ILD), farklı veri kümelerinin (örn. morfolojik ve moleküler, plastid ve nükleer genler) kombinasyonunun daha uzun bir ağaca nasıl katkıda bulunduğunun bir ölçümüdür. İlk önce her bölümün toplam ağaç uzunluğunu hesaplayarak ve bunları toplayarak ölçülür. Daha sonra orijinal bölümlerden oluşan rastgele birleştirilmiş bölümler oluşturularak çoğaltmalar yapılır. Uzunluklar toplanır. 99 kopya daha uzun birleşik ağaç uzunluklarına sahipse, 100 kopya için 0.01'lik bir p değeri elde edilir.

Homoplaziyi ölçmek

Bazı ölçüler, bir ağaca referansla bir veri setindeki homoplazi miktarını ölçmeye çalışır, ancak bu ölçülerin hangi özelliği nicelleştirmeyi amaçladığı tam olarak açık değildir.

tutarlılık endeksi

Tutarlılık indeksi (CI), bir ağacın bir dizi veriye olan tutarlılığını ölçer - ağaç tarafından ima edilen minimum homoplazi miktarının bir ölçüsü. Bir veri kümesindeki minimum değişiklik sayısını sayarak ve bunu kladogram için gereken gerçek değişiklik sayısına bölerek hesaplanır. Tutarlılık indeksi de bağımsız bir karakter için hesaplanabilir i c gösterilen, i .

Homoplazi miktarını yansıtmanın yanı sıra, metrik ayrıca veri kümesindeki takson sayısını, (daha az ölçüde) bir veri kümesindeki karakter sayısını, her bir karakterin filogenetik bilgi taşıma derecesini ve eklemeli karakterlerin hangi biçimde olduğunu da yansıtır. kodlanmış, amaca uygun değil.

c i , eşit durum dağılımına sahip ikili karakterlerde 1 ile 1/[ n.taxa /2] arasında bir aralığı kaplar ; minimum değeri, durumlar eşit olarak yayılmadığında daha büyüktür. Genel olarak, ile ikili veya ikili olmayan bir karakter için , c i 1 ile arasında bir aralığı kaplar .

Saklama indeksi

Tutma indeksi (RI), "belirli uygulamalar için" CI'nin bir iyileştirmesi olarak önerilmiştir. Bu metrik aynı zamanda homoplazi miktarını ölçme iddiasındadır, ancak aynı zamanda sinapomorfların ağacı ne kadar iyi açıkladığını da ölçer. (bir ağaçtaki maksimum değişiklik sayısı eksi ağaçtaki değişiklik sayısı) alınarak ve (ağaçtaki maksimum değişiklik sayısı eksi veri kümesindeki minimum değişiklik sayısı) ile bölünerek hesaplanır.

Yeniden ölçeklendirilmiş tutarlılık indeksi (RC), CI'nin RI ile çarpılmasıyla elde edilir; aslında bu, CI aralığını, teorik olarak elde edilebilir minimum değeri 0'a yeniden ölçeklenecek ve maksimum değeri 1'de kalacak şekilde genişletir. Homoplazi indeksi (HI) basitçe 1 - CI'dir.

Homoplazi Fazla Oranı

Bu, teorik olarak mevcut olabilecek maksimum homoplasti miktarına göre bir ağaçta gözlemlenen homoplasti miktarını ölçer – 1 − (gözlenen homoplasti fazlalığı) / (maksimum homoplasti fazlalığı). 1 değeri homoplazi olmadığını gösterir; 0, tamamen rastgele bir veri kümesinde olabileceği kadar homoplaziyi temsil eder ve negatif değerler hala daha fazla homoplaziyi gösterir (ve yalnızca yapmacık örneklerde ortaya çıkma eğilimindedir). HER, şu anda mevcut olan en iyi homoplazi ölçüsü olarak sunulmaktadır.

Ayrıca bakınız

Referanslar

Dış bağlantılar