Kodon kullanım yanlılığı - Codon usage bias

Physcomitrella patentlerinde kodon kullanım yanlılığı

Kısmen kodon kullanım eğilimini oluşma sıklığı farklara değinmektedir ayn kodonlann içinde DNA kodlayan . Bir kodon, bir polipeptit zincirindeki belirli bir amino asit kalıntısını kodlayan veya translasyonun sonlandırılması ( durdurma kodonları ) için bir dizi üç nükleotiddir (bir üçlü ).

64 farklı kodon (amino asitleri kodlayan 61 kodon ve 3 stop kodonu) vardır, ancak sadece 20 farklı çevrilmiş amino asit vardır. Kodon sayısındaki fazlalık, birçok amino asidin birden fazla kodon tarafından kodlanmasına izin verir. Böyle bir fazlalık nedeniyle, genetik kodun dejenere olduğu söylenir . Farklı organizmaların genetik kodları genellikle, aynı amino asidi kodlayan birkaç kodondan birini diğerleri üzerinde kullanmaya eğilimlidir; yani, tesadüfen beklenenden daha yüksek bir frekans bulunur. Bu tür önyargıların nasıl ortaya çıktığı, moleküler evrimin çok tartışılan bir alanıdır . Organizmalar için genomik kodon kullanım eğilimini ayrıntılı kodon kullanım tabloları GenBank ve RefSeq bulunabilir kovanı kodon kullanım tabloları (kovanı kesikler) projesi iki ayrı veri tabanları, CoCoPUTs ve TissueCoCoPUTs içerir. Bu iki veri tabanı birlikte, sırasıyla mevcut dizi bilgisi ve 52 insan dokusu ile tüm organizmalar için kapsamlı, güncel kodon, kodon çifti ve dinükleotit kullanım istatistikleri sağlar.

Genel olarak, kodon önyargılarının , translasyon optimizasyonu için mutasyonel önyargılar ve doğal seçilim ( mutasyon-seçim dengesi ) arasındaki bir dengeyi yansıttığı kabul edilmektedir . Escherichia coli veya Saccharomyces cerevisiae (fırın mayası) gibi hızlı büyüyen mikroorganizmalardaki optimal kodonlar , ilgili genomik transfer RNA (tRNA) havuzunun bileşimini yansıtır . Optimal kodonların daha hızlı çeviri oranları ve yüksek doğruluk elde edilmesine yardımcı olduğu düşünülmektedir. Bu faktörlerin bir sonucu olarak, aslında yukarıda bahsedilen organizmalar için olduğu gibi, yüksek oranda eksprese edilmiş genlerde translasyonel seçilimin daha güçlü olması beklenir . Yüksek büyüme oranları göstermeyen veya küçük genomlar sunan diğer organizmalarda, kodon kullanım optimizasyonu normalde yoktur ve kodon tercihleri, o belirli genomda görülen karakteristik mutasyonel önyargılar tarafından belirlenir. Bunun örnekleri Homo sapiens (insan) ve Helicobacter pylori'dir . Orta düzeyde kodon kullanımı optimizasyonu gösteren organizmalar arasında Drosophila melanogaster (meyve sineği), Caenorhabditis elegans (nematod solucanı ), Strongylocentrotus purpuratus ( deniz kestanesi ) ve Arabidopsis thaliana ( thale tere ) bulunur. Birkaç viral familyanın ( herpesvirus , lentivirus , papillomavirus , polyomavirus , adenovirus ve parvovirus ) , konakçı hücreye kıyasla aşırı derecede çarpık kodon kullanımı sergileyen yapısal proteinleri kodladığı bilinmektedir . Bu kodon yanlılıklarının geç proteinlerinin geçici düzenlenmesinde rol oynadığı öne sürülmüştür.

Kodon kullanımı-tRNA optimizasyonunun doğası hararetle tartışılmıştır. Kodon kullanımının tRNA evrimini mi yoksa tam tersini mi sağladığı açık değildir. Hem kodon kullanımının hem de tRNA ifadesinin geri besleme tarzında birlikte geliştiği en az bir matematiksel model geliştirilmiştir ( yani , yüksek frekanslarda zaten mevcut olan kodonlar, karşılık gelen tRNA'ların ifadesini hızlandırır ve normal olarak yüksek seviyelerde ifade edilen tRNA'lar frekansı artırır). karşılık gelen kodonları). Ancak, bu modelin henüz deneysel bir onayı yok gibi görünüyor. Diğer bir problem ise, tRNA genlerinin evriminin çok aktif olmayan bir araştırma alanı olmasıdır.

İçeren faktörler

Farklı faktörler gen ekspresyon seviyesi (tRNA bolluğu tercüme prosesini optimize etmek için bir seçim yansıtan) de dahil olmak üzere, kodon kullanım eğilimini ile ilişkili olduğu önerilmiştir guanin-sitosin içeriğine (yansıtan GC içeriği yatay gen transferi ya da mutasyon eğilim) guanin-sitozin çarpıklık (GC çarpık, sarmal-spesifik mutasyonel yanlılığı yansıtır), amino asit korunumu , protein hidropatisi , transkripsiyonel seçim, RNA stabilitesi, optimal büyüme sıcaklığı, hipersalin adaptasyonu ve diyet azotu.

evrim teorileri

Seçime karşı mutasyon yanlılığı

Kodon yanlılığı seçiminin mekanizması tartışmalı olsa da, bu yanlılık için olası açıklamalar iki genel kategoriye ayrılır. Bir açıklama , kodon yanlılığının protein ekspresyonunun verimliliğine ve/veya doğruluğuna katkıda bulunduğu ve dolayısıyla pozitif seçilimden geçtiği seçici teori etrafında döner . Seçilimci model ayrıca neden daha sık kodonların daha bol tRNA molekülleri tarafından tanındığını ve ayrıca tercih edilen kodonlar, tRNA seviyeleri ve gen kopya sayıları arasındaki korelasyonu da açıklar . Daha sık kodonlarda amino asit birleşme hızının nadir kodonlarınkinden çok daha yüksek oranda gerçekleştiği gösterilmiş olmasına rağmen, çeviri hızının doğrudan etkilendiği gösterilmemiştir ve bu nedenle daha sık kodonlara yönelik önyargı olmayabilir. doğrudan avantajlı olun. Bununla birlikte, translasyon uzama hızındaki artış, serbest ribozomların hücresel konsantrasyonunu ve potansiyel olarak haberci RNA'ların (mRNA'lar) başlatma hızını artırarak dolaylı olarak avantajlı olabilir .

Kodon kullanımına ilişkin ikinci açıklama , mutasyonel desenlerdeki rastgele olmama nedeniyle kodon yanlılığının var olduğunu öne süren bir teori olan mutasyon yanlılığı ile açıklanabilir . Başka bir deyişle, bazı kodonlar daha fazla değişikliğe uğrayabilir ve bu nedenle "nadir" kodonlar olarak da bilinen daha düşük denge frekanslarıyla sonuçlanabilir. Farklı organizmalar da farklı mutasyon yanlılıkları sergiler ve genom çapında GC içeriği seviyesinin organizmalar arasındaki kodon yanlılığı farklılıklarını açıklamada en önemli parametre olduğuna dair artan kanıtlar vardır. Ek çalışmalar, kodon yanlılıklarının, yalnızca genler arası diziler kullanılarak prokaryotlarda istatistiksel olarak tahmin edilebileceğini , kodlama bölgeleri üzerindeki seçici kuvvetler fikrine karşı çıkarak ve ayrıca mutasyon yanlılığı modelini desteklediğini göstermiştir. Ancak bu model tek başına tercih edilen kodonların neden daha bol tRNA'lar tarafından tanındığını tam olarak açıklayamaz.

Mutasyon-seçim-sürük dengesi modeli

Hem mutasyonel baskılardan hem de seçilimden elde edilen kanıtları uzlaştırmak için , kodon yanlılığı için geçerli olan hipotez, mutasyon-seçim-sürük dengesi modeli ile açıklanabilir . Bu hipotez, seçilimin minör kodonlar yerine majör kodonları desteklediğini, ancak minör kodonların mutasyon baskısı ve genetik sürüklenme nedeniyle kalıcı olabildiğini belirtir . Ayrıca, seçimin genellikle zayıf olduğunu, ancak seçim yoğunluğunun, kodlama dizilerinin daha yüksek ifadesine ve daha işlevsel kısıtlamalarına göre ölçeklendiğini ileri sürer.

kodon bileşiminin sonuçları

RNA ikincil yapısı üzerindeki etkisi

Çünkü ikinci yapısı arasında , 5' ucunda mRNA'nın translasyon verimini etkilemektedir mRNA üzerindeki bu bölgede eş anlamlı değişiklikler gen ekspresyonu üzerinde derin etkilere neden olabilir. Kodlamayan DNA bölgelerinde kodon kullanımı , bu nedenle, daha fazla seçici baskıya maruz kalabilen RNA ikincil yapısında ve aşağı akış protein ekspresyonunda önemli bir rol oynayabilir. Özellikle, ribozom bağlama bölgesindeki veya başlatma kodonundaki güçlü ikincil yapı, translasyonu inhibe edebilir ve 5' ucundaki mRNA katlanması, protein seviyelerinde büyük miktarda varyasyon oluşturur.

Transkripsiyon veya gen ekspresyonu üzerindeki etkisi

Heterolog gen ekspresyonu , protein üretimi ve metabolik mühendislik dahil olmak üzere birçok biyoteknolojik uygulamada kullanılmaktadır . tRNA havuzları farklı organizmalar arasında farklılık gösterdiğinden, belirli bir kodlama dizisinin transkripsiyon ve translasyon hızı, yerel olmayan bir bağlama yerleştirildiğinde daha az verimli olabilir. Aşırı eksprese edilmiş bir transgen için , karşılık gelen mRNA, toplam hücresel RNA'nın büyük bir yüzdesini oluşturur ve transkript boyunca nadir kodonların varlığı, verimsiz kullanıma ve ribozomların tükenmesine yol açabilir ve sonuçta heterolog protein üretiminin seviyelerini azaltabilir. Ek olarak, genin bileşimi (örneğin, toplam nadir kodon sayısı ve ardışık nadir kodonların varlığı) da çeviri doğruluğunu etkileyebilir. Bununla birlikte, belirli bir konakçıdaki tRNA havuzları için optimize edilmiş kodonların heterolog bir geni aşırı eksprese etmesi de amino asit açlığına neden olabilir ve tRNA havuzlarının dengesini değiştirebilir. Kodon optimizasyonu olarak adlandırılan, konakçı tRNA bolluklarına uyması için kodonları ayarlamaya yönelik bu yöntem , geleneksel olarak bir heterolog genin ekspresyonu için kullanılmıştır. Bununla birlikte, heterolog ifadenin optimizasyonu için yeni stratejiler, yerel mRNA katlanması, kodon çifti yanlılığı, bir kodon rampası, kodon harmonizasyonu veya kodon korelasyonları gibi küresel nükleotit içeriğini dikkate alır . Sunulan nükleotid değişikliklerinin sayısı ile, bu tür optimize edilmiş bir genin yaratılması için yapay gen sentezi genellikle gereklidir.

Özel kodon yanlılığı, amino asit açlığına dahil olanlar gibi bazı endojen genlerde de görülür . Örneğin, amino asit biyosentetik enzimler tercihen normal tRNA bolluğuna zayıf şekilde adapte olmuş kodonları kullanır, ancak açlık koşulları altında tRNA havuzlarına adapte edilmiş kodonlara sahiptir. Bu nedenle, kodon kullanımı, belirli hücresel koşullar altında uygun gen ekspresyonu için ek bir transkripsiyonel düzenleme düzeyi sunabilir.

Translasyon uzamasının hızına etkisi

Genel olarak yüksek oranda eksprese edilmiş genler için konuşursak, translasyon uzama oranları, tRNA havuzlarına daha yüksek kodon adaptasyonu olan transkriptler boyunca daha hızlıdır ve nadir kodonlara sahip transkriptler boyunca daha yavaştır. Kodon translasyon oranları ve aynı kökenli tRNA konsantrasyonları arasındaki bu korelasyon, organizmaya çeşitli avantajlar sağlayabilen translasyon uzama oranlarının ek modülasyonunu sağlar. Spesifik olarak, kodon kullanımı bu oranların küresel olarak düzenlenmesine izin verebilir ve nadir kodonlar, hız pahasına çevirinin doğruluğuna katkıda bulunabilir.

Protein katlanması üzerindeki etkisi

İn vivo olarak protein katlanması vektöreldir , öyle ki bir proteinin N-terminali translasyon yapan ribozomdan çıkar ve daha fazla C-terminal bölgelerinden önce solvente maruz kalır . Sonuç olarak, eş-çeviri protein katlanması, katlanma yörüngesinde yeni oluşan polipeptit zinciri üzerinde çeşitli uzamsal ve zamansal kısıtlamalar getirir. mRNA translasyon hızları protein katlanmasına bağlı olduğundan ve kodon adaptasyonu translasyon uzamasına bağlı olduğundan, dizi seviyesindeki manipülasyonun protein katlanmasını düzenlemek veya geliştirmek için etkili bir strateji olabileceği varsayılmıştır. Birkaç çalışma, uygun katlanma için gerekli olabilecek belirli proteinler için yerel mRNA yapısının bir sonucu olarak çevirinin duraklamasının meydana geldiğini göstermiştir. Ayrıca, eşanlamlı mutasyonların yeni oluşan proteinin katlanma sürecinde önemli sonuçlara sahip olduğu ve hatta enzimlerin substrat özgüllüğünü değiştirebildiği gösterilmiştir. Bu çalışmalar, kodon kullanımının, polipeptitlerin ribozomdan vektörel olarak ortaya çıkma hızını etkilediğini ve bunun da mevcut yapısal boşluk boyunca protein katlanma yollarını etkileyebileceğini göstermektedir.

analiz yöntemleri

Biyoinformatik ve hesaplamalı biyoloji alanında, kodon kullanım yanlılığını analiz etmek için birçok istatistiksel yöntem önerilmiş ve kullanılmıştır. 'Optimal kodonların frekansı' (Fop), bağıl kodon adaptasyonu (RCA) veya kodon adaptasyon indeksi (CAI) gibi yöntemler, gen ekspresyon seviyelerini tahmin etmek için kullanılırken, ' etkili kodon sayısı ' (Nc) gibi yöntemler kullanılır. ) ve bilgi teorisinden Shannon entropisi , kodon kullanım düzgünlüğünü ölçmek için kullanılır. Uyum analizi ve temel bileşen analizi gibi çok değişkenli istatistiksel yöntemler, genler arasındaki kodon kullanımındaki varyasyonları analiz etmek için yaygın olarak kullanılmaktadır. Yukarıda sayılan istatistiksel analizleri uygulamak için CodonW, GCUA, INCA, vb. dahil olmak üzere birçok bilgisayar programı vardır. Kodon optimizasyonunun sentetik genlerin ve DNA aşılarının tasarımında uygulamaları vardır . Bu amaçla çevrimiçi olarak çeşitli yazılım paketleri mevcuttur (dış bağlantılara bakın).

Referanslar

Dış bağlantılar