Açık okuma çerçevesi - Open reading frame

Üç farklı olası okuma çerçevesini gösteren örnek dizi . Başlatma kodonları morla , durdurma kodonları kırmızıyla vurgulanır.

Olarak moleküler genetik , bir açık okuma çerçevesi ( ORF ) bir parçası olan okuma çerçevesi olması özelliğine sahiptir çevrilmiştir . Bir ORF sürekli bir streç kodonu bir ile başlayabilir start kodonu , bir (genellikle AUG) ve uçları stop kodonu (genellikle UAA UAG veya UGA). ORF (ilk olması gerekmez) içindeki bir ATG kodonu ( RNA cinsinden AUG ), çevirinin nerede başladığını gösterebilir. Transkripsiyon sonlandırma sitesi ötesinde, ORF sonra bulunduğu çeviri durdurma kodonu . Transkripsiyon durdurma kodonundan önce duracak olsaydı, çeviri sırasında eksik bir protein yapılırdı. Olarak ökaryotik genlerin çoklu ile eksonlar , intronlar çıkarılır ve eksonlar daha sonra nihai vermek üzere transkripsiyon sonrası birleştirilir mRNA , protein çeviri için. Gen bulma bağlamında, bir ORF'nin başlat-durdur tanımı , bu nedenle, intronlar durdurma kodonları içerebileceğinden ve/veya okuma çerçeveleri arasında kaymalara neden olabileceğinden, genomik DNA için değil, yalnızca eklenmiş mRNA'lar için geçerlidir. Alternatif bir tanım, ORF'nin uzunluğu üçe bölünebilen ve durdurma kodonları ile sınırlanan bir dizi olduğunu söyler. Bu daha genel tanım , elde edilen dizilerde başlatma ve/veya durdurma kodonunun bulunmadığı transkriptomik ve/veya metagenomik bağlamında da yararlı olabilir. Böyle bir ORF, genin tamamından ziyade bir genin bölümlerine karşılık gelir.

biyolojik önemi

Açık okuma çerçevelerinin (ORF'ler) yaygın bir kullanımı, gen tahminine yardımcı olacak tek bir kanıttır . Uzun ORF'ler, diğer kanıtlarla birlikte , bir DNA dizisindeki aday protein kodlayan bölgeleri veya fonksiyonel RNA kodlayan bölgeleri başlangıçta tanımlamak için sıklıkla kullanılır . Bir ORF'nin varlığı, bölgenin her zaman çevrildiği anlamına gelmez . Örneğin, her nükleotidin eşit yüzdesine sahip rastgele oluşturulmuş bir DNA dizisinde, her 21 kodonda bir durdurma kodonu beklenir . Prokaryotlar için basit bir gen tahmin algoritması, bir başlangıç ​​kodonu ve ardından tipik bir proteini kodlamak için yeterince uzun bir açık okuma çerçevesi arayabilir, burada o bölgenin kodon kullanımı , verilen organizmanın kodlama bölgeleri için frekans karakteristiğiyle eşleşir. Bu nedenle, bazı yazarlar, bir ORF'nin minimum bir uzunluğa, örneğin 100 kodon veya 150 kodon olması gerektiğini söylemektedir. Tek başına uzun bir açık okuma çerçevesi bile bir genin varlığının kesin kanıtı değildir . Öte yandan, protein kodlayan genlerin (hem ncRNA'lardan hem de mRNA'lardan) klasik ayırt edici özelliklerinden yoksun olan bazı kısa ORF'lerin (sORF'ler) fonksiyonel peptitler üretebildiği kanıtlanmıştır. Memeli mRNA'larının yaklaşık %50'sinin 5'-UTR'sinin bir veya birkaç sORF içerdiği bilinmektedir. sORF'lerin deneysel olarak bulunan translasyon başlatma bölgelerinin %64-75'i insan ve fare genomlarında korunur ve bu elementlerin bir işlevi olduğunu gösterebilir. Bununla birlikte, sORF'ler genellikle mRNA'ların yalnızca küçük formlarında bulunabilir ve seçimden kaçınır; başlatma bölgelerinin yüksek muhafazakarlığı, ilgili genlerin promotörleri içindeki konumlarıyla bağlantılı olabilir. Bu, örneğin SLAMF1 geninin özelliğidir .

Altı çerçeveli çeviri

DNA, üç nükleotidden (kodon) oluşan gruplar halinde yorumlandığından, bir DNA zincirinin üç farklı okuma çerçevesi vardır. Bir DNA molekülünün çift sarmalının iki anti-paralel zinciri vardır; her biri üç okuma çerçevesine sahip iki şerit ile, altı olası çerçeve çevirisi vardır.

Altı çerçeveli çeviri örneği. Nükleotid sekansı, yukarıda ileri çeviriler ve aşağıda ters çeviriler ile ortada gösterilmiştir. Dizilerle birlikte iki olası açık okuma çerçevesi vurgulanmıştır.

Yazılım

Bulucu

ORF Bulucu (Open Reading Frame Finder), bir kullanıcının dizisindeki veya halihazırda veritabanında bulunan bir dizideki seçilebilir minimum boyuttaki tüm açık okuma çerçevelerini bulan bir grafik analiz aracıdır. Bu araç, standart veya alternatif genetik kodları kullanarak tüm açık okuma çerçevelerini tanımlar. Çıkarsanan amino asit dizisi, çeşitli formatlarda kaydedilebilir ve temel yerel hizalama arama aracı (BLAST) sunucusu kullanılarak dizi veritabanına karşı aranabilir . ORF Bulucu, eksiksiz ve doğru dizi gönderimlerinin hazırlanmasında yardımcı olmalıdır. Ayrıca Payet dizi gönderme yazılımı (dizi analizörü) ile birlikte paketlenmiştir.

araştırmacı

ORF Investigator, sadece kodlayan ve kodlamayan diziler hakkında bilgi vermekle kalmayıp, aynı zamanda farklı gen/DNA bölgeleri dizilerinin ikili global hizalamasını da yapabilen bir programdır. Araç, karşılık gelen amino asit dizileri için ORF'leri verimli bir şekilde bulur ve bunları tek harfli amino asit kodlarına dönüştürür ve dizideki konumlarını sağlar. Diziler arasındaki ikili küresel hizalama, tek nükleotid polimorfizmi dahil olmak üzere farklı mutasyonların saptanmasını kolaylaştırır . Gen hizalaması için Needleman-Wunsch algoritmaları kullanılır. ORF Investigator, taşınabilir Perl programlama dilinde yazılmıştır ve bu nedenle tüm yaygın işletim sistemlerinin kullanıcıları tarafından kullanılabilir.

tahmin edici

OrfPredictor, eksprese edilmiş dizi etiketi (EST) türevli dizilerde protein kodlayan bölgeleri tanımlamak için tasarlanmış bir web sunucusudur. BLASTX'te isabetli sorgu dizileri için program, BLASTX hizalamalarında tanımlanan çeviri okuma çerçevelerine dayalı olarak kodlama bölgelerini tahmin eder, aksi takdirde, sorgu dizilerinin içsel sinyallerine dayalı olarak en olası kodlama bölgesini tahmin eder. Çıktı, FASTA formatında tahmin edilen peptit dizileri ve sorgu kimliğini, çeviri okuma çerçevesini ve kodlama bölgesinin başladığı ve bittiği nükleotit konumlarını içeren bir tanım satırıdır. OrfPredictor, özellikle büyük ölçekli EST projeleri için EST'den türetilen dizilerin açıklamasını kolaylaştırır.

ORF Predictor, yukarıda bahsedilen iki farklı ORF tanımının bir kombinasyonunu kullanır. Bir başlangıç ​​kodonu ile başlayan ve bir durdurma kodonu ile biten uzantıları arar. Ek bir kriter olarak, 5' çevrilmemiş bölgede (UTR veya NTR, çevrilmemiş bölge ) bir durdurma kodonu arar .

ORFik

ORFik, açık okuma çerçevelerini bulmak ve ORF'lerin gerekçelendirilmesi için Yeni nesil sıralama teknolojilerini kullanmak için Bioconductor'da bir R paketidir.

orfipi

orfipy, ORF'leri son derece hızlı ve esnek bir şekilde çıkarmak için Python/Cython'da yazılmış bir araçtır. orfipy, düz veya gzip'li FASTA ve FASTQ dizileriyle çalışabilir ve ORF aramalarında ince ayar yapmak için çeşitli seçenekler sunar; bunlar, başlatma ve durdurma kodonlarının belirtilmesini, kısmi ORF'lerin rapor edilmesini ve özel çeviri tablolarının kullanılmasını içerir. Sonuçlar, yerden tasarruf sağlayan BED formatı da dahil olmak üzere birden fazla formatta kaydedilebilir. orfipy, de-novo transkriptom düzenekleri gibi çok sayıda daha küçük FASTA dizisini içeren veriler için özellikle daha hızlıdır.

Ayrıca bakınız

Referanslar

Dış bağlantılar

  • Çeviri ve Açık Okuma Çerçeveleri
  • hORFeome V5.1 - CCSB Human ORFeome Collection için web tabanlı etkileşimli bir araç
  • ORF Marker - ORF'leri tahmin etmek ve analiz etmek için ücretsiz, hızlı ve çok platformlu bir masaüstü GUI aracı
  • StarORF - ORF'leri tahmin etmek ve analiz etmek ve ters tamamlayıcı dizisi elde etmek için çok platformlu, java tabanlı bir GUI aracı
  • ORFPredictor - Bir grup EST veya cDNA dizisinin ORF tahmini ve çevirisi için tasarlanmış bir web sunucusu