Protein ikincil yapısı - Protein secondary structure

Protein primary structure Protein secondary structure Protein tertiary structure Protein quaternary structure
Yukarıdaki resim tıklanabilir bağlantılar içeriyor
Etkileşimli diyagramı ve protein yapısı kullanılarak, PCNA , örnek olarak. ( PDB : 1AXC ​)

Protein ikincil yapı , üç boyutlu bir şekilde bir lokal segmentleri arasında proteinleri . En yaygın iki ikincil yapısal eleman, alfa sarmalları ve beta tabakalarıdır , ancak beta dönüşleri ve omega döngüleri de meydana gelir. İkincil yapı elemanları tipik olarak, protein üç boyutlu üçüncül yapısına katlanmadan önce bir ara madde olarak kendiliğinden oluşur .

İkincil yapı resmi paterni ile tanımlanır hidrojen bağları arasındaki amino , hidrojen ve karboksil peptid oksijen atomu omurga . İkincil yapı alternatif olarak , doğru hidrojen bağlarına sahip olup olmadığına bakılmaksızın Ramachandran grafiğinin belirli bir bölgesindeki omurga dihedral açılarının düzenli modeline dayalı olarak tanımlanabilir .

İkincil yapı kavramı, ilk olarak tanıtılan Kaj Ulrik Linderstrøm-Lang de Stanford ve 1952, başka türlü biyopolimerler gibi nükleik asitler de karakteristik sahip ikincil yapılar .

Türler

Protein sarmallarının üç ana formunun yapısal özellikleri
geometri özniteliği α-sarmal 3 10 sarmal π-sarmal
Tur başına kalıntı 3.6 3.0 4.4
Kalıntı başına çeviri 1,5 Å (0,15 nm) 2.0 Å (0.20 nm) 1,1 Å (0,11 nm)
sarmalın yarıçapı 2,3 Å (0,23 nm) 1,9 Å (0,19 nm) 2,8 Å (0,28 nm)
Saha 5,4 Å (0,54 nm) 6,0 Å (0,60 nm) 4,8 Å (0,48 nm)
Protein secondary structure Beta sheet Alpha helix
Yukarıdaki resim tıklanabilir bağlantılar içeriyor
Etkileşimli şeması arasında hidrojen bağları içinde proteinin ikincil yapı . Çizgi yukarıda kırmızı, mavi, oksijen, nitrojen ve aşağıda atomu ( PDB : 1AXC )

En yaygın ikincil yapılar alfa sarmalları ve beta sayfalarıdır . 3 10 sarmal ve π sarmal gibi diğer sarmalların enerjik olarak uygun hidrojen bağlama modellerine sahip olduğu hesaplanmıştır, ancak sarmalın merkezindeki olumsuz omurga paketi nedeniyle a sarmallarının uçları dışında doğal proteinlerde nadiren gözlenir. Poliprolin sarmalı ve alfa tabakası gibi diğer genişletilmiş yapılar , doğal durum proteinlerinde nadirdir, ancak genellikle önemli protein katlama ara maddeleri olarak varsayılır . Sıkı dönüşler ve gevşek, esnek döngüler, daha "düzenli" ikincil yapı elemanlarını birbirine bağlar. Gelişigüzel kıvrımlı üç gerçek bir ikincil yapı değildir, ama normal ikincil yapının olmayışına işaret konformasyonlarının sınıfıdır.

Amino asitler , çeşitli ikincil yapı elemanlarını oluşturma yeteneklerine göre değişir. Prolin ve glisin bazen "sarmal kırıcılar" olarak bilinirler çünkü bunlar α sarmal omurga yapısının düzenini bozarlar; bununla birlikte, her ikisinin de olağandışı biçimsel yetenekleri vardır ve genellikle sırayla bulunurlar . Proteinlerde sarmal konformasyonları benimsemeyi tercih eden amino asitler arasında metionin , alanin , lösin , glutamat ve lisin ( amino asit 1 harfli kodlarda "MALEK" ); Buna göre, büyük aromatik kalıntıları ( triptofan , tirozin ve fenilalanin ) ve C β a konumunda dallanmış amino asitler ( izolösin , valin , ve treonin ) alması için tercih iplikli β konformasyonlar. Bununla birlikte, bu tercihler, yalnızca diziden ikincil yapıyı tahmin etmek için güvenilir bir yöntem üretecek kadar güçlü değildir.

Düşük frekanslı toplu titreşimlerin, proteinler içindeki yerel katılığa duyarlı olduğu düşünülür ve beta yapılarının genel olarak alfa veya düzensiz proteinlerden daha katı olduğunu ortaya çıkarır. Nötron saçılması ölçümleri, ~1 THz'deki spektral özelliği doğrudan beta varil proteini GFP'nin ikincil yapısının toplu hareketlerine bağlamıştır.

İkincil yapılardaki hidrojen bağ desenleri önemli ölçüde bozulabilir, bu da ikincil yapının otomatik olarak belirlenmesini zorlaştırır. Protein ikincil yapısını resmi olarak tanımlamak için çeşitli yöntemler vardır (örneğin, DSSP , DEFINE, STRIDE , ScrewFit, SST ).

DSSP sınıflandırması

Yedekli olmayan pdb_select veri setinden elde edilen dağılım (Mart 2006); DSSP tarafından atanan ikincil yapı; 8 konformasyonel durum 3 duruma indirgenmiştir: H=HGI, E=EB, C=STC. DSSP durumlarının azalmasından da kaynaklanan (gauss) dağılımların karışımları görülebilir.

Protein İkincil Yapı Sözlüğü, kısaca DSSP, yaygın olarak tek harfli kodlarla protein ikincil yapısını tanımlamak için kullanılır. İkincil yapı, Pauling ve diğerleri tarafından başlangıçta önerilenler gibi hidrojen bağlama modellerine dayalı olarak atanır. 1951'de (herhangi bir protein yapısı deneysel olarak belirlenmeden önce). DSSP'nin tanımladığı sekiz tür ikincil yapı vardır:

  • G = 3 dönüşlü sarmal ( 3 10 sarmal ). Minimum uzunluk 3 kalıntı.
  • H = 4 dönüşlü sarmal ( α sarmal ). Minimum uzunluk 4 kalıntı.
  • I = 5 dönüşlü sarmal ( π sarmal ). Minimum uzunluk 5 kalıntı.
  • T = hidrojen bağlı dönüş (3, 4 veya 5 dönüş)
  • E = paralel ve/veya anti-paralel β-tabaka konformasyonunda uzatılmış iplik . Minimum uzunluk 2 kalıntı.
  • B = izole edilmiş β-köprüsündeki kalıntı (tek çift β-tabaka hidrojen bağı oluşumu)
  • S = bükülme (hidrojen bağına dayalı olmayan tek atama).
  • C = bobin (yukarıdaki konformasyonların hiçbirinde olmayan kalıntılar).

'Bobin' genellikle ' ' (boşluk), C (bobin) veya '–' (tire) olarak kodlanır. Helislerin (G, H ve I) ve tabaka konformasyonlarının hepsinin makul bir uzunluğa sahip olması gerekir. Bu, birincil yapıdaki 2 bitişik kalıntının aynı hidrojen bağlama modelini oluşturması gerektiği anlamına gelir. Helis veya tabaka hidrojen bağlama modeli çok kısaysa, sırasıyla T veya B olarak adlandırılırlar. Diğer protein ikincil yapı atama kategorileri mevcuttur (keskin dönüşler, Omega döngüleri vb.), ancak daha az sıklıkla kullanılırlar.

İkincil yapı, hidrojen bağı ile tanımlanır , bu nedenle bir hidrojen bağının kesin tanımı çok önemlidir. İkincil yapı için standart hidrojen bağı tanımı , tamamen elektrostatik bir model olan DSSP'ninkidir . Sırasıyla karbonil karbon ve oksijene ± q 1  ≈ 0.42 e yükler ve amid hidrojen ve nitrojene sırasıyla ± q 2  ≈ 0.20 e yükler atar . Elektrostatik enerji

DSSP'ye göre, bir hidrojen bağı ancak ve ancak E , -0,5 kcal/mol'den (-2,1 kJ/mol) düşükse var olur . DSSP formülü, fiziksel hidrojen bağı enerjisinin nispeten kaba bir tahmini olmasına rağmen , genellikle ikincil yapıyı tanımlamak için bir araç olarak kabul edilir.

SST sınıflandırması

SST , Minimum Mesaj Uzunluğu ( MML ) çıkarımının Shannon bilgi kriterini kullanarak protein koordinat verilerine ikincil yapı atamak için bir Bayes yöntemidir . SST , ikincil yapının herhangi bir atamasını, verilen protein koordinat verilerini açıklamaya ( sıkıştırmaya ) çalışan potansiyel bir hipotez olarak ele alır . Ana fikir, en iyi ikincil yapısal atamanın, belirli bir protein koordinatlarının koordinatlarını en ekonomik şekilde açıklayabilen ( sıkıştıran ) ve böylece ikincil yapının çıkarımını kayıpsız veri sıkıştırmasına bağlayan olmasıdır . SST, herhangi bir protein zincirini aşağıdaki atama türleriyle ilişkili bölgelere doğru bir şekilde tanımlar:

SST , standart α- helislerine göre π ve 3 10 sarmal başlığı algılar ve çeşitli uzatılmış şeritleri otomatik olarak tutarlı β-pileli levhalar halinde birleştirir. Parçalanmış ikincil yapısal elemanların okunabilir bir çıktısını ve atanan ikincil yapısal elemanları ayrı ayrı görselleştirmek için karşılık gelen bir PyMol - yüklenebilir komut dosyası sağlar.

deneysel belirleme

Bir biyopolimerin kaba ikincil yapı içeriği (örneğin, "bu protein %40 α-sarmal ve %20 β-tabakadır .") spektroskopik olarak tahmin edilebilir . Proteinler için yaygın bir yöntem, uzak-ultraviyole (uzak-UV, 170-250 nm) dairesel dikroizmdir . 208 ve 222 nm'de belirgin bir çift minimum, α-sarmal yapıyı gösterirken, 204 nm veya 217 nm'de tek bir minimum, sırasıyla rastgele bobin veya β-yaprak yapısını yansıtır. Daha az yaygın bir yöntem, hidrojen bağı nedeniyle amid gruplarının bağ salınımlarındaki farklılıkları tespit eden kızılötesi spektroskopidir . Son olarak, ikincil yapı içerikleri, başlangıçta atanmamış bir NMR spektrumunun kimyasal kaymaları kullanılarak doğru bir şekilde tahmin edilebilir .

Tahmin

Yalnızca amino dizisinden protein üçüncül yapıyı tahmin etmek çok zor bir problemdir (bkz. protein yapısı tahmini ), ancak daha basit ikincil yapı tanımlarını kullanmak daha izlenebilirdir.

İkincil yapı tahmininin erken yöntemleri, üç baskın durumu tahmin etmekle sınırlıydı: sarmal, tabaka veya rastgele bobin. Bu yöntemler, bazen ikincil yapı elemanlarını oluşturan serbest enerjiyi tahmin etmek için kurallarla birleştirilmiş, bireysel amino asitlerin sarmal veya tabaka oluşturma eğilimlerine dayanıyordu. Amino asit dizisinden protein ikincil yapısını tahmin etmek için yaygın olarak kullanılan ilk teknikler Chou-Fasman yöntemi ve GOR yöntemiydi . Bu tür yöntemlerin, bir kalıntının üç durumdan (sarmal/levha/bobin) hangisini benimsediğini tahmin etmede ~%60 doğruluk elde ettiğini iddia etmesine rağmen, daha sonra kör hesaplama değerlendirmeleri gerçek doğruluğun çok daha düşük olduğunu gösterdi.

Çoklu dizi hizalamasından yararlanılarak doğrulukta önemli bir artış (yaklaşık %80'e kadar) yapıldı ; Evrim boyunca bir pozisyonda (ve çevresinde, tipik olarak her iki tarafta ~7 kalıntı) meydana gelen amino asitlerin tam dağılımını bilmek, o pozisyona yakın yapısal eğilimlerin çok daha iyi bir resmini sağlar. Örnek olarak, belirli bir protein , belirli bir pozisyonda bir glisine sahip olabilir ve bu, kendi başına orada rastgele bir bobin önerebilir. Bununla birlikte, çoklu dizi hizalaması, yaklaşık bir milyar yıllık evrimi kapsayan homolog proteinlerin %95'inde bu konumda (ve yakın konumlarda) sarmal lehine amino asitlerin meydana geldiğini ortaya çıkarabilir. Ayrıca, o ve yakın konumlardaki ortalama hidrofobikliği inceleyerek, aynı hizalama aynı zamanda bir a sarmalıyla tutarlı bir kalıntı çözücü erişilebilirlik modeli önerebilir . Birlikte ele alındığında, bu faktörler orijinal proteinin glisininin rastgele sarmal yerine a-sarmal yapıyı benimsediğini düşündürür. 3 durumlu bir tahmin oluşturmak için mevcut tüm verileri birleştirmek için sinir ağları , gizli Markov modelleri ve destek vektör makineleri dahil olmak üzere çeşitli yöntemler kullanılır . Modern tahmin yöntemleri ayrıca her pozisyonda tahminleri için bir güven puanı sağlar.

İkincil yapı tahmin yöntemleri , Protein Yapısı Tahmininin Kritik Değerlendirmesi (CASP) deneyleri ile değerlendirildi ve sürekli olarak, örneğin EVA (kıyaslama) ile kıyaslandı . Bu testlere dayanarak en doğru yöntemler Psipred , SAM, PORTER, PROF ve SABLE idi. İyileştirme için ana alan, β iplikçiklerinin tahmini gibi görünmektedir; β iplikçik olarak güvenle tahmin edilen kalıntıların böyle olması muhtemeldir, ancak yöntemler bazı β iplikçik parçalarını gözden kaçırmaya yatkındır (yanlış negatifler). Tahminlerin kıyaslandığı PDB yapılarına ikincil yapı sınıfları (sarmal/sarmal/sarmal) atamak için standart yöntemin ( DSSP ) kendine özgü özellikleri nedeniyle, genel olarak ~%90'lık bir tahmin doğruluğu üst sınırı vardır.

Doğru ikincil yapı tahmini, en basit ( homoloji modellemesi ) durumlar dışında , üçüncül yapının tahmininde kilit bir unsurdur . Örneğin, güvenle tahmin edilen altı ikincil yapı elemanı βαββαβ modeli, bir ferredoksin katının imzasıdır .

Uygulamalar

Hem protein hem de nükleik asit ikincil yapıları, çoklu dizi hizalamasına yardımcı olmak için kullanılabilir . Bu hizalamalar, basit dizi bilgilerine ek olarak ikincil yapı bilgilerinin dahil edilmesiyle daha doğru hale getirilebilir. Bu bazen RNA'da daha az kullanışlıdır çünkü baz eşleşmesi diziden çok daha fazla korunur. Birincil yapıları hizalanamayan proteinler arasındaki uzak ilişkiler bazen ikincil yapı ile bulunabilir.

α-helislerinin, doğal proteinlerdeki β-ipliklerinden daha kararlı, mutasyonlara karşı dayanıklı ve tasarlanabilir olduğu gösterilmiştir, bu nedenle fonksiyonel all-α proteinlerini tasarlamanın, hem sarmallı hem de sarmallı proteinleri tasarlamaktan daha kolay olması muhtemeldir; bu yakın zamanda deneysel olarak doğrulanmıştır.

Ayrıca bakınız

Referanslar

daha fazla okuma

Dış bağlantılar