zum Directory-modus

Tutorial MenueStrukturvorhersagen bei ProteinenLerneinheit 2 von 3

Sekundärstrukturvorhersage bei Proteinen

Sekundärstrukturanalyse: Der Chou-Fasman-Algorithmus

Definition
Der Chou-Fasman-Algorithmus ist eine sehr weit verbreitete Methode zur Strukturvorhersage, da diese Methode zwar relativ einfach und trotzdem sehr genau ist. Es handelt sich dabei um eine statistische Methode, bei der jeder Aminosäure eine konformationelle Präferenz als Maß für die Neigung, eine Helix, ein β-Faltblatt oder eine β-Schleife (β-Turn) zu bilden, zugewiesen wird.

Die Berechnung basiert auf der Annahme, dass die Bildung einer Sekundärstruktur (α-Helix, β-Faltblatt oder β-Turn) jeweils in einem Bereich beginnt, der die maximale Tendenz hat, diese Sekundärstruktur zu bilden, und dann so lange fortgeführt wird, bis ein Bereich mit geringer Tendenz erreicht wird. Konkret gesagt heißt das, wenn vier von sechs Aminosäureresten Helix-bildend oder drei von fünf Resten Faltblatt-bildend sind, ist dieses eine Nukleationsstelle für die jeweilige Sekundärstruktur, von der aus in beiden Richtungen fortgeschritten wird, bis eine Tetrapeptid-Sequenz erreicht ist, die einen Helix- oder Faltblattbrecher darstellt. Der Chou-Fasman-Algorithmus wird z.B. in verschiedenen Programmen, die Sekundärstrukturen voraussagen, verwendet, siehe unter Predict protein (Internet Service für Sequenzanalysen und Strukturvorhersagen).

Bei der Chou-Fasman-Methode der Sekundärstrukturvorhersage werden jedem Rest bestimmte Werte zugeteilt und mit diesen Werten dann einfache Berechnungen durchgeführt. Die Werte ergeben sich aus folgender Tabelle:

Tab.1
Chou-Fasman-Analyse - ( engl. p = probability bzw. die Wahrscheinlichkeit, mit der die Aminosäuren in einem bestimmten Sekundärstrukturelement vorliegen)
NameP(α)P(β)P(Turn)f(i)f(i+1)f(i+2)f(i+3)
Alanin 14283660.060.0760.0350.058
Arginin 9893950.070.1060.0990.085
Aspartat 101541460.1470.1100.1790.081
Asparagin 67891560.1610.0830.1910.091
Cystein701191190.1490.0500.1170.128
Glutamat 15137740.0560.0600.0770.064
Glutamin 111110980.0740.0980.0370.098
Glycin57751560.1020.0850.1900.152
Histidin 10087950.1400.0470.0930.054
Isoleucin 108160470.0430.0340.0130.056
Leucin 121130590.0610.0250.0360.070
Lysin114741010.0550.1150.0720.095
Methionin 145105600.0680.0820.0140.055
Phenylalanin 113138600.0590.0410.0650.065
Prolin 57551520.1200.3010.0340.068
Serin77751430.1200.1390.1250.106
Threonin 83119960.0860.1080.0650.079
Tryptophan 108137960.0770.0130.0640.167
Tyrosin691471140.0820.0650.1140.125
Valin 106170500.0620.0480.0280.053

Die Berechnungen werden, wie folgt, durchgeführt:

  1. Allen Aminosäureresten im Peptid werden die Werte aus der Tabelle zugeordnet
  2. Das Peptid wird durchsucht, bis eine Region gefunden wird, in der vier von sechs aufeinander folgenden Resten einen mittleren P(α-Helix) >100 haben. Die Helix wird in beiden Richtungen weitergeführt, bis vier aufeinander folgende Aminosäuren gefunden werden, deren mittlerer P(α-Helix) <100 ist. Diese Region ist das Ende der Helix. Wenn die so identifizierte Region mehr als fünf Aminosäuren umfasst und der mittlere P(α-Helix) > P(β-Faltblatt) ist, gilt diese Region per Definition als α-Helix.
  3. Dieser Vorgang wird wiederholt, bis alle helicalen Bereiche identifiziert sind.
  4. Das Peptid wird durchsucht, bis eine Region gefunden wird, in der drei von fünf aufeinander folgenden Resten einen mittleren P(β-Faltblatt) >100 haben. Das Faltblatt wird in beiden Richtungen weitergeführt, bis vier aufeinander folgende Aminosäuren gefunden werden, deren mittlerer P(β-Faltblatt) <100 ist. Diese Region ist das Ende des Faltblatts. Wenn die so identifizierte Region einen mittleren P(β-Faltblatt) >105 hat und der mittlere P(β-Faltblatt)>P(α-Helix) ist, gilt diese Region per Definition als β-Faltblatt.
  5. Wenn eine Region überlappende Helix- und Faltblattanteile hat, gilt sie als helical, wenn der mittlere P(α-Helix) > P(β-Faltblatt) ist. Diese Region gilt als Faltblatt, wenn der mittlere P(β-Faltblatt) > P(α-Helix) ist.

Um eine Schleife (engl. "turn") am Rest j zu identifizieren, berechnet man p(t) = f(j) f(j+1) f(j+2) f(j+3), wobei man den f(j+1) Wert aus der Tabelle für den Rest j+1 verwendet, den f(j+2) Wert für den j+2 Rest usw. Wenn (1) p(t) > 0.000075; und (2) der Durchschnittswert für P("turn") > 1.00 im Tetrapeptid ist; und (3) der Durchschnittswert für das Tetrapeptid der Ungleichung P(α-Helix) < P("turn") > P(β-Faltblatt) folgt, dann ist an dieser Stelle ein "β-turn".

Literatur

Fassman, P. J.; Fasman , G. D. (1978): Empirical Predictions of Protein Conformation. In: Annual Review Biochemistry. 47 , 251-276
Fasman, D. G.; Prevelige Jr, P. (1989): Prediction of Protein Structure and the Principles of Protein Conformation. D. Fasman G. (Hrsg.). Plenum Press , pp. 391-416
Rost, B.; Yachdav, G.; Liu, J. ((2004)): The Predict Protein Server. In: Nucleic Acids Res.. 32 , W321-W326

Zugang zur PubMed-Datenbank

Seite 4 von 6