zum Directory-modus

Sekundärstrukturvorhersage bei Proteinen

Proteinstrukturvergleiche (engl. "protein shape comparison") bei entfernt verwandten oder nicht homologen Proteinen

Im Laufe der Evolution haben sich Proteine immer wieder über Mutationen verändert und andere Funktionen in der Zelle übernommen. Für viele lebenswichtige Proteine der Zelle gilt, dass nur einige wenige Aminosäuren, die für die Struktur und Funktion des Proteins absolut essentiell sind, konserviert sind (dieses gilt z.B für das aktive Zentrum eines Enzyms), während der Rest des Proteins durch Mutationen stark verändert sein kann. Aminosäure-Sequenzvergleiche benötigen eine Übereinstimmung von mindestens 25 % der Aminosäuren, aber selbst bei 25 bis 40 % Identität können bei einem automatischen Alignment noch viele Fehler auftreten, wenn z.B. Insertionen oder Deletionen falsch plaziert werden. In diesen Fällen ist das resultierende Proteinmodell eher ein Zufallsergebnis als eine wirklich verlässliche mögliche 3D-Struktur. Proteinstruktur-Vergleiche gehen daher oft einen anderen Weg: häufig lässt sich eine ähnliche 3D-Struktur entfernt verwandter Proteine nachweisen, auch wenn die Aminosäure-Sequenz völlig verschieden erscheint. Die Konservierung der Struktureigenschaften eines Proteins trotz abweichender Aminosäure-Reihenfolge ist eine der Grundlagen der vergleichenden Proteinanalyse in der modernen Biologie, mit der sich auch eine entfernte Verwandtschaft von Proteinen nachweisen lässt.

Ein Beispiel ist die DNA-Polymerase β und die Kanamycin-Nucleotidyl-Transferase. Während die Aminosäure-Sequenzen dieser beiden Proteine sehr unterschiedlich sind, zeigt ein Vergleich der 3D-Strukturen einige Übereinstimmungen.

Mouse
Mouse
Abb.1
Die DNA-Polymerase β aus Rattus norvegicus (PDB-Code: 1BNO) - 3D-Anordnung der N-terminalen Domäne (Aminosäurereste 1-87) nach NMR-Analyse
Abb.2
Die Kanamycin-Nucleotidyl-Transferase (PDB-Code: 1KNY) aus Staphyllococcus aureus bei 2,5 Å Auflösung

Datenbanken über Strukturvergleiche ermöglichen auch Aussagen über mögliche Faltungswege

Strukturelemente wie α-Helices oder β-Faltblatt-Bereiche kommen in den meisten Proteinen vor und sind in bestimmter Art und Weise angeordnet (z.B. als "Mäander-Motiv"). Diese Elemente zeichnen sich durch eine hohe Stabilität aus und sind quasi als konservierte Faltungsmuster anzusehen, ohne dass die betreffenden Proteine notwendigerweise eng miteinander verwandt sind. Auch diese "Substrukturbereiche" können verwendet werden, um die Geometrie von Proteinen schnell miteinander zu vergleichen, da die meisten Proteine als eine Kombination dieser Substrukturen betrachtet werden können. Holm et al. und Sander et al. untersuchten 740 Proteine und sie teilten diese nach gemeinsamen Sekundärstrukturelementen und Schleifenbereichen in fünf häufig vorkommende Klassen von Strukturelementen ein:

Tab.1
StrukturelementBeispielVorkommen unter 740 untersuchten Strukturenin Prozent
paralleles β-FaltblattC-terminale Domäne der Succinyl-CoA-Synthetase β-Kette126 17
β-MäanderMaus opg2 IG-Schwere Kette variable Domäne527
α-HelixMyoglobin152
β-ZickzackC-Terminus des Pertussis-Toxins142
ααβ-MäanderC-Terminus der Phosphoglycerat-Dehydrogenase142

Wenn zwei Proteine eines dieser Strukturelemente gemeinsam haben, sagt das allerdings weniger etwas über eine mögliche Verwandtschaftsbeziehung aus, sondern deutet eher darauf hin, dass diese Proteine sich in ähnlicher Art und Weise falten werden. Im nativen (also funkionell intakt gefalteten) Protein liegen diese Substrukturbereiche eher im Inneren des Proteins. Sie werden also vermutlich früh im Faltungsprozess gebildet oder sie sind möglicherweise sogar diejenigen Sequenzbereiche, an denen die Faltung beginnt.

Technisch werden bei diesen Untersuchungen zunächst nur die Raumkoordinaten der α-C-Atome bestimmt (engl.chain tracing) und zwischen den beiden Proteinen verglichen. Dazu wird eines der Moleküle so lange durch Rotation und Translation relativ zum anderen Protein verändert und die intermolekularen Abstände identischer Punkte in den beiden Proteinketten bestimmt, bis die größtmögliche Anzahl identischer Atompositionen mit der geringsten Abweichung erreicht ist. Viele Algorithmen wurden für den Vergleich von Proteinstrukturen entwickelt. Hierzu gehören z.B. Branch-and-bound-Algorithmen, Brutal force systematic searches, Subgraph isomorphism, stochastische Optimierung durch Monte-Carlo-Methoden, genetische Algorithmen, Look-up or Hashing-Methoden, dynamische Programmierung und Clustering.

Literatur

Rost, B.; Sander, C. (2000): Third generation prediction of secondary structures. In: Methods Mol. Biol.. 143 , 71-95
Heger, A.; Holm, L. (2000): Towards a covering set of protein family profiles. In: Prog. Biophys. Mol. Biol.. 73 , 321-37
Schwede, T.; Diemand, A.; Guex, N.; Peitsch, M. C. (2000): Protein structure computing in the genomic era. In: Res. Microbiol.. 151 , 107-112

Zugang zur PubMed-Datenbank

Seite 6 von 6>