zum Directory-modus

Homologie-Modellieren von Proteinen

Das "Threading"-Verfahren

Diese Methode wird auch Sequenz-"Strukturalignment" genannt.

Je weiter der letzte gemeinsame Vorfahr von zwei Proteinen in der Evolution zurückliegt, desto schwieriger ist es, mit Sequenzhomologie-Vergleichen eine Verwandtschaft nachzuweisen. Beträgt die Aminosäure-Sequenzidentität der Proteine weniger als 20 %, fallen die meisten Sequenzhomologiestudien negativ aus. In diesem Fall hat sich das "Threading"-Verfahren bewährt, bei dem getestet wird, ob eine neue Proteinsequenz mit einem Satz bereits bekannter Faltungsstrukturen kompatibel ist.

Das "Threading"-Verfahren basiert auf der Annahme, dass die Seitenketten von Aminosäuren im Protein eine räumliche Lage einnehmen, in der sie energetisch möglichst vorteilhafte Interaktionen eingehen können. Wenn man nun eine neue Sequenz nimmt und deren Rückgrat über das (ähnliche) Rückgrat dieser bekannten Sequenz legt, sollten sich auch die Seitenketten der neuen Sequenz so anordnen werden, dass günstige, lokal stabile Interaktionen eingegangen werden.

Die Datenbank

Die Elemente der Datenbanken, die für ein "Threading" verwendet werden, können viele verschiedene Namen haben, z.B. Strukturen, Faltungselemente ("folds"), Faltungsmotive, Faltungsmuster ("fold pattern"), Topologie-"Fingerprints", 3D-Profile, Kontaktprofile, Domänen, Strukturmodelle, 3D-"Templates" oder Struktur-"Templates", um nur einige zu nennen. Alle Faltungselemente sind Teile bekannter Proteine, die auf das Wesentliche reduziert sind. Nur das Proteinrückgrat ist relevant, Details wie Seitenketten oder variable Schleifenstrukturen sind eliminiert. Diesem Faltungselement sind Eigenschaften zugeordnet, die die lokale Strukturumgebung definieren: Entfernungen, Winkel, die Art der Sekundärstrukturelemente, Zugänglichkeit des Lösungsmittels, Exposition, Rückgrat-Parameter usw.

Hinweis
Schleifenbereiche ("loops") werden mit speziellen "Loop"-Funktionen modelliert. Auch diese Schleifenbereiche enthalten bestimmte Reste, die auf eine mögliche Faltung hinweisen, so z.B. Aminosäuren, die häufig bei einer Richtungsumkehr ("turn") zu finden sind.

Schematische Darstellung der Vorgehensweise

Zunächst wird das richtige Faltungsmotiv (1, 2 oder 3...) als "Template" aus einer Datenbank (Strukturbibliothek) ausgewählt. Danach verfährt man, wie folgt:

Abb.1
Abbildung modifiziert nach: S.L.Salzberg et al. (1998) Statistical analysis of protein structures. Kapitel 11.
Aus: Computational Methods in Molecular Biology. S.L.Salzberg, D.B.Searls, S.Kasif (ed.). Elsevier Science B.V.

I. Die Faltungsmotive selbst sind bestimmte Domänen bekannter Proteine (A,B,C,D). Die Schleifenbereiche (in hellgrau dargestellt) zwischen diesen Faltungsdomänen werden zunächst nicht berücksichtigt.

II. Die möglichen Interaktionen der Faltungsmotive miteinander werden festgelegt (die Punkte entsprechen einzelnen Aminosäuren, die Interaktionen sind als graue Linien dargestellt). Diese Interaktionen bzw. die Strukturumgebung jeder einzelnen Aminosäure ist später für die Berechnung der "Score"-Funktion notwendig.

III."Alignment" von Struktur und neuer Aminosäure-Sequenz (= "Threading"). Positionen der Aminosäure-Sequenz werden Positionen im "Template"-Protein zugeordnet. Verschiedene Möglichkeiten des Struktur-Sequenzalignments sind als Pfeile dargestellt. Die möglichen Zuordnungen werden überprüft: eine "Score"-Funktion, die Präferenzen der Aminosäuren für bestimmte Umgebungen oder Interaktionen mit anderen Aminosäuren in der Nachbarschaft berechnet, legt fest, ob ein jeweiliges "Threading" gut oder schlecht ist.

IV. Aus dem "Threading" ergibt sich das wahrscheinlichste "Alignment" als Resultat.

Seite 6 von 6>