zum Directory-modus

Proteomforschung: Einführung

Bioinformatik-Werkzeuge zur Identifizierung von Proteinen

Die Methode der Wahl in der Proteom-Forschung zur Identifizierung und Charakterisierung von Proteinen ist die Kombination von Massenspektrometrie und Datenbank-Analyse. Oft wird dabei das Verfahren des "peptide mapping" (Peptid-Kartierung) angewandt. Die mithilfe der 2D-Elektrophorese aufgetrennten Proteine werden danach enzymatisch verdaut und die Massen der durch Proteolyse erhaltenen Peptide mittels Massenspektrometrie bestimmt. Gleichzeitig werden in einer Proteinsequenz-Datenbank die Proteine entsprechend den Versuchsbedingungen "verdaut", die Massen der resultierenden Peptide berechnet und daraus ein theoretisches Massenspektrum konstruiert. Nun wird das gemessene Massenspektrum mit den theoretisch berechneten verglichen und eine Rangfolge der Übereinstimmungen aufgestellt.

Neben dem "peptide mapping", welches allgemeine Informationen über ein Protein liefert, liefern die Massenspektren nach einer Peptid-Fragmentierung vielfältige Informationen über einen kleinen Bereich des Proteins. Dabei werden die Peptid-Ionen aus dem Massenspektrometer isoliert und weiter in Fragmente zerstückelt (durch "collisional excitation"), um dann deren Massen bestimmen zu können. Bei diesem Verfahren genügt oft ein einzelnes Peptid, um das zugrunde liegende Protein identifizieren zu können. Damit können auch Datenbanken durchsucht werden, die nur unvollständige Geninformationen enthalten, wie z.B. EST-Datenbanken. Die Methode wird auch oft zur Identifizierung von komplexen Proteinmischungen angewandt.

Software

Die hier beschriebenen Werkzeuge liefern in der Regel eine Rangfolge der möglichen Kandidatenproteine, die auf statistisch berechneten Faktoren beruhen. Dabei werden teilweise mehr oder weniger ausgefeilte Korrekturen miteingebracht, um eventuelle Verzerrungen bei der Analyse auszugleichen (z.B. dass größere Proteine leichter eine höhere Punktezahl bekommen). Trotzdem müssen die Ergebnisse mit Vorsicht interpretiert und möglichst auf ihre Qualität hin überprüft werden. Denn selbst der Favorit in der Rangliste kann auf einer völlig zufälligen Übereinstimmung beruhen. Durch Simulationsberechnungen kann beispielsweise die Wahrscheinlichkeit ermittelt werden, mit der ein bestimmter Treffer ein falsch-positiver ist.

Eine kurze Beschreibung der verschiedenen Softwarepakete und entsprechende Literaturhinweise findet sich unter http://www.ncbi.nlm.nih.gov:80/entrez/query.fcgi?cmd=Retrieve&db=PubMed&list_uids=10975459&dopt=Abstract.

Seite 18 von 26