zum Directory-modus

Proteomforschung: Einführung

Spezielle Protein-Datenbanken

Eine ausführliche Liste von speziellen Protein-Datenbanken findet sich auf dem ExPASy1)-Server (expasy.org), der heute zu den SIB-assoziierten Bioinformatik-Portalen gehört. Ursprünglich als Proteomics-Server konzipiert, wurde diese Datenbank ständig erweitert und umfasst heute u.a. auch Einträge aus den Bereichen der Genom- und Transkriptomforschung, phylogenetische, evolutionsbiologische oder populationsgenetische Verweise und eine Sektion für Drug Design-Anwendungen wie z.B. SwissDock (http://www.swissdock.ch/) und Click2 Drug (www.click2drug.org/).

Ebenfalls von SIB wird die Modelling-Software SWISS-MODEL (http://swissmodel.expasy.org/) über den ExPASy-Server angeboten, die Proteinstrukturvorhersagen für eigene Sequenzeingaben ermöglicht.

Bei der Zuordnung von möglichen Funktionen zu einem neuen Protein helfen sekundäre Datenbanken, die sich auf bestimmte Domänen oder charakteristische Sequenzmotive spezialisiert haben. Die älteste und vermutlich bekannteste sekundäre Datenbank ist PROSITE (http://prosite.expasy.org/), die auch auf dem ExPASy-Server angeboten wird. In dieser Datenbank werden Proteinfamilien auf der Basis von konservierten Sequenzabschnitten (10-20 Aminosäuren umfassende patterns und längere profiles) charakterisiert. Eine andere nützliche Datenbank, um theoretische Modelle zu finden, ist MODBASE (http://modbase.compbio.ucsf.edu/modbase-cgi-new/index.cgi), in der verlässliche Strukturmodelle für ungefähr 20.000.000 Proteine (Stand August 2011) enthalten sind, zudem Informationen über mögliche Liganden-Bindungsstellen und Protein-Protein-Interaktionen.

Ähnlichen Proteinstrukturen müssen durchaus nicht unbedingt ähnliche Sequenzen zugrunde liegen; diese können auch unabhängig voneinander durch konvergente Evolution erreicht worden sein. Das Vector Alignment Search Tool (VAST) auf dem NCBI-Server sucht anhand einer vorgegebenen Proteinstruktur nach "Strukturnachbarn", also Proteinstrukturen mit ähnlichen Raumkoordinaten.

Für die Aufklärung von Proteinfunktionen können oft auch die Sortiersignale, die letztendlich für die subzelluläre Lokalisation eines Proteins maßgeblich sind, hilfreich sein. Mit PSORT (http://psort.nibb.ac.jp/) werden Proteinsequenzen nach relevanten Signalmotiven durchsucht, die deren späteren Zielort festlegen.

Weitere Beispiele für spezielle Datenbanken sind:

Um das Potential von solchen Datenbanken zusammenzufassen und effizientere Suchen zu ermöglichen, hat sich ein Konsortium namens InterPro (http://www.ebi.ac.uk/interpro/) gebildet. Darin sind die meisten der oben genannten Datenbanken kombiniert und über ein einheitliches Eingabeformat zugänglich.

1)ExPASy: Expert Protein Analysis System
Seite 24 von 26