zum Directory-modus

Proteomforschung: Einführung

Datenbanken und Programme in der Proteomforschung

Welche Datenbanken gibt es?

Ausgehend von Genomdaten schreiben Datenbanken Sequenzabfolgen, -anordnungen oder -kombinationen bestimmte Funktionen zu und ermöglichen die Vernetzung mit anderen biologischen Datenbanken, in denen zum Beispiel Informationen über die Aktivität von Genen (Transkriptom-Datenbanken) und Proteinen (Proteom-Datenbanken) unter definierten Bedingungen, Proteinstrukturen etc. abgelegt sind. Dieses "Umschreiben" hat eine Vielzahl verschiedener funktionsbezogener Datenbanken entstehen lassen, die eine Interpretation der Basenabfolgen zum Ziel haben. Es gibt

  • Datenbanken für krankheitsrelevante Erbgutvariationen ("single nucleotide polymorphisms", SNPs),
  • Datenbanken zur Identifizierung und zum Vergleich von Genen,
  • Datenbanken zur Identifizierung genregulatorischer Sequenzbereiche,
  • Datenbanken zur Umrechnung der genetischen Information in Proteinsequenzen und zur Suche nach bestimmten Proteinbereichen sowie -eigenschaften auf Basis der Nucleotidsequenz,
  • Datenbanken zur Evolution von Genen,
  • Datenbanken zur Vernetzung genetischer Daten mit Stoffwechseldaten,
  • Datenbanken zur Visualisierung molekularbiologischer Daten.

Anwendungsbereiche und zukünftige Entwicklungen

Neue Methoden wie DNA-Chips lassen erwarten, dass die Informationsmenge zur Genexpression ("High-Throughput" Mutagenese-Experimente) rasch anwächst. Im Rahmen der Bemühungen um die Sequenzierung des menschlichen Genoms hat sich deutlich gezeigt, dass Analyse- und Design-Aufgaben in der Molekularbiologie ohne entsprechende Ausstattung mit Computern und spezieller Kompetenz in der Bioinformatik kaum noch möglich ist (siehe z.B. die Erzeugung von EST). Bei weitem der größte Anteil von Computersystemen für die Molekularbiologie zielt ab auf die Suche in biomedizinischen Datenbanken, Homologiesuche, Clustern von Sequenzen, graphische Darstellung, Optimierung von Strukturen durch die Bestimmung der minimalen Bindungsenergie, Konstruktion von Proteinen u.a.. Sehr viel seltener sind intelligente Systeme (Expertensysteme), die biomedizinisches Wissen explizit verwenden, um experimentelle oder theoretische Arbeiten zu unterstützen. Expertensysteme basieren auf einer Computermethode, die schon in vielen Bereichen in Industrie und Dienstleistungen eingesetzt wird. Sie spielen eine zentrale Rolle in der Verbesserung von Produktions- und Dienstleistungsprozessen. Sie sind charakterisiert durch die Akkumulation und Formalisierung von Wissen um dem Anwender des Systems einen kompetenten Rat zu geben. In der Biomedizin sind Expertensysteme noch nicht etabliert. Einige Forschungssysteme sind entwickelt und implementiert worden, wie z.B. ARIADNE, in dem Proteinkonformationen aus Primärsequenzen abgeleitet werden.

Durch die Simulationsalgorithmen einer datenbankgestützten Rekonstruktion biologischer Organismen, einer "virtuellen Biologie'' können die Einzelinformationen der Quelldatenbanken mithilfe logischer Inferenzmethoden in Zusammenhang bringen und, basierend auf allgemeinen, grundlegenden Prozessmodellen, ein interaktives, animiertes Modell einer Zelle oder eines Organismus erzeugen. Solche Modelle integrieren numerische und symbolische, genetische, biochemische, physiologische und physikalische Informationen und können in mehrerlei Hinsicht von Nutzen sein. Auf diese Weise kann die Information aus den bestehenden heterogenen, autonomen Datenbanken der Molekularbiologie bestmöglichst integriert werden, da Querbezüge zwischen verwandten Daten zum Tragen kommen und nicht allein statische Informationen abgefragt, sondern darüber hinaus auch die dynamische Interaktion der beteiligten Systeme sichtbar gemacht werden kann.

Dadurch ergeben sich folgende Vorteile:

  1. Der Anwender wird auf die Lücken seines Modells aufmerksam gemacht. Dies ist hilfreich, um die Vollständigkeit eines biologischen Modells aus mehreren tausend Einzelinformationen zu prüfen. Um dennoch ein Simulationsmodell lauffähig zu bekommen, können die fehlenden Informationen durch Schätzungen oder analoge Werte aus anderen Systemen ersetzt werden.
  2. Existiert eine ablauffähige Simulation, so kann durch Auswahl und Kontrolle bestimmter bekannter Parameter die Stimmigkeit des Modells geprüft werden. Treten unerwartete Werte auf, so kann dies auf falsche oder inkonsistente Annahmen im ursprünglichen Modell zurückzuführen sein oder aber ein neues, bisher nicht bekanntes biologisches Verhalten beschreiben. Durch Modifikation des Simulationsmodells kann der erste Fall untersucht werden. Sollte das unerwartete Phänomen in der Simulation bestehen bleiben, gibt dies einen Hinweis zur Planung von aussagekräftigen Laborexperimente.
  3. Mit einem relativ abgesicherten Modell können Vorhersagen und theoretische Experimente durchgeführt werden, z.B. der Effekt eines spezifischen Transkriptionsinhibitors auf den übrigen Metabolismus einer Zelle. Das simulierte Verhalten kann so Hinweise etwa auf pharmazeutisch interessante Stoffwechsel-Pfade oder Möglichkeiten der Stoffwechsel-Regulation geben, die im weiteren dann im Labor empirisch untersucht werden können. Die Vorauswahl möglicher Zusammenhänge in der Simulation kann die Anzahl der zu untersuchenden Systeme sinnvoll einschränken und liefert potentiell damit auch ökonomischen Nutzen.
Seite 19 von 26