zum Directory-modus

Tutorial MenueProteinfaltungLerneinheit 2 von 4

Proteinfaltung

Proteinfaltungscode

Abb.1

Mit der Aufklärung der DNA-Struktur durch J. Watson und F. Crick wurde der genetische Code entschlüsselt. Seitdem wissen wir, dass in Pro- und Eukaryonten intrazelllär mit zwei Sprachen kommuniziert wird. Um die eine Sprache in die andere übersetzen zu können, ist u.a. ein Bote (die mRNA) notwendig. Die in der DNA verschlüsselt gespeicherte Information ist in Kombinationen von vier verschiedenen Buchstaben (Basen) - nämlich A, T, G, und C - enthalten. Der Bote, die mRNA, verwendet ebenfalls A, G, C und anstelle von T den Buchstaben U (Uracil). Polypeptide und Proteine dagegen bestehen maximal aus 22 verschiedenen Aminosäuren (inklusive Selenocystein (SeC) und Pyrrolysin (Pyl)). Drei Buchstaben der einen Sprache (ein Codon) entsprechen einem der anderen, z.B. AUG → M (Met) oder anders ausgedrückt, das Start-Codon wird in die erste Aminosäure der Polypeptidkette übersetzt. Eine Art Satzzeichen (Stop-Codon) sorgt dafür, dass das Ablesen der Information an der richtigen Stelle beendet wird.

Organismen können aus der in insgesamt 64 Codons gespeicherten Information eine umfassende Bauanleitung für die Struktur und Funktion von Polypeptiden in jeder Zelle bereithalten und diese wird an ihre Nachkommen weitergegeben. Für die meisten Proteine genügt diese eindimensionale Information (die Primärstruktur), um sich auf eine ganz bestimmte Art und Weise zu einer dreidimensionalen Struktur (Tertiärstruktur) zusammenzufalten. Der Proteinfaltungscode ist jedoch bis heute noch nicht vollständig verstanden und beschäftigt schon Generationen von Wissenschaftlern.

Abb.2

Faltungsweg eines Polypeptides - Vom ungefalteten zum nativen, funktionell aktiven, Zustand

Vom Gen zum Proteindesign

Durch das Humangenom-Projekt wurden schätzungsweise Gene 20.000-25.000 entschlüsselt. Über viele der Genexpressionsprodukte - wie Proteine - ist in vielen Fällen so gut wie nichts bekannt. Wenn wir in der Lage wären, aus der Aminosäure-Sequenz die dreidimensionale Struktur vorherzusagen, würde uns das sehr viel weiterbringen. Nicht nur, um die Funktion und Wirkungsmechanismus von neu entdeckten Proteinen verstehen zu lernen, sondern auch, um die Arbeitsweise bekannter Proteine aufzuklären. Darüber hinaus eröffnete sich die Möglichkeit, neue, für bestimmte Aufgaben maßgeschneiderte Proteine - quasi auf dem Reißbrett - zu entwerfen. Ebenso würde sich ein weites Feld für das rationelle Design von Pharmaka eröffnen, von denen die meisten durch Aktivierung oder Blockierung von Proteinen ihre Wirksamkeit entfalten. Die experimentelle Bestimmung von Proteinstrukturen (durch Röntgenkristallographie oder NMR-Spektroskopie) ist eine sehr zeit- und kostenaufwendige Technik. Sie kann in keiner Weise Schritt halten mit dem atemberaubenden Tempo, in dem neue Proteinsequenzen ermittelt werden. Umso mehr besteht die Notwendigkeit, durch Computersimulationen den Faltungsvorgang einer bestimmten Polypeptidkette möglichst genau zu beschreiben und die entsprechende Proteinstruktur vorherzusagen.

Literatur

International Human Genome Sequencing Consortium, . (2004): . In: Nature. 431 , 931-945
Titel des Artikels
Abstract
The sequence of the human genome encodes the genetic instructions for human physiology, as well as rich information about human evolution. In 2001, the International Human Genome Sequencing Consortium reported a draft sequence of the euchromatic portion of the human genome. Since then, the international collaboration has worked to convert this draft into a genome sequence with high accuracy and nearly complete coverage. Here, we report the result of this finishing process. The current genome sequence (Build 35) contains 2.85 billion nucleotides interrupted by only 341 gaps. It covers approximately 99% of the euchromatic genome and is accurate to an error rate of approximately 1 event per 100,000 bases. Many of the remaining euchromatic gaps are associated with segmental duplications and will require focused work with new methods. The near-complete sequence, the first for a vertebrate, greatly improves the precision of biological analyses of the human genome including studies of gene number, birth and death. Notably, the human genome seems to encode only 20,000-25,000 protein-coding genes. The genome sequence reported here should serve as a firm foundation for biomedical research in the decades ahead.
<Seite 1 von 15