Mit der Aufklärung der DNA-Struktur durch J. Watson und F. Crick wurde der genetische Code entschlüsselt. Seitdem wissen wir, dass in Pro- und Eukaryonten intrazelllär mit zwei Sprachen kommuniziert wird. Um die eine Sprache in die andere übersetzen zu können, ist u.a. ein Bote (die mRNA) notwendig. Die in der DNA verschlüsselt gespeicherte Information ist in Kombinationen von vier verschiedenen Buchstaben (Basen) - nämlich A, T, G, und C - enthalten. Der Bote, die mRNA, verwendet ebenfalls A, G, C und anstelle von T den Buchstaben U (Uracil). Polypeptide und Proteine dagegen bestehen maximal aus 22 verschiedenen Aminosäuren (inklusive Selenocystein (SeC) und Pyrrolysin (Pyl)). Drei Buchstaben der einen Sprache (ein Codon) entsprechen einem der anderen, z.B. AUG → M (Met) oder anders ausgedrückt, das Startcodon wird in die erste Aminosäure der Polypeptidkette übersetzt. Eine Art Satzzeichen (Stop-Codon) sorgt dafür, dass das Ablesen der Information an der richtigen Stelle beendet wird.
Organismen können aus der in insgesamt 64 Codons gespeicherten Information eine umfassende Bauanleitung für die Struktur und Funktion von Polypeptiden in jeder Zelle bereithalten und diese wird an ihre Nachkommen weitergegeben. Für die meisten Proteine genügt diese eindimensionale Information (die Primärstruktur), um sich auf eine ganz bestimmte Art und Weise zu einer dreidimensionalen Struktur (Tertiärstruktur) zusammenzufalten. Der Proteinfaltungscode ist jedoch bis heute noch nicht vollständig verstanden und beschäftigt schon Generationen von Wissenschaftlern.
Durch das Humangenom-Projekt wurden schätzungsweise Gene 20.000-25.000 entschlüsselt. Über viele der Genexpressionsprodukte - wie Proteine - ist in vielen Fällen so gut wie nichts bekannt. Wenn wir in der Lage wären, aus der Aminosäure-Sequenz die dreidimensionale Struktur vorherzusagen, würde uns das sehr viel weiterbringen. Nicht nur, um die Funktion und Wirkungsmechanismus von neu entdeckten Proteinen verstehen zu lernen, sondern auch, um die Arbeitsweise bekannter Proteine aufzuklären. Darüber hinaus eröffnete sich die Möglichkeit, neue, für bestimmte Aufgaben maßgeschneiderte Proteine - quasi auf dem Reißbrett - zu entwerfen. Ebenso würde sich ein weites Feld für das rationelle Design von Pharmaka eröffnen, von denen die meisten durch Aktivierung oder Blockierung von Proteinen ihre Wirksamkeit entfalten. Die experimentelle Bestimmung von Proteinstrukturen (durch Röntgenkristallographie oder NMR-Spektroskopie) ist eine sehr zeit- und kostenaufwendige Technik. Sie kann in keiner Weise Schritt halten mit dem atemberaubenden Tempo, in dem neue Proteinsequenzen ermittelt werden. Umso mehr besteht die Notwendigkeit, durch Computersimulationen den Faltungsvorgang einer bestimmten Polypeptidkette möglichst genau zu beschreiben und die entsprechende Proteinstruktur vorherzusagen.