Illustration KI und DNA im Zusammenspiel
Bildrechte: Magdalena Gonciarz mit Hilfe von KI (DALL-E)

Wissen-News KI-Sprachmodell mit DNA gefüttert: Forschung aus Dresden soll Genomik und Medizin voranbringen

07. August 2024, 11:23 Uhr

Forschungsergebnisse aus Dresden könnten das zukünftige Entschlüsseln von DNA erleichtern. Ein Team der Technischen Universität hat ein Sprachmodell nicht mit Wörtern, sondern mit DNA-Code angelernt. Für Genomik und Medizin könnte das ganz neue Möglichkeiten eröffnen.

"DNA ist der Code des Lebens. Warum sollte man sie nicht wie eine Sprache behandeln?" Das fragte sich Anna Poetsch vom biotechnologischen Zentrum (BIOTEC) der TU Dresden. Also hat sie mit ihrer Forschungsgruppe ein großes Sprachmodell (Large Language Model) mit DNA-Daten gefüttert, auf dass die KI dabei helfe, die verborgenen Bedeutungen der DNA zu entschlüsseln.

"DNA hat viele Funktionen, die über die Protein-Kodierung hinausgehen", erklärt Anna Poetsch. "Einige Sequenzen regulieren Gene, andere dienen strukturellen Zwecken, die meisten Sequenzen erfüllen mehrere Funktionen gleichzeitig. Derzeit verstehen wir die Bedeutung des größten Teils der DNA nicht. Für die Bereiche außerhalb von Genen scheinen wir erst an der Oberfläche gekratzt zu haben. Hier können KI und Large Language Models helfen."

Die Gruppe zeigte in ihrer veröffentlichten Studie, dass ihr "GROVER" genanntes Werkzeug nicht nur auf eine vorherige Sequenz folgende DNA-Sequenzen präzise vorhersagen kann, sondern auch verwendet werden kann, um Informationen biologischer Bedeutung aus Kontext zu extrahieren. So kann man zum Beispiel den Start von Genen oder Proteinbindungsstellen auf der DNA identifizieren. GROVER lerne auch Prozesse, die allgemein als "epigenetisch" gelten, also solche, die auf der DNA stattfinden und bisher nicht als kodiert betrachtet werden.

Um GROVER zu trainieren, musste das Team zunächst ein DNA-Wörterbuch erstellen. Die Dresdner verwendeten einen Trick aus Kompressionsalgorithmen. "Dieser Schritt ist entscheidend und unterscheidet unser DNA-Sprachmodell von früheren Versuchen", sagt Anna Poetsch. "Wir glauben, dass das Verständnis der Regeln der DNA durch ein Sprachmodell uns helfen wird, die Tiefen der biologischen Bedeutung aufzudecken, die in der DNA verborgen ist. Das sollte sowohl die Genomik als auch die personalisierte Medizin voranbringen."

Links/Studien

Die Studie "DNA language model GROVER learns sequence context in the human genome" ist im Fachjournal "Nature Machine Intelligence" erschienen.

(rr/idw)

Wissen

Katharina Adick und Dr. Eckart von Hirschhausen 30 min
Bildrechte: MDR/RBB

Dieses Thema im Programm: MDR SACHSEN - Das Sachsenradio | 02. August 2024 | 08:03 Uhr

404 Not Found

Not Found

The requested URL /api/v1/talk/includes/html/9a9e38cf-7f92-42bb-afed-1bc27fbcb22e was not found on this server.

Mehr zum Thema