Wissen News IPK Gatersleben: Neue KI kann Genregulationscode in Pflanzen entschlüsseln
Hauptinhalt
30. April 2024, 11:01 Uhr
Ein Team des IPK Gatersleben hat Deep-Learning-Modelle entwickelt, mit denen sich der regulatorische Effekt von Gensequenzvariationen vorhersagen lässt. Das ist wichtig für das prinzipielle Verständnis der Genregulation.
Mit der Sequenzierungstechnologie ist es heute möglich, jährlich Tausende neue Pflanzengenome zu entschlüsseln. Forscherinnen und Forscher verbinden diese genomischen Informationen mit Daten zu verschiedenen Pflanzenmerkmalen. Ziel ist es, Korrelationen zwischen genetischen Varianten und Pflanzenmerkmalen wie der Anzahl der Samen, der Resistenz gegen Pilzbefall, der Fruchtfarbe oder dem Geschmack zu ermitteln. Bisher fehlt allerdings das umfassende Verständnis dafür, wie genetische Variation die Genaktivität auf molekularer Ebene beeinflusst. Dies schränkt die Möglichkeiten ein, "intelligente Nutzpflanzen" mit verbesserter Qualität und geringeren negativen Auswirkungen auf die Umwelt zu züchten.
KI vergleichbar mit derjenigen, die im Bereich des Computersehens eingesetzt wird
Forschern des IPK Leibniz-Instituts und des Forschungszentrums Jülich ist jetzt ein Durchbruch bei der Bewältigung dieser Herausforderung gelungen. Unter der Leitung von Jedrzej Jakub Szymanski trainierte das internationale Forscherteam interpretierbare "Deep-Learning"-Modelle, eine Untergruppe von KI-Algorithmen, mit einem riesigen Datensatz von genomischen Informationen aus verschiedenen Pflanzenarten. "Diese Modelle waren nicht nur in der Lage, die Genaktivität anhand von Sequenzen genau vorherzusagen, sondern auch festzustellen, welche Sequenzteile diese Vorhersagen ermöglichen", erklärt der Leiter der IPK-Arbeitsgruppe "Netzwerkanalyse und Modellierung". Die von den Forschern angewandte KI-Technologie ist vergleichbar mit derjenigen, die im Bereich des Computersehens eingesetzt wird, wo es darum geht, Gesichtszüge in Bildern zu erkennen und auf Emotionen zu schließen.
Im Gegensatz zu früheren Ansätzen, die auf statistischer Anreicherung beruhen, entwickelten die Forscher hier ein mathematisches Modell, das anhand von genomischen Sequenzmerkmalen die mRNA-Kopienzahl voraussagen kann. Das Modell berücksichtigt die Struktur des Genmodells und die Sequenzhomologie, also die Genevolution. "Wir waren wirklich erstaunt über die Effektivität. Innerhalb weniger Tage Training haben wir viele bekannte regulatorische Sequenzen wiederentdeckt und festgestellt, dass etwa 50 Prozent der identifizierten Sequenzmerkmale völlig neu waren. Die Modelle ließen sich sogar hervorragend auf Pflanzenarten anwenden, für die sie nicht trainiert wurden. Das macht sie für die Analyse neu sequenzierter Genome so wertvoll", so Szymanski.
Links/Studien
Die Studie "Deep learning the cis-regulatory code for gene expression in selected model plants" ist im Journal Nature erschienen und kann hier nachgelesen werden.
cdi/pm
Dieses Thema im Programm: MDR AKTUELL | MDR Aktuell | 19. März 2024 | 17:47 Uhr
Not Found
The requested URL /api/v1/talk/includes/html/e6825a9d-919c-421a-9b76-aec68a1bfb17 was not found on this server.