Bioinformatik

Unsere modernen bioinformatischen Methoden helfen, genetische Veränderungen präzise zu identifizieren, krankheitsrelevante Signalwege aufzudecken und personalisierte Therapieansätze zu entwickeln. Besonders bei seltenen Erkrankungen, bei denen klassische Diagnostik oft an ihre Grenzen stößt, eröffnet die Multi-Omics-Analyse – also der kombinierten Auswertung von Genom-, Transkriptom-, Proteom- und Metabolom-Daten – neue Möglichkeiten, schneller und gezielter zu einer Diagnose zu gelangen – und damit betroffenen Kindern und ihren Familien frühzeitig Unterstützung zu bieten.


Genetik seltener Erkrankungen
Unser Forschungsschwerpunkt ist die Analyse von Sequenzierdaten von Patienten, die an seltenen Erkrankungen wie entzündlichen Darmerkrankungen oder schwerer kongenitaler Neutropenie leiden. Für diesen Zweck haben wir eine zuverlässige Analyse-Pipeline auf dem neuesten Stand der Technik entwickelt, um die von unseren Hochdurchsatz-Sequenziermaschinen erzeugten Daten zu verarbeiten.
Vor der Bestimmung der genomischen Variation in den Sequenzdaten der Patienten führen wir eine gründliche Qualitätskontrolle durch, die nicht nur eine hohe Qualität der zugrunde liegenden Sequenzierung, sondern auch die Konsistenz der Metadaten über die Patienten sichert. Dabei verwenden wir die Sequenzierdaten, um die Verwandtschaft eines Patienten zu anderen Familienmitgliedern zu bestätigen, sowie seine Blutgruppe und ethnische Herkunft mit den vorliegenden Informationen abzugleichen. Dadurch können wir jeden identifizierten Widerspruch nutzen, um Probenverwechslungen frühzeitig aufzudecken und aufzulösen.
Um krankheitsverursachende genomische Varianten zu erkennen, haben wir einen umfangreichen Prozess implementiert, der weit über die reguläre Standardanalyse hinausgeht. Im Gegensatz zur separaten Analyse einzelner Patienten erhöhen wir die Genauigkeit der Variantenerkennung durch die gemeinsame Analyse aller Patienten in der Forschungskohorte. Mittels einer komplexen Filtermethode entfernen wir nicht-pathogene populationsspezifische Varianten vor der Erstellung von Listen von potentiell pathogenen Varianten. Durch den Einsatz unserers Tools SmartPhase wird die Auswertung dieser Kandidatenliste zusätzlich vereinfacht.
Wir haben den Fokus auf Mutationen einzelner Basen durch das Screening auf Deletionen ganzer Exome erweitert und entwickeln zusätzliche Routinen zur Identifizierung komplexer struktureller Varianten. Ebenso haben wir den Suchraum für pathogene Varianten erweitert, indem wir auch Varianten in 5' UTR Regionen analysieren, die Upstream-Open-Reading Frames erzeugen oder die Stopcodons bestehender Upstream-Open-Reading Frames stören. Wir untersuchen außerdem synergistische Effekte mehrerer Varianten im selben Patienten, indem wir Multi-Nukleotid-Varianten in unsere Analyse integrieren und eine Methode basierend auf künstlicher Intelligenz entwickeln, um komplexe krankheitsverursachende Variantenmuster zu identifizieren.


Im Kubus betreiben wir ein dediziertes Linux-basiertes Netzwerk mit zwei Proxmox-Clustern, in denen zahlreiche virtuelle Maschinen und Container untergebracht sind. Unsere Hochleistungsserver, die mit Nvidia A6000 GPUs ausgestattet sind, bieten die notwendige Rechenleistung für fortschrittliche Bioinformatik-Workflows. Mit einer Speicherkapazität von 1 PB auf der Grundlage von TrueNAS SCALE und Proxmox, die auf ZFS basieren, und Netzwerkverbindungen von bis zu 40 Gbit/s ist diese Infrastruktur speziell darauf ausgelegt, zeiteffiziente Genom- und Ganzgenomanalysen zu ermöglichen und so die rechnergestützte Forschung in großem Maßstab zu unterstützen.
Unsere Rechenumgebung ist für bioinformatische Pipelines optimiert und nutzt Snakemake, Singularity, Docker und graphenbasierte Workflows, um Analysen zu rationalisieren und zu automatisieren. Die Infrastruktur ist auf Skalierbarkeit und Flexibilität ausgelegt, so dass Forscher maßgeschneiderte Umgebungen effizient einsetzen können.
In Großhadern unterhalten wir einen großen Proxmox-Cluster mit Hochleistungsservern und zusätzlichem 2PB ZFS-basiertem Speicher. Um die Integrität der Daten und die Wiederherstellung im Notfall zu gewährleisten, unterhalten wir ein strukturiertes Backup-System mit regelmäßigen Offsite-Backups im LRZ. Die Kombination aus Hochgeschwindigkeitsnetzwerken, redundanten Speicherlösungen und einem modularen Software-Stack gewährleistet eine zuverlässige und skalierbare Rechenleistung für verschiedene Forschungsprojekte.
KNIME4NGS
Wir stellen ein Set von Werkzeugen vor, die eingebettet in der KNIME Workflow Management Platform Analysen von NGS Daten erleichtern.
Hastreiter, M., Jeske, T., Hoser, J., Kluge, M., Ahomaa, K., Friedl, M. S., ... & Küffner, R. (2017). KNIME4NGS: a comprehensive toolbox for next generation sequencing analysis. Bioinformatics, 33(10), 1565-1567.
Link zum Artikel: https://academic.oup.com/bioinformatics/article/33/10/1565/2871246
Link zur Website: http://ibisngs.github.io/knime4ngs/index.html
DEUS
Wir beschreiben die Implementierung und Anwendung eines R Pakets, das auf die Analyse von kurzen nicht-kodierenden RNS Sequenzen zugeschnitten ist und einige Vorteile im Vergleich zu vorherschenden Anlaysemethoden hat.
Jeske, T., Huypens, P., Stirm, L., Höckele, S., Wurmser, C. M., Böhm, A., ... & Hastreiter, M. (2019). DEUS: an R package for accurate small RNA profiling based on differential expression of unique sequences. Bioinformatics.
Link zum Artikel: https://academic.oup.com/bioinformatics/advance-article/doi/10.1093/bioinformatics/btz495/5522007
Link zur Website: http://ibis.helmholtz-muenchen.de/deus
SmartPhase
Wir stellen ein modulares Java-basiertes Tool vor, welches das gezielte Phasen von heterozygoten Variantenpaaren in der personalisierten Medizin ermöglicht.
Hager, P., Mewes, H.-W., Rohlfs, M., Klein, C. & Jeske, T. (2019). SmartPhase: accurate and fast phasing of potentially compound heterozygous variant pairs for genetic diagnosis of rare diseases. Submitted.
Link zur Website: http://ibis.helmholtz-muenchen.de/smartphase/