Die Forschungswelt der Zukunft ist digital. Die Digitalisierung der Wissenschaft schreitet immer schneller voran; allen voran seit den 1950er Jahren die Lebenswissenschaften und insbesondere die Bioinformatik. Genomik, Transkriptomik, Proteomik und Metabolomik sind ohne Bioinformatik nicht vorstellbar. Hier werden seit Jahren Exabytes von Daten durch Methoden der Mathematik und Informatik in biologische und medizinische Hypothesen umgewandelt. Dieser Fortschritt wurde in den letzten Jahren durch „Big Data“, „Open Data“ und „Deep Learning“ weiter intensiviert.
Der Verbund DigLeben hat es sich zum Ziel gesetzt, mit Hilfe der Informatik neue Methoden und Programme zu entwickeln, um die Digitalisierung der Lebenswissenschaften interdisziplinär weiter voranzutreiben. Betrachte man die gesamte Breite der möglichen Fragestellungen und Anwendungsbereiche, die potenziell durch maschinelles Lernen bearbeitet werden können, so wird klar, dass diese Entwicklung noch immer am Anfang steht. Seien es personalisierte Medizin und Diagnostik, Ökologie, Wirkstoffforschung und Pharmazie oder die „klassische“ Analyse von Sequenzdaten – die immensen Datenmenge, die in den Lebenswissenschaften generiert wird, scheint diesen Bereich bereits für „Big Data“ zu qualifizieren. Hier werden mehr Daten generiert als in der Astronomie, bei YouTube oder Twitter.
Daraus ergeben sich nicht nur klassischen Probleme großer Datenmengen (Speicherung und rasche Verfügbarkeit), auch die Integration verschiedener Datentypen (insbesondere auch Metadaten in den unterschiedlichsten Formaten) ist von zentralem Interesse. Auch müssen Analysemethoden damit umgehen können, dass die verwendeten Methoden fehlerhafte Daten produzieren können. Hier ist fundiertes Expertenwissen notwendig, um die tendenziellen Gefahren, die mit der Anwendung von maschinellem Lernen einhergehen können, sicher zu umgehen. Medizinische Anwendungen stellen dabei zusätzliche Anforderungen bezüglich Datenschutz und -sicherheit, während gleichzeitig eine Auswertung der Daten in Echtzeit, Leben retten kann.
Übergreifendes Ziel des Forschungsverbundes DigLeben ist es, durch Kombination von Bioinformatik und Maschinellem Lernen Wissenschaftler in den Lebenswissenschaften bei der Datenauswertung und der Generierung neuer Einsichten zu unterstützen. Die innovativen Anwendungen der entwickelten Methoden in unseren Projekten sind Beispiele und zugleich Meilensteine für die Zukunft der Digitalisierung der Lebenswissenschaften.