Involvierte Personen: P. Dittrich, S. Hoffmann, M. Hölzer, M. Marz

[Could not find the bibliography file(s) Es wird angenommen, dass die Daten folgende Eigenschaften besitzen (vgl. Projekt 5 für ein prototypisches Beispiel solcher Daten): Wir gehen von einer Menge von Messungen aus, die zu unterschiedlichen Zeitpunkten oder an verschiedenen Orten erhoben wurden. Eine Messung besteht dabei aus einem Populationsvektor und einem Vektor von Umweltparametern. Der hochdimensionale Populationsvektor beschreibt qualitativ oder quantitativ die Präsenz von Spezies, genetischer Marker, oder epigenetischer Faktoren. In der Praxis können das mehrere Tausend sein, in der Theorie auch unendlich viele. Für das Lernen eines Modells nehmen wir an, dass die Dimensionen (Spezies) wechselwirken und sich gegenseitig bedingen. Ferner wird angenommen, dass die Umweltparameter diese Spezies und ihre Interaktionen beeinflussen, umgekehrt aber die Umweltparameter nicht von den Spezies beeinflusst werden. Schließlich berücksichtigen wir Domänenwissen, das in Form bekannter Wechselwirkungsbeziehungen zwischen Spezies(gruppen) und bekannter Abhängigkeiten der Spezies von Umweltfaktoren vorliegt. Ziel der Modellierung ist es, die Populationsstruktur zu erklären und ihre Abhängigkeit von den Umweltparametern zu bestimmen.

Es sollen durch Kombination der Theorie chemischer Organisationen [?] und der genetischen Programmierung [?] neue Methoden entwickelt und angewendet werden, die für eine gegebene Menge hochdimensionaler Daten und der Integration von Domänenwissen ein hierarchisches Open-Box-Modell lernen können. Open-Box heißt, dass im Gegensatz zu Neuronalen Netzen die Modellstruktur die Struktur des modellierten Systems widerspiegeln soll, um damit nachvollziehbarer und erklärungsmächtiger zu sein.