Pandora & IsoMemo Initiativien zur Zusammenstellung und Modellierung von Big Historical Data
Ein solides Verständnis historischer Dynamiken im Rahmen eines Systemansatzes erfordert große Mengen unterschiedlicher Daten. Diese sollten als verknüpfte offene Daten strukturiert werden, damit die verschiedenen Systemkomponenten effizient miteinander verbunden werden können. Um dies zu erreichen, haben wir in Zusammenarbeit mit der Max Planck Computing and Data Facility und der Max-Planck-Bibliothek sowie ca. 60 internationalen Partnern die Datenplattform Pandora entwickelt. Pandora ist eine Basisinitiative, die die Schaffung von unabhängig verwalteten Datengemeinschaften und größeren kollaborativen Datennetzwerken fördert. Dazu gehört das IsoMemo-Netzwerk, das ca. 40 frei zugängliche Datenbanken verbindet, die Isotopendaten über die Umweltgeschichte der Erde und ihrer menschlichen Bewohner von der tiefen Vergangenheit bis zur Gegenwart sammeln. Die über Pandora gesammelten Daten werden verwendet, um historische Hypothesen zu testen und in datengesteuerten Ansätzen, die historische Muster zu erkennen suchen.
Wir entwickeln außerdem neue, auf R basierende, Modellierungswerkzeuge. Diese werden online über die Open-Source-Softwareplattform Pandora & IsoMemo zur Verfügung gestellt und sind darauf ausgelegt, typische Aspekte historischer Daten wie fehlende Daten, Datenunsicherheiten und die Abhängigkeit von Experteninformationen zu berücksichtigen. Wir verwenden eine Bayes'sche Modellierung von Proxydaten und Experteninputs, um hochauflösende Rekonstruktionen verschiedener Aspekte zu erstellen, die vergangene Mensch-Umwelt-Systeme charakterisierten. Techniken des maschinellen Lernens, wie Bayes'sche Netzwerke und nichtlineare Modellauswahlalgorithmen, werden zur Untersuchung historischer Kausalität eingesetzt. Wir entwickeln und/oder arbeiten mit an der Entwicklung von Modellen und Software, um verschiedene Aspekte komplexer Systeme zu untersuchen, wie z. B. die Untersuchung zyklischer menschlicher und ökologischer Phänomene, die Erkennung kritischer Übergänge und ihrer Warnzeichen, die Simulation aufkommender Phänomene unter Verwendung agentenbasierter Modelle und die Netzwerkanalyse.
Pandora & IsoMemo tragen ebenfalls zur direkten Datenerhebung bei, die jedoch meist von den Mitgliedern des Netzes durchgeführt wird. Es laufen mehrere Forschungsprojekte, bei denen neu entwickelte Modellierungswerkzeuge auf die gesammelten Datensätze angewendet werden. Dazu gehören Projekte zur Untersuchung der Ausbreitung von Völkern, Haustieren und Technologien auf kontinentaler Ebene, zur Ermittlung der Ursachen für das Aussterben von Arten und zur Untersuchung nicht erfolgreicher menschlicher Anpassungen an den Klimawandel.