Die Dokumentation bewaffneter Konflikte stellt nicht zuletzt aufgrund der enormen Menge an zu analysierenden Daten eine erhebliche Herausforderung dar. Wie Algorithmen die Dokumentation und Analyse von Konflikten unterstützen können, zeigt das Projekt Syrian Archive.

Bewaffnete Konflikte werden nicht nur auf der Straße militärisch ausgetragen. In gleicher Weise findet ein Kampf um Bilder und Informationen statt. Insbesondere Desinformationen, die bewusst von einer Partei verbreitet werden, stellen eine immense Herausforderung dar, wenn es darum geht über einen Konflikt zu berichten. Durch die gewachsene Bedeutung sozialer Medien ist nicht nur die Dokumentation, sondern auch die Fälschung zum Beispiel von Bildern und Videos sehr viel einfacher geworden. Eine unvollständige oder gar verfälschte Dokumentation von bewaffneten Konflikten erschwert so nicht nur die aktuelle Berichterstattung. Ebenso ist es für die Strafverfolgung nach einem Krieg elementar, dass gut dokumentierte und verifizierte Beweismaterialien über potenzielle Kriegsverbrechen vorliegen, um die Schuldigen zur Rechenschaft zu ziehen.

Umfang des Datenmaterials als eine große Herausforderung bei der Dokumentation bewaffneter Konflikte

Die große Herausforderung bei der Dokumentation bewaffneter Konflikte stellt der gigantische Umfang des Datenmaterials dar, welches ausgewertet werden muss. Dieser Aufgabe stellt sich das 2014 gegründete Projekt Syrian Archive der NGO Mnemonic. Mnemonic zählt inzwischen über 20 Mitarbeiter:innen und wird unter anderem von der Open Society Foundation und Spenden unterstützt. Das Ziel des Projekts ist es, Beweise zu Menschenrechtsverletzungen im Bürgerkrieg in Syrien zu sammeln und zu verifizieren, um dabei zu helfen, Kriegsverbrechen aufzuklären.

Besonders interessant ist die methodische Vorgehensweise des Projekts, mit der die enorme Menge an Beweismaterial aus dem Syrischen Bürgerkrieg gesammelt und verifiziert wird. Das Syrian Archive greift auf bestehende Open Source Software zurück und entwickelt auch selbst Softwarelösungen, die frei zur Verfügung gestellt werden. Zum Zwecke der Identifizierung und Aufarbeitung der Daten geht das Projekt in fünf Schritten vor (siehe Abbildung 1).

Abbildung 1: Schrittweises Vorgehen beim Projekt Syrian Archive

Quelle: https://syrianarchive.org/en/about/methods-tools (Download: 20.7.2023)

In einem ersten Schritt wurde eine Datenbank aufgebaut, in der das Material gesammelt wird. Es wurden insgesamt 5000 Quellen identifiziert und als vertrauenswürdig eingeschätzt. Diese umfassen einzelne Journalist:innen, Kriegsreporter:innen, größere Verlagshäuser, Menschenrechtsorganisationen oder auch lokale Krankenhäuser. Das Syrian Archive erhält die Daten entweder direkt, d. h. als PDF-, Video- oder Foto-Datei zugeschickt, oder lädt diese von verschiedenen sozialen Plattformen wie Twitter, YouTube, Facebook oder Telegram herunter. Die Glaubwürdigkeit von Quellen wird von der Organisation selbst und ausgewählten Expert:innen wie Journalist:innen oder Mitarbeiter:innen von Menschenrechtsorganisationen sowohl in als auch außerhalb von Syrien bestimmt.

Um die gesammelten Daten vor versehentlicher oder vorsätzlicher Veränderung zu schützen, müssen sie in einem zweiten Schritt konserviert werden. Zudem besteht die Gefahr, dass beispielsweise Videomaterial auf sozialen Plattformen wieder entfernt wird. Um sicherzustellen, dass dieses Beweismaterial nicht verschwindet und glaubwürdig bleibt, werden die Daten auf externen Servern gespeichert. Außerdem werden die Daten mit einem Zeitstempel und einem sogenannten Hashwert versehen, wodurch diese eine Art Fingerabdruck bekommen, der nachträgliche Veränderungen verhindert.

Mit Objekterkennungsalgorithmen Streumunition erkennen

Der Umfang an Daten, den das Projekt gesammelt hat, ist immens. Insgesamt sind bis Mai 2023 1,7 Millionen Tweets und über 330.000 Youtube-Videos archiviert worden. Um den enormen zeitlichen Aufwand einer rein manuellen Auswertung der Daten zu vermeiden, setzt das Projekt gezielt maschinelles Lernen ein. Zu diesem Zweck greift das Syrian Archive auf die Software VFRAME zurück, die explizit für Objekterkennung in Konfliktgebieten entwickelt wurde und eng mit dem Projekt kollaboriert. Mithilfe von Objekterkennungsalgorithmen kann beispielsweise in einem dritten Schritt Streumunition automatisch erkannt werden. Konkret bedeutet das, dass Videodateien zunächst in verschiedene einzelne Schlüsselbilder – sogenannte Keyframes – zerlegt werden. Diese Keyframes werden dann mit verschiedenen Objekterkennungsalgorithmen analysiert, um beispielsweise Streumunition automatisch zu erkennen (siehe Abbildung 2).

Als eine große Herausforderung für die Entwickler:innen der Software VFRAME stellte sich das Training der Objekterkennungsalgorithmen heraus, damit diese überhaupt Streumunition erkennen können. Da die Entwickler:innen der Software nicht über genügend Bilder von Streumunition verfügt haben, um das Modell zu trainieren, mussten sie kreativ werden. Mittels eines 3D-Druckers haben sie schließlich Streumunitionsmodelle fertigen lassen und diese auf verschiedenen Untergründen in vielen Perspektiven fotografiert, um einen ausreichenden Datenfundus für das Training der Objekterkennungsalgorithmen aufzubauen. Trotz des Aufwands sind die Vorteile des Einsatzes von Objekterkennungsalgorithmen zur Datenanalyse immens. So leisten diese eine Vorsortierung, die es dem Projekt überhaupt erst ermöglicht, die riesigen Datenmengen zu analysieren.

Abbildung 2: Objekterkennungsalgorithmen zum automatischen Erkennen von Streumunition

Quelle: https://vframe.io/3d-rendered-data/

Verifikation und Aufbereitung des Datenmaterials

Nachdem die Datenverarbeitung erfolgt ist, werden im vierten Schritt die Daten verifiziert. Die Verifizierung erfolgt wiederum in drei Schritten und kann gut am Beispiel von Videodateien veranschaulicht werden. Zuerst wird die Quelle der Datei verifiziert, indem diese mit der Liste an über 5000 Quellen abgeglichen, die im Rahmen der Datensammlung als glaubwürdig bestimmt wurden. Im zweiten Schritt wird der Aufnahmeort des Videos über den Abgleich von visuellen Referenzen in den Videos wie Bergen oder Baumketten mit Satellitenbildern, beispielsweise von Google Maps, bestimmt. Anschließend werden im dritten Schritt aus den Metadaten der Videodateien Informationen über das Datum – sofern vorhanden – extrahiert. Diese Informationen werden wiederum im fünften und letzten Schritt des Projekts Syrian Archive mit offiziellen Berichten von lokalen oder internationalen Medien, wie auch Reports von Menschenrechtsorganisationen manuell abgeglichen.

Alle Ergebnisse sind frei zugänglich in einem Archiv auf der Website des Projekts aufbereitet. In einigen Fällen unternimmt das Syrian Archive auch größere Fallstudien. Ein bekanntes Beispiel ist die Dokumentation Giftgas Angriff auf die Stadt Ghouta am 21. August 2013. Außerdem wurden Dossiers wie zum Beispiel zu russischen Luftangriffen angelegt.

In den vergangenen Jahren ist das Syrian Archive stetig gewachsen. Das dokumentierte Material steht auch dem Internationalen Strafgerichtshof in Den Haag zur Verfügung, welcher in 2016 das erste Mal einen Haftbefehl ausschließlich auf Basis von Informationen in sozialen Medien erlassen hat. Das verdeutlicht wiederum die große Bedeutung des Zugangs zu verlässlichen Informationen sowohl in der Berichterstattung über bewaffnete Konflikte als auch in der Strafverfolgung. Es zeigt sich auch, dass Algorithmen eine wichtige unterstützende Rolle bei der Datenanalyse einnehmen können und dadurch oft erst ermöglichen, dass die riesige Menge an Bild- oder Fotomaterial analysiert werden kann. Nicht zuletzt zeigt sich der Erfolg des Projekts auch darin, dass mittlerweile drei weitere Archive zur Dokumentation von möglichen Kriegsverbrechen im Sudan, im Jemen und in der Ukraine existieren.


Dieser Text ist lizenziert unter einer  Creative Commons Namensnennung 4.0 International Lizenz.