Foto von Mahmoud Sulaiman auf Unsplash / Montage

Unkategorisiert

9. August 2023

Maschinelle Objekterkennung – Damit Kriegsverbrechen in der Datenflut nicht untergehen

Die Dokumentation bewaffneter Konflikte stellt nicht zuletzt aufgrund der enormen Menge an zu analysierenden Daten eine erhebliche Herausforderung dar. Wie Algorithmen die Dokumentation und Analyse von Konflikten unterstützen können, zeigt das Projekt Syrian Archive.

Bewaffnete Konflikte werden nicht nur auf der Straße militärisch ausgetragen. In gleicher Weise findet ein Kampf um Bilder und Informationen statt. Insbesondere Desinformationen, die bewusst von einer Partei verbreitet werden, stellen eine immense Herausforderung dar, wenn es darum geht über einen Konflikt zu berichten. Durch die gewachsene Bedeutung sozialer Medien ist nicht nur die Dokumentation, sondern auch die Fälschung zum Beispiel von Bildern und Videos sehr viel einfacher geworden. Eine unvollständige oder gar verfälschte Dokumentation von bewaffneten Konflikten erschwert so nicht nur die aktuelle Berichterstattung. Ebenso ist es für die Strafverfolgung nach einem Krieg elementar, dass gut dokumentierte und verifizierte Beweismaterialien über potenzielle Kriegsverbrechen vorliegen, um die Schuldigen zur Rechenschaft zu ziehen.

Umfang des Datenmaterials als eine große Herausforderung bei der Dokumentation bewaffneter Konflikte

Die große Herausforderung bei der Dokumentation bewaffneter Konflikte stellt der gigantische Umfang des Datenmaterials dar, welches ausgewertet werden muss. Dieser Aufgabe stellt sich das 2014 gegründete Projekt Syrian Archive der NGO Mnemonic. Mnemonic zählt inzwischen über 20 Mitarbeiter:innen und wird unter anderem von der Open Society Foundation und Spenden unterstützt. Das Ziel des Projekts ist es, Beweise zu Menschenrechtsverletzungen im Bürgerkrieg in Syrien zu sammeln und zu verifizieren, um dabei zu helfen, Kriegsverbrechen aufzuklären.

Besonders interessant ist die methodische Vorgehensweise des Projekts, mit der die enorme Menge an Beweismaterial aus dem Syrischen Bürgerkrieg gesammelt und verifiziert wird. Das Syrian Archive greift auf bestehende Open SourceOpen Source Ein Entwicklungsmodell, bei dem der Quellcode eines Programms öffentlich zugänglich ist. Jeder kann den Code einsehen, modifizieren und weiterverbreiten. Open Source kann die Transparenz von Forschungsfeldern wie der KI fördern. Software zurück und entwickelt auch selbst Softwarelösungen, die frei zur Verfügung gestellt werden. Zum Zwecke der Identifizierung und Aufarbeitung der Daten geht das Projekt in fünf Schritten vor (siehe Abbildung 1).

Abbildung 1: Schrittweises Vorgehen beim Projekt Syrian Archive

*Quelle: https://syrianarchive.org/en/about/methods-tools (Download: 20.7.2023)*

In einem ersten Schritt wurde eine Datenbank aufgebaut, in der das Material gesammelt wird. Es wurden insgesamt 5000 Quellen identifiziert und als vertrauenswürdig eingeschätzt. Diese umfassen einzelne Journalist:innen, Kriegsreporter:innen, größere Verlagshäuser, Menschenrechtsorganisationen oder auch lokale Krankenhäuser. Das Syrian Archive erhält die Daten entweder direkt, d. h. als PDF-, Video- oder Foto-Datei zugeschickt, oder lädt diese von verschiedenen sozialen Plattformen wie Twitter, YouTube, Facebook oder Telegram herunter. Die Glaubwürdigkeit von Quellen wird von der Organisation selbst und ausgewählten Expert:innen wie Journalist:innen oder Mitarbeiter:innen von Menschenrechtsorganisationen sowohl in als auch außerhalb von Syrien bestimmt.

Um die gesammelten Daten vor versehentlicher oder vorsätzlicher Veränderung zu schützen, müssen sie in einem zweiten Schritt konserviert werden. Zudem besteht die Gefahr, dass beispielsweise Videomaterial auf sozialen Plattformen wieder entfernt wird. Um sicherzustellen, dass dieses Beweismaterial nicht verschwindet und glaubwürdig bleibt, werden die Daten auf externen Servern gespeichert. Außerdem werden die Daten mit einem Zeitstempel und einem sogenannten Hashwert versehen, wodurch diese eine Art Fingerabdruck bekommen, der nachträgliche Veränderungen verhindert.

Mit Objekterkennungsalgorithmen Streumunition erkennen

Der Umfang an Daten, den das Projekt gesammelt hat, ist immens. Insgesamt sind bis Mai 2023 1,7 Millionen Tweets und über 330.000 Youtube-Videos archiviert worden. Um den enormen zeitlichen Aufwand einer rein manuellen Auswertung der Daten zu vermeiden, setzt das Projekt gezielt maschinelles LernenMachine Learning Ein Teilbereich der KI, bei dem Systeme aus Daten lernen und sich verbessern, ohne explizit programmiert zu werden. ein. Zu diesem Zweck greift das Syrian Archive auf die Software VFRAME zurück, die explizit für Objekterkennung in Konfliktgebieten entwickelt wurde und eng mit dem Projekt kollaboriert. Mithilfe von Objekterkennungsalgorithmen kann beispielsweise in einem dritten Schritt Streumunition automatisch erkannt werden. Konkret bedeutet das, dass Videodateien zunächst in verschiedene einzelne Schlüsselbilder – sogenannte Keyframes – zerlegt werden. Diese Keyframes werden dann mit verschiedenen Objekterkennungsalgorithmen analysiert, um beispielsweise Streumunition automatisch zu erkennen (siehe Abbildung 2).

Als eine große Herausforderung für die Entwickler:innen der Software VFRAME stellte sich das Training der Objekterkennungsalgorithmen heraus, damit diese überhaupt Streumunition erkennen können. Da die Entwickler:innen der Software nicht über genügend Bilder von Streumunition verfügt haben, um das Modell zu trainieren, mussten sie kreativ werden. Mittels eines 3D-Druckers haben sie schließlich Streumunitionsmodelle fertigen lassen und diese auf verschiedenen Untergründen in vielen Perspektiven fotografiert, um einen ausreichenden Datenfundus für das Training der Objekterkennungsalgorithmen aufzubauen. Trotz des Aufwands sind die Vorteile des Einsatzes von Objekterkennungsalgorithmen zur Datenanalyse immens. So leisten diese eine Vorsortierung, die es dem Projekt überhaupt erst ermöglicht, die riesigen Datenmengen zu analysieren.

Abbildung 2: Objekterkennungsalgorithmen zum automatischen Erkennen von Streumunition

*Quelle: https://vframe.io/3d-rendered-data/*

Verifikation und Aufbereitung des Datenmaterials

Nachdem die Datenverarbeitung erfolgt ist, werden im vierten Schritt die Daten verifiziert. Die Verifizierung erfolgt wiederum in drei Schritten und kann gut am Beispiel von Videodateien veranschaulicht werden. Zuerst wird die Quelle der Datei verifiziert, indem diese mit der Liste an über 5000 Quellen abgeglichen, die im Rahmen der Datensammlung als glaubwürdig bestimmt wurden. Im zweiten Schritt wird der Aufnahmeort des Videos über den Abgleich von visuellen Referenzen in den Videos wie Bergen oder Baumketten mit Satellitenbildern, beispielsweise von Google Maps, bestimmt. Anschließend werden im dritten Schritt aus den Metadaten der Videodateien Informationen über das Datum – sofern vorhanden – extrahiert. Diese Informationen werden wiederum im fünften und letzten Schritt des Projekts Syrian Archive mit offiziellen Berichten von lokalen oder internationalen Medien, wie auch Reports von Menschenrechtsorganisationen manuell abgeglichen.

Alle Ergebnisse sind frei zugänglich in einem Archiv auf der Website des Projekts aufbereitet. In einigen Fällen unternimmt das Syrian Archive auch größere Fallstudien. Ein bekanntes Beispiel ist die Dokumentation Giftgas Angriff auf die Stadt Ghouta am 21. August 2013. Außerdem wurden Dossiers wie zum Beispiel zu russischen Luftangriffen angelegt.

In den vergangenen Jahren ist das Syrian Archive stetig gewachsen. Das dokumentierte Material steht auch dem Internationalen Strafgerichtshof in Den Haag zur Verfügung, welcher in 2016 das erste Mal einen Haftbefehl ausschließlich auf Basis von Informationen in sozialen Medien erlassen hat. Das verdeutlicht wiederum die große Bedeutung des Zugangs zu verlässlichen Informationen sowohl in der Berichterstattung über bewaffnete Konflikte als auch in der Strafverfolgung. Es zeigt sich auch, dass Algorithmen eine wichtige unterstützende Rolle bei der Datenanalyse einnehmen können und dadurch oft erst ermöglichen, dass die riesige Menge an Bild- oder Fotomaterial analysiert werden kann. Nicht zuletzt zeigt sich der Erfolg des Projekts auch darin, dass mittlerweile drei weitere Archive zur Dokumentation von möglichen Kriegsverbrechen im Sudan, im Jemen und in der Ukraine existieren.

Dieser Text ist lizenziert unter einer  Creative Commons Namensnennung 4.0 International Lizenz.

(68)

Teilen

Digitalisierung und Gemeinwohl

Dr. Felix Sieker

Schlagworte

Kommentar schreiben

Antwort abbrechen

Weitere Beiträge dieses/dieser Autor:in

Politische Entscheider:innen

Podiumsdiskussion KI-Spitzentalente für den Staat gewinnen – Was Deutschland von Großbritannien lernen kann

Welche Bedingungen braucht der Staat, um KI-Spitzentalente zu gewinnen und zu halten? Eine von uns organisierte Podiumsdiskussion in Berlin hat gezeigt, dass sich dafür wichtige Lehren aus Großbritannien ziehen lassen.

Autor:in

Dr. Felix Sieker

9. April 2026

Politische Entscheider:innen

Jakub Koźniewski, Warsaw - CC BY 4.0, https://creativecommons.org/licenses/by/4.0/legalcode.en

Publikation

Aufbau von Europas Public-AI-Stack

In einem neuen Policy-Brief zeigen wir, warum Europas Abhängigkeit im Bereich KI-Infrastruktur ein wachsendes Risiko für strategische Autonomie und demokratische Kontrolle darstellt – und wie ein PublicAIAnsatz KI zu offener, missionsorientierter öffentlicher digitaler Infrastruktur machen kann, die dem Gemeinwohl dient.

Autor:in

Dr. Felix Sieker

23. Februar 2026

Politische Entscheider:innen

Publikation

Wie Interoperabilität digitale Souveränität und fairen Wettbewerb in Europa stärkt

In einer neuen Studie zeigen wir auf, warum sektorübergreifende Interoperabilität für digitale Souveränität und bessere Zusammenarbeit im digitalen Raum von zentraler Bedeutung ist und wie der Weg dahin gelingen kann.

Autor:in

Dr. Felix Sieker

11. Dezember 2025

Abonnieren Sie unseren Newsletter

Bleiben Sie auf dem Laufenden! Tragen Sie Ihre E-Mail Adresse ein und klicken Sie auf abonnieren.

„Erlesenes“ ist ein zweiwöchentlicher Newsletter von reframe[Tech] und bietet eine kuratierte Auswahl an wissenschaftlichen Studien, journalistischen Artikeln und Debattenbeiträgen sowie Fundstücken mit Augenzwinkern aus sozialen Medien zum Themenkomplex Algorithmen und KI. Abonnieren Sie hier unseren monatlichen Projektnewsletter. Gerne informieren wir Sie per E-Mail über aktuelle Projektaktivitäten und Neuigkeiten im Blog „reframe[Tech].

Unsere Themen:

Maschinelle Objekterkennung – Damit Kriegsverbrechen in der Datenflut nicht untergehen

Umfang des Datenmaterials als eine große Herausforderung bei der Dokumentation bewaffneter Konflikte

Mit Objekterkennungsalgorithmen Streumunition erkennen

Verifikation und Aufbereitung des Datenmaterials

Teilen

Schlagworte

Kommentar schreiben

Antwort abbrechen

Weitere Beiträge dieses/dieser Autor:in

Podiumsdiskussion KI-Spitzentalente für den Staat gewinnen – Was Deutschland von Großbritannien lernen kann

Aufbau von Europas Public-AI-Stack

Wie Interoperabilität digitale Souveränität und fairen Wettbewerb in Europa stärkt

Abonnieren Sie unseren Newsletter

Unser Team

Social Media