Daten: Was gibt es im Umgang mit Citizen-Science-Daten zu beachten?

Citizen Science Projekte erheben häufig große Datensätze. Darunter fallen z. B. Monitoring-Projekte (Tagfalter-Monitoring), Crowdsourcing-Projekte (Artigo) und Beobachtungs-Projekte (Landschaft im Wandel). Wichtig ist es, vor Projektbeginn festzulegen, welche Daten erhoben werden dürfen, wer welche Rechte an den Daten haben soll und wie sie dauerhaft gesichert und zugänglich gemacht werden können. In all diesen Phasen bedarf es eines transparenten Daten-Managements und rechtssicheren Umgangs mit den gewonnenen Daten. Auch die dauerhafte Speicherung und Verwaltung sollte im Sinne der Verfügbarkeit und Nachvollziehbarkeit gestaltet werden. Dazu sind auch Metadaten (wie bspw. Zeitpunkt, Methode oder Ort der Datenerhebung) äußerst wichtig. Ohne diesen Kontext ist ein weiteres Arbeiten mit Daten oft unmöglich.

Rechtliche Hintergründe

Folgende Rechtsthemen gilt es in Verbindung von Citizen Science-Daten u. a. zu beachten: Urheberrechte (v. a. über Bilder/Fotos, Texte, Video und Audio), Panoramafreiheit, Datenbankrecht, Informationsfreiheitsgesetz, Bundes- und Landesdatenschutzgesetze mit Vorgaben zu personenbezogenen Daten (insbesondere das „Recht auf informationelle Selbstbestimmung“), Besonderheiten bezüglich Akteneinsicht (insbesondere bei der Weitergabe von Citizen Science-Daten an informationspflichtige Stellen), Störerhaftung (z. B. bei Forumsbeiträgen) sowie Anwendungen des Telemediengesetzes. Je nach Themenbereich können auch fachbezogene Gesetze relevant werden (z. B. Umweltinformationsgesetz oder Naturschutzgesetz). Des Weiteren sind ethische Fragen, wie z. B. die Erhebung von gesundheitsbezogenen Daten über die Teilnehmenden, zu überprüfen und ggf. in einer Ethikkommission zu erörtern.

Datenqualität

Datenqualität ist ein Maß für die Validität der Daten, wie sie die Realität abbilden, und auch, wie die die beabsichtigte Fragestellung beantworten können. Hier ist das Forschungsdesign, aufbauend auf einer konkret formulierten Forschungsfrage, äußerst wichtig. In der Praxis zeigt sich aber häufig, dass nicht jedes Citizen Science-Projekt mit einer dezidierten wissenschaftlichen Fragestellung beginnt oder die Daten (und/oder deren Qualität) als Ziel in den Mittelpunkt stellt. Vielfach stehen zu Beginn des Projektes andere Ziele, wie z. B. die Weiterbildung der Beteiligten, im Vordergrund. Um einen Mehrwert für die Wissenschaft zu gewährleisten, sollten Datenqualität und Datensicherung von vornherein bedacht werden.

Die Qualitätssicherung kann auf unterschiedliche Weisen gewährleistet werden. Man kann durch vorgeschaltete Methoden wie Schulungen, Anleitungen und weiteres Lehrmaterial die Datenqualität sicherstellen. Wichtig kann das Sicherstellen einer ausreichend großen Gruppe von Datenerfassern sein, um die angestrebte räumliche und zeitliche Auflösung zu erreichen. Eine technische Vorkehrung im Erfassungsdesign kann die Beschränkung der Eingabemasken auf bestimmte Datentypen (z. B. Datum, Ja/Nein, Zahl und Auswahllisten mit vorgegebenen Werten) in der Erfassungssoftware sein, um möglichst auf zu viel Freitext zu verzichten. Zeitnah als nachgeschaltete Kontrolle zur Eingabe sollte eine Konsistenzprüfung der Eingaben erfolgen und implausible oder eventuell fehlerhafte Daten direkt den Erfassern mitgeteilt werden, da die Kommunikation und das Feedback eine wichtige Rolle bei der Datenkorrektur spielen.

Die nachgeschaltete Qualitätssicherung wird häufig von Expertinnen und Experten durchgeführt, kann aber auch in Form einer gegenseitigen Überprüfung durch die Teilnehmenden und automatisierte Programme (z. B. Test auf statistische Ausreißer) unterstützt werden.

Verfügbarkeit und Zugänglichkeit von Daten

Die elektronische Speicherung von Daten in Datenbanken ist meist Voraussetzung für ihre weitere Nutzung. Die Sicherung und langfristige Speicherung von Daten stellt jedoch eine Herausforderung dar, da auch die Speichermedien einem stetigen Wandel unterzogen sind. Hilfreich kann die Anbindung an die IT-Infrastruktur größerer Organisationen sein, die Repositorien anbieten, um die Daten über längere Zeiträume zu speichern und verfügbar zu halten. Eine Übersicht über Repositorien von Forschungsdaten stellt beispielsweise www.re3data.org zur Verfügung.

Doch Verfügbarkeit bedeutet nicht automatisch, dass die Daten nutzbar sind. Sie müssen auch zugänglich sein, d. h. „gut dokumentiert und interpretierbar“. Denn nur durch die Nutzung anerkannter Metadaten-Standards können Daten in ihren diversen Strukturen und Formaten so beschrieben werden, dass sie langfristig zugänglich und somit nutzbar sind.

STORY: Transektkartierung für Tagfalter-Monitoring Deutschland

Um ausreichend Daten über die Bestandsentwicklung häufiger Tagfalter zu bekommen, sind Forschende auf die Hilfe vieler ehrenamtlicher Zähler angewiesen. Zum Glück sind Schmetterlinge wegen ihrer Schönheit sehr beliebt und viele Naturfreunde gerne bereit, sich mit ihnen zu befassen, um zu ihrem Schutz beizutragen. Das Spektrum der Bürgerforscher reicht vom Laien bis zum Insektenexperten, vom Schüler bis zum Rentner. „Spazierengehen im Dienste der Wissenschaft“ lautete der Aufruf, dem mittlerweile ca. 500 Menschen bundesweit folgen.

Um die Daten wissenschaftlich korrekt auswerten zu können, ist es wichtig, dass sie nach einem einheitlichen Standard erhoben werden. Dieser Standard kommt aus Großbritannien und den Niederlanden, wo Schmetterlinge schon seit den 70er- bzw. 90er-Jahren nach der sog. Linien-Transektkartierung gezählt werden. Jede und jeder Beteiligte bekommt eine ausführliche Zählanleitung und Hilfe bei der Einarbeitung in die Thematik. Die so erhobenen Daten werden mit denen aus weiteren europäischen Ländern verglichen.

www.tagfalter-monitoring.de

Tagfalter-Monitoring Deutschland (TMD)

Gehe spazieren und zähle dabei Tagfalter. Ziel des Projektes ist es, mehr über das Leben der Schmetterlinge in Deutschland zu erfahren.
mehr

Weiterführende Ressourcen

  • Datenthemen für Citizen Science im Biodiversitätsbereich: Wahl, J., Wiebe, A., Grescho, Krämer, R., Schwarz, J. & Wedekind, S. (2016). Lebendiger Atlas – Natur Deutschland: Workshop Dateninfrastruktur, Datenmanagement und Datenrecht am 10./11. März 2016 in Göttingen. Helmholtz-Zentrum für Umweltforschung – UFZ und Deutsches Zentrum für integrative Biodiversitätsforschung (iDiv) Halle-Jena-Leipzig, Leipzig. Online verfügbar unter www.ufz.de/lebendiger-atlas
  • Ergebnisse einer Umfrage in Europa zum Umgang mit Daten von Ehrenamtlichen: bookshop.europa.eu/en/survey-report-pbLBNA27920/
  • Informationen über das offene Lizenzmodell Creative Commons: www.creativecommons.org
  • Mehr Informationen zu Datenaspekten für Citizen Science: Richter, A., Mahla, A., Tochtermann, K., Scholz, W., Zedlitz, J., Wurbs, A., Vohland, K. & Bonn, A. (2015). GEWISS Dialogforum: Datenqualität, Datenmanagement und rechtliche Aspekte in Citizen Science. Bericht Nr. 6. Helmholtz-Zentrum für Umweltforschung – UFZ, Leipzig; Deutsches Zentrum für Integrative Biodiversitätsforschung (iDiv) Halle-Jena-Leipzig, Berlin-Brandenburgisches Institut für Biodiversitätsforschung (BBIB), Museum für Naturkunde (MfN) – Leibniz-Institut für Evolutions- und Biodiversitätsforschung, Berlin. Hier als pdf-Datei herunterladen.