Primärdaten

Daten, die bei einer Datenerhebung unmittelbar gewonnen werden

Primärdaten, auch Rohdaten oder Urdaten, sind diejenigen Daten, die bei einer Beobachtung, einer Messung oder einer Datenerhebung unmittelbar gewonnen werden und die noch unbearbeitet vorliegen. Im Gegensatz dazu stehen die abgeleiteten Sekundärdaten (prozessierte Daten), die bei der Rohdatenverarbeitung aus den Primärdaten gewonnen werden.[1][2][3][4]

Primärdaten bei physikalischen Messungen nennt man Messdaten oder Messwerte.

Gelegentlich unterscheidet man Primärdaten und Rohdaten wie folgt: Rohdaten sind alle Daten, die bei einer Beobachtung, einer Messung oder einer Datenerhebung erhoben werden; Primärdaten sind die Daten, die als Teilmenge der Rohdaten zur Forschung herangezogen werden.[5]

Primärdaten liegen in dem Format vor, in dem sie bei der ursprünglichen Beobachtung, Messung oder Datenerhebung aufgezeichnet werden. Es kann sich um eine Aufzeichnung auf Papier oder um ein elektronisch erzeugtes Rohdatenformat handeln, das als Datei, Bild, Datensatz in einer Datenbank oder in einem anderen digitalen Format gespeichert wird. Primärdaten werden bei der Aufzeichnung häufig um Metadaten ergänzt. Die Metadaten enthalten wesentliche Informationen zu Merkmalen der Primärdaten und sind somit Bestandteil der Primärdaten.

BeispieleBearbeiten

Ausmessung eines Zimmers ergibt die Länge 5 m, die Breite 4 m sowie die Höhe 2,80 m. Diese drei Werte sind die Primärdaten. Aus ihnen lassen sich durch Berechnung die Sekundärdaten Fläche mit 20 m2 sowie Rauminhalt mit 56 m3 ableiten.

Ein Wissenschaftler misst im Labor den Druck eines Gases in einem abgeschlossenen Behälter bei unterschiedlichen Temperaturen. Primärdaten sind hier die Temperaturen und die gemessenen Drucke. Metadaten können Angabe des Messverfahrens, Zeitpunkt und Durchführender der Messung sein. Aus den primären Messwerten lassen sich naturwissenschaftliche Gesetzmäßigkeiten oder empirische Formeln zum Verhalten des Gases ableiten.

Ein Ärzteteam erhebt bei einer klinischen Studie Daten zur Wirkung eines Medikaments. Als Primärdaten fallen beispielsweise die Blutwerte der Probanden an. Auswertungen der Daten ermöglichen Aussagen zu Wirksamkeit und Sicherheit des Medikaments.

In der Digitalfotografie speichern Kameras häufig die von den Fotodioden des Bildsensors ausgelesenen Informationen im Rohdatenformat (RAW-Format). Somit liegen die primären Bilddaten unbearbeitet so vor wie sie der Sensor der Kamera erfasst hat.[6] Als Metadaten speichert die Kamera zusätzliche Informationen wie z. B. Aufnahmedatum oder Aufnahmeort (GPS-Koordinaten). Bei der Bildbearbeitung werden die Rohdaten in der Kamera oder extern an einem Rechner entwickelt (beispielsweise hinsichtlich des Farbraums oder des Dynamikumfangs) und vom Fotografen interpretiert. Speicherung der bearbeiteten Bilder erfolgt häufig in einem komprimierten Format wie JPG.

Ein Meinungsforschungsinstitut ermittelt im Rahmen einer Wählerbefragung die Beliebtheit von politischen Parteien. Als Primärdaten fallen hier Angaben zu den befragten Personen (Alter, Geschlecht etc.) und die Antworten der Personen an.  Auswertung und Interpretation der bei der Befragung anfallenden Primärdaten ermöglichen Prognosen zum möglichen Wahlergebnis.

SchwierigkeitenBearbeiten

Primärdaten sind ungeprüfte Daten. Sie können mit Fehlern (z. B. Messfehler) verschiedenster Art behaftet sein. Ungeprüfte Nutzung kann zu falschen Schlussfolgerungen führen. Kritik an Primärdaten kann sich nur auf die Erhebungsmethodik oder auf die Sorgfalt der Erhebung beziehen.

In manchen Fällen – insbesondere bei komplexen Messungen mit computergesteuerten Geräten – gestaltet sich eine klare Trennung zwischen Primär- und Sekundärdaten oft schwierig, da die Elektronik oder die Software der Geräte bereits eine Aufbereitung (Vorverarbeitung) der Primärdaten vornehmen kann.

Prüflabore im geregelten BereichBearbeiten

Prüflabore sichern in vielen Bereichen die Qualität von Produkten und unterliegen daher je nach Typ des Labors und der zu prüfenden Produkte unterschiedlichen Regelungen bzw. Qualitätsmanagementnormen wie GLP, GMP oder ISO 9001. Alle diese Regelungen verwenden ähnliche Definitionen für Rohdaten wie die Folgende: „Die GLP-Grundsätze definieren Rohdaten als alle ursprünglichen Laboraufzeichnungen und Unterlagen, einschließlich der Daten, die durch ein Geräteinterface direkt in einen Computer gelangen, die als Ergebnis der ursprünglichen Beobachtungen oder Tätigkeiten bei einer Prüfung anfallen und die zur Rekonstruktion und Bewertung des Abschlussberichts dieser Prüfung erforderlich sind“.[1]

Diese Definition zeigt, dass nicht nur die Daten, die bei einer Messung anfallen, sondern auch die Dokumentation der Tätigkeiten, die mit der Durchführung der Messung verbunden sind, Bestandteil der Rohdaten sind. Nur dann lässt sich die Messung rekonstruieren und die Auswertung der Daten nachprüfbar evaluieren.

EDV-Systeme, die in solchen Prüflaboren zur Erfassung, Verarbeitung, Speicherung und Archivierung von Rohdaten zum Einsatz kommen müssen validiert sein.[1][2][3] Für die Archivierung der Rohdaten gelten je nach Qualitätssicherungssystem unterschiedliche Aufbewahrungsfristen.[7]

Regelgerechte Dokumentation der bei den Prüfungen in einem Prüflabor angefallenen Rohdaten ermöglicht den Nachweis, dass ein Produkt den geforderten Qualitätsansprüchen entspricht und kann z. B. vor Schadenersatzforderungen schützen.

ForschungslaboreBearbeiten

Forschungslabore dokumentieren Planung, Durchführung und Auswertung von wissenschaftlichen Experimenten in Laborjournalen, wobei ähnliche Anforderungen wie bei Prüflaboren gelten. Somit können die Rohdaten später mit anderen Methoden oder von anderen Wissenschaftlern erneut ausgewertet werden.[8]

Von der akribischen Dokumentation der Experimente und der bei den Messungen angefallenen Rohdaten kann die Anerkennung einer Erfindung oder eines Patents abhängen. Die Anforderungen an die Dokumentation und die Aufbewahrungsfristen für Rohdaten hängen von der Art des Labors und dem Zweck der Forschung ab. Sollen Erfindungen patentiert werden, so gelten länderspezifische Patentgesetze.

FotografieBearbeiten

Die Raw-Datei enthält die ungefilterten Bilddaten als digitales Negativ wie der Kamerasensor sie erfasst hat. Das Foto kann aus der Raw-Datei jederzeit neu, unter anderen Gesichtspunkten entwickelt werden. Mit Hilfe der Raw-Datei kann ein Fotograf nachweisen, dass sein Foto nicht unzulässig retuschiert wurde.[6][9]

SozialwissenschaftenBearbeiten

Von Bedeutung wird die Unterscheidung zwischen Primär- und Sekundärdaten auch bei komplexeren Betrachtungen. So sind z. B. bei Messungen im sozialwissenschaftlichen Bereich die Primärdaten von den Sekundärdaten zu unterscheiden, weil die Erhebungsmethode (darunter z. B. die Art der Frage bei einer Meinungsumfrage) für die Aussagekraft der abgeleiteten Daten erheblich werden kann. Durch Anonymisierung der Primärdaten können (absichtlich) Datenelemente verlorengehen, die die Auswertungsmöglichkeiten beschränken. Die Anonymisierung ermöglicht auch die Wahrung des Persönlichkeitsschutzes von Interviewpartnern.

DatenbankenBearbeiten

Einige Datenbanksysteme bieten einen speziellen Datentyp Rohdaten (Raw, Long raw oder Raw binary data) zur Speicherung binärer Zeichenketten. Dieser Datentyp hat nichts mit den oben beschriebenen Primärdaten zu tun. Er ist heutzutage weitgehend durch die Binary Large Objects (BLOB) ersetzt.[10]

Siehe auchBearbeiten

EinzelnachweiseBearbeiten

  1. a b c Bundesministerium für Umwelt, Naturschutz und Reaktorsicherheit: Bekanntmachung eines Konsens-Dokuments der Bund-Länder-Arbeitsgruppe Gute Laborpraxis (GLP) zum Thema „Gute Laborpraxis (GLP) und Datenverarbeitung“. 28. Oktober 1996, abgerufen am 16. Juni 2020.
  2. a b CFR - Code of Federal Regulations Title 21 PART 58 Good Laboratory Practice For Nonclinical Laboratory Studies § 58.3 - Definitions. 1. April 2019, abgerufen am 16. Juni 2020.
  3. a b OECD-Grundsätze der Guten Laborpraxis. In: OECD Veröffentlichungen zur Umweltsicherheit und -hygiene (EHS). 1997, abgerufen am 16. Juni 2020.
  4. Stefan Luber, Nico Litzel: Was sind Rohdaten? In: BigData-Insider. Vogel IT-Medien, 9. April 2020, abgerufen am 16. Juni 2020.
  5. Michael Franke: Forschungsdatenmanagement. In: Fachhochschule für öffentliche Verwaltung und Rechtspflege in Bayern. Max Planck Digital Library, 2014, abgerufen am 28. Juni 2020.
  6. a b Digitale bildgebende Verfahren, Kapitel Lichtwandlung. In: Wikibooks. Abgerufen am 16. Juni 2020.
  7. Bernhard Appel, Christoph Hornberger, Jannis Batoulis, Konstantin Clevermann, Ralf Hössel, Dieter Weiser: Archivierung elektronischer Daten im GxP-Umfeld Teil 3: Umsetzung der Archivierung elektronischer Daten. In: Pharm. Ind. 73, Nr. 7, 1207–1215 (2011). 2011, abgerufen am 16. Juni 2020.
  8. Anke Schwarzer, Sandra Schwarzer: Das Laborjournal - Zur Dokumentation der Experimente und Ergebnisse. Institut für Anorganische Chemie der Technischen Universität Bergakademie Freiberg, 2011, abgerufen am 16. Juni 2020.
  9. Tim Aschermann: Was ist RAW? Einfach und verständlich erklärt. In: Chip Praxistipps. 7. September 2018, abgerufen am 16. Juni 2020.
  10. Database Concepts; Chapter 26: Oracle Data Types. Abgerufen am 16. Juni 2020.