Forschen für die Ewigkeit
Bewertung und Archivierung von Forschungsdaten als neues Arbeitsgebiet für Hochschularchive

Angela Gastl-Hartmann


1. Einleitung

Universitätsarchive legen den Fokus der Überlieferungsbildung traditionell auf die Akten der Verwaltung. Die Forschung, neben der Lehre das wichtigste Handlungsfeld der Hochschulen, wird dadurch nahezu ausschliesslich mit Verwaltungsschriftgut wie Projekt- und Budgetanträge dokumentiert. Das wissenschaftliche und kulturelle Erbe ist aber viel reichhaltiger. Um die universitäre Forschungstätigkeit dauerhaft nachvollziehbar dokumentieren zu können, müssen deshalb auch die dabei entstandenen Daten – zumindest teilweise – überliefert werden.

Im Jahr 2013 konstatierte Klaus Nippert, dass die langfristige Sicherung von Forschungsdaten im Hinblick auf eine Nachnutzung zwar archivarische Kompetenzen voraussetzt, dass die Hochschularchive selbst bisher jedoch keine aktive Rolle einnehmen würden.1 Vielmehr seien es die Bibliotheken und Rechenzentren, welche die Kenntnisse und Infrastrukturen für das Forschungsdatenmanagement aufbauten. Er plädierte dafür, dass sich die Hochschularchive ein Arbeitsgebiet für Forschungsdaten schaffen, indem sie strategische Kooperationen eingehen und eine Politik der kleinen Schritte verfolgen. Die Erwartung an die Archive liegt darin, anhand klar formulierter Bewertungskriterien diejenigen Daten auszuwählen, die aufgrund ihrer Aussagekraft für die Geschichte der Institution oder ihrer Angehörigen würdig sind, langfristig archiviert zu werden.

Der Aufruf Nipperts ist der Ausgangspunkt für den vorliegenden Beitrag: Er geht der Frage nach, wie die Institutionen der Schweizer Archivlandschaft heute mit Forschungsdaten umgehen und zeigt auf, wie dieses Arbeitsgebiet durch schweizerische Hochschularchive gestaltet werden kann. Das Ziel sind praxisorientierte Handlungsempfehlungen für die Bewertung von und den Umgang mit Forschungsdaten.

Aufbau und Vorgehensweise

Diesem Beitrag liegt die durch das schweizerische Data Life-Cycle Management-Projekt formulierte Definition von Forschungsdaten zugrunde. Der Begriff beschränkt sich demnach nicht auf naturwissenschaftliche Messreihen, sondern umfasst alle Daten, die während eines Forschungsprojekts gesammelt, beobachtet oder erstellt wurden mit dem Ziel der Analyse und im Hinblick auf die Produktion neuartiger Forschungsresultate.2 Um Forschungsdaten archivarisch bewerten zu können, müssen ihre spezifischen Eigenschaften erkannt werden. Basierend auf Grundlagenliteratur geht das erste Kapitel deshalb auf den Lebenszyklus und den damit verbundenen Reifegrad von Daten ein und thematisiert die unterschiedlichen Medientypen, die Dateiformate, den Entstehungskontext und die Forschungsmethoden. Zur Kontextualisierung werden Ergebnisse zu Forschungsdaten-Umfragen an diversen Institutionen herangezogen. Ergänzend werden rechtliche und anderer Anforderungen hinsichtlich Datenmanagement und Datenpublikation dargelegt.

Im zweiten Kapitel folgt eine Auseinandersetzung mit dem an Schweizer Hochschulbibliotheken vorangetriebenen Aufbau von Infrastruktur und Dienstleistungen für die Verwaltung, Publikation und Aufbewahrung von Forschungsdaten. Hier interessiert vor allem die Frage, ob bzw. inwiefern die dabei entstehenden institutionellen, fachspezifischen oder auch national-orientierten Forschungsdatenrepositorien die Aufgabe der Forschungsdaten-Archivierung übernehmen.

Ab dem dritten Kapitel stehen die Universitätsarchive im Mittelpunkt. Deren heterogene Ausgangslage in Bezug auf die organisatorische Verortung, die regulatorischen Aufträge und die strategischen Ansätze wirkt sich auch auf den Umgang mit Forschungsdaten aus. Für diesen Beitrag wird ein Überblick über den aktuellen Stand hinsichtlich der Bewertungsrichtlinien für Forschungsdaten erarbeitet.

Im Kontext der Forschungsdatenrepositorien existieren Guidelines, die konkrete Selektionskriterien für die Datenübernahme anbieten. Die "Sieben Grundkriterien" zur Einschätzung des Archivwerts von Forschungsdaten, die 2010 das Digital Curation Centre veröffentlicht hat3, wurden in den letzten Jahren breit rezipiert und angewandt. In Kapitel vier wird dargelegt, inwiefern sie von gesetzlich verankerten Hochschularchiven angewendet werden können.

Abschliessend wird das von Nippert geforderte und für die meisten Schweizer Universitätsarchive neue Arbeitsgebiet Forschungsdaten von seiner praktischen Seite beleuchtet. Es werden Kooperationsszenarien skizziert, mit welchen es Hochschularchiven gelingen kann, die dazu notwendigen Voraussetzungen zu schaffen. Die Erkenntnisse werden im Schlusskapitel aggregiert und in Form von Handlungsempfehlungen aufbereitet. Ergänzend wird ein Frageraster zur Bewertung der Archivwürdigkeit angebotener Forschungsdaten präsentiert.

2. Forschungsdaten

2.1 Definition und Typologie

Das von swissuniversities geförderte Projekt DLCM (Data Life-Cycle Management) schlägt für den Begriff ‚Research Data‘ folgende Definition vor:

Research data is data that is collected, observed, or created, for purposes of analysis to produce original research results.4

In der vorliegenden Arbeit sind in Anlehnung daran unter 'Forschungsdaten im umfassenden Sinne' sämtliche Daten gemeint, die dem Forschungsprozess zugrunde liegen oder im Zuge des Forschungsprozesses entstehen. Gemeint sind explizit nicht nur Daten, die im Kontext der natur- oder sozialwissenschaftlichen Forschung generiert werden, sondern besonders auch analoge oder digitale Daten, auf denen geisteswissenschaftliche Forschung beruht. Wenn sich Aussagen in erster Linie auf Daten beziehen, die im natur- und sozialwissenschaftlichen Kontext entstehen und genutzt werden, wird von 'Forschungsdaten im engeren Sinne' (i.e.S.) oder einfach von Forschungsdaten gesprochen.

Nach Jens Ludwig ist eine Definition von Daten als Forschungsdaten immer abhängig von ihrem Entstehungs- oder Nutzungskontext.5 Auch der zeitliche Faktor spielt eine Rolle: Es gibt Daten, die ab ihrer Entstehung eindeutig als Forschungsdaten zu verstehen sind, und es gibt Daten, die diese Eigenschaft erst später erlangen.

Das umfassende Verständnis von Forschungsdaten eröffnet ein weites Feld. Konsequenter Weise und im Hinblick auf die derzeit entstehende Nationale Forschungsdateninfrastruktur in Deutschland argumentieren Archivare dafür, dass Archivgut inkl. Metadaten als Grundlage der historisch forschenden Disziplinen als Forschungsdaten zu betrachten sind.6 Denselben Ansatz verfolgt Ulrich Johannes Schneider, der in einem Aufruf an die Bibliotheken deren Kataloge zu Forschungsdaten der Digital Humanities erklärt.7

Während also davon auszugehen ist, dass gewissermassen alle Daten zu Forschungsdaten werden können, ist es für die Bewertung der Archivalienart Forschungsdaten wichtig, die jeweils spezifischen Eigenschaften der Daten zu erkennen. Diese lassen sich mit unterschiedlichen Modellen und Typologien beschreiben. Nachfolgend werden folgende drei Ansätze dargestellt:

Lebenszyklus und Reifegrad

Forschungsdaten entstehen typischerweise im Rahmen eines Forschungsprojekts. Ausgehend von der Forschungsfrage werden Daten zunächst erzeugt oder gesammelt, bevor sie analysiert und interpretiert werden und eine Synthese entsteht. Forschungsprojekte zielen in der Regel darauf ab, dass die Ergebnisse als Text publiziert werden. Die zugrundeliegenden Daten sollen für die Nachvollziehbarkeit und als Grundlage für weitere Forschung zur Verfügung stehen, womit sich der Lebenszyklus schliesst.8

Im 'Idealized Scientific Research Activity Lifecycle Model' werden nicht nur die einzelnen Etappen eines Forschungsprojekts beschrieben, sondern zusätzlich auch die entstehenden Daten in Bezug auf den Lebenszyklus kategorisiert.9 Die typischen Prozessschritte (Research, Publication, Administration) werden darin ergänzt durch 'Archive Activities', die die Dokumentation, Archivierung und Nachnutzung der Daten sicherstellen sollen. Die so entstehenden Forschungsdaten im umfassenden Sinne sind jedoch keineswegs statischer Natur, sondern durchlaufen einen Prozess mit unterschiedlichen Reifegraden:

  1. Raw Data / Rohdaten

  2. Processed Data / Prozessierte Daten

  3. Derived Data / Abgeleitete Daten

  4. Results Data / Ergebnisdaten

  5. Supplementary Data / Ergänzungsdaten [zu einem Artikel]

Die Veränderungen von Prozessschritt zu Prozessschritt können eine Umwandlung des Datenformats mit sich ziehen, und es kann zu einer drastischen Reduktion der Datenmenge kommen.10 Gemäss dem Modell sollen die Ergebnisdaten mehr umfassen als nur den bereinigten, letzten Stand einer Messreihe, nämlich auch Metadaten und Dokumentation; und die Archivierung soll gleichzeitig die analog oder digital vorliegenden Kontextdaten und -Informationen einbeziehen.11 Noch differenzierter wird dies in einer Studie des Jisc (Joint Information Systems Committee) von 2019 dargestellt: Wenn die Motivation zur Datenarchivierung in der Forschungsintegrität oder der Reproduzierbarkeit der Ergebnisse begründet ist, dann sollen die Rohdaten und Datenreihen archiviert werden. Wenn jedoch die Nachnutzung der Daten beabsichtigt wird, dann genüge es, die Ergebnisdaten aufzubewahren.12

Medientypen und Dateiformate

Für die Beurteilung der Archivierbarkeit von bestimmten Forschungsdaten ist es wichtig, den Medientyp und das spezifische Dateiformat der Daten zu kennen. Mehrere Umfragen (Österreich 13, Universität Lausanne14, Humboldt Universität in Berlin15) bestätigen, dass sich die in der Forschung meistgenutzten digitalen Medientypen nicht von denjenigen unterscheiden, die ein Hochschularchiv auch aus seinem angestammten Sprengel, der Universitätsadministration, zu erwarten hat: Texte, Bilder, Tabellen, strukturierter Text, Datenbanken und Videos werden ergänzt durch Medientypen wie Programme und Anwendungen sowie statistische Daten. Die bereits komplexe Vielfalt erhöht sich durch die spezifischen Dateiformate dieser Medientypen. Ludwig konstatiert, dass die Formate in einer "kaum sinnvoll wiederzugebenden" Vielzahl und Vielfalt existieren, und er stellt fest, dass es disziplinspezifische Unterschiede im Umgang mit dieser Formatvielfalt gibt.16

Die schweizerische Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen (KOST) pflegt einen Katalog archivischer Dateiformate.17 Dieser bietet Informationen zu verschiedenen Medientypen bzw. Formatkategorien und empfiehlt Dateiformate, die nach heutigem Stand eine langfristige Archivierung ermöglichen. Ein Abgleich mit den oben genannten, häufig verwendeten Medientypen zeigt, dass sich für praktisch jeden davon eine Empfehlung finden lässt.

Im Idealfall entspricht der de-facto-Standard einer Fachcommunity bereits einem archivtauglichen Format. In Forschungsbereichen mit viel Innovation können Formatanforderungen allerdings hinderlich sein.18 Auch ist zu bedenken, dass eine Umwandlung in ein Standard-Format die unmittelbare Wiederverwendung der Daten erschweren kann. Die Erwartungen derjenigen, die Forschungsdaten nachnutzen wollen, widersprechen potentiell den herkömmlichen Intentionen der Archive, sämtliche Daten in Standardformate zu wandeln.19 Es muss also unterschieden werden, ob Daten nur aufbewahrt oder ob sie fachmännisch archiviert werden.

Entstehungskontext und Methode

Auch wenn jede Fachrichtung eigene Forschungsmethoden einsetzt, können daraus identische Medientypen erzeugt werden. Die in den Naturwissenschaften typischerweise entstehenden Beobachtungs-, Experiment- und Simulationsdaten unterscheiden sich zwar kaum hinsichtlich der Kodierung und technischen Anforderungen, gross sind jedoch die Unterschiede bezüglich Aufbewahrungswürdigkeit und den dazu notwendigen Hintergrundinformationen.20 So können z.B. Beobachtungsdaten aus der Meteorologie nur im Moment erfasst und nicht wiederholt werden, sie sind unersetzbar und deshalb grundsätzlich aufbewahrungswürdig. Die den Kontext wiedergebenden Metadaten solcher Messreihen (geografische Position, Uhrzeit, Messinstrument etc.) sind essentiell für das Verständnis und die korrekte Verwendung der Daten. Analoges gilt für die Metadaten von Experimenten; ein Experiment soll jedoch wiederholt werden können. Die Komplexität erhöht sich mit dem stetigen Wandel der experimentellen Forschung: was und wie heute gemessen wird, kann bald schon überholt sein. Im Unterschied dazu sollen Modelle für Simulationsdaten aus sich selbst heraus reproduzierbar sein, und auch hier sind Kontextdaten zentral. Besteht das Modell aus mehreren, sich aufeinander beziehenden Dateien, darf keine Datei verändert (z.B. in ein anderes Datenformat migriert) werden.

Beobachtungsdaten in Form von Interviews und Umfragen erzeugen die Sozialwissenschaften.21 Sie sind Zeit- und Umfeld-gebunden und können daher nicht wiederholt werden. Bei den Forschungsdaten der Geisteswissenschaften spielt der Zeitfaktor eine wesentliche Rolle, handelt es sich doch bei diesen Daten um Inhalte, die ursprünglich in einem ganz anderen Kontext erstellt wurden. Ein Beispiel dafür ist digitales Archivgut aus der Verwaltung.

Dem Begriff ‘Big Data’ werden Datenvolumen, die in einem Forschungsprojekt entstehen, kaum gerecht.22 Beispielshaft zeigt eine Umfrage an der multidisziplinären Humboldt Universität, dass über 60% der Antwortenden jährlich eine Datenmenge von unter 100 GB erzeugen und nur 7% über 1 TB.23 Dies ist plausibel angesichts der Tatsache, dass der grösste Teil der Forschungsdaten Textdokumente sind.24

2.2 Passive Aufbewahrung und aktive Archivierung

Neben dem Begriff Forschungsdaten bedarf auch der Term Archivierung einer Klärung. Die Autoren der Konzeptstudie zur Entwicklung eines Modells für eine zentrale Langzeitarchivierung von digitalen Primär- und Sekundärdaten der Forschung für die Schweiz (2008) unterscheiden drei Grundformen im Umgang mit Daten25:

Ein Serviceangebot für Forschungsdaten, welches deren Nachnutzung zum Ziel hat, muss nicht zwingend Datenarchivierung betreiben, sondern kann sich auf die Datenaufbewahrung beschränken. Dabei werden die Daten in ihrem ursprünglichen Zustand belassen. Sollen die Daten hingegen archiviert werden, gehen die Anforderungen deutlich weiter.26 Sie müssen gegebenenfalls aufbereitet, metadatiert und die dauerhafte Verfügbarkeit muss sichergestellt werden. Die Daten müssen in ein archivtaugliches Format migriert werden, bevor der Upload in ein Repositorium möglich wird. Die dritte Servicekategorie, die 'Archivierung nach staatlichen Archivgesetzen', unterscheidet sich davon primär durch die zwingende Voraussetzung der Archivwürdigkeit der Daten.

Repositorien für Forschungsdaten, die unter den Gesichtspunkten des nestor Kriterienkatalogs27 als vertrauenswürdig eingestuft werden können, stellen sicher, dass die Authentizität und Integrität der digitalen Objekte für die Dauer der Vorhaltung gewahrt bleiben. Authentizität bedeutet in diesem Kontext, «dass das Objekt das darstellt, was es vorgibt darzustellen».28 Metadaten und Persistente Identifikatoren sind die zentralen Hilfsmittel, um das Objekt und seinen Entstehungskontext zu beschreiben.

Für Repositorien, die eine passive Aufbewahrung bieten, bedeutet Datenintegrität, dass die Daten gänzlich unverändert vorgehalten werden. Werden Forschungsdaten im Gegensatz dazu aktiv archiviert, verändern sie sich zwangsläufig im Laufe der Zeit. Die vollständige Datenintegrität kann dann nur für die zeitlichen Intervalle zwischen den Erhaltungsmassnahmen garantiert werden. Ein vertrauenswürdiges Archiv legt fest, welche Eigenschaften des digitalen Objekts durch Erhaltungsmassnahmen nicht tangiert werden dürfen.

2.3 Compliance

Im Unterschied zu traditionellem Archivgut eines Universitätsarchivs, wie z.B. Protokolle, können Forschungsdaten dem Urheberrecht unterstehen. Solange Forschungsdaten einen niederen Reifegrad aufweisen, gelten sie lediglich als Datenzusammenstellung und sind nicht urheberrechtlich geschützt. Diesen Schutz erlangen sie, wenn sie prozessiert sind oder als Ergebnis- oder Supplement-Daten aufbereitet vorliegen. Dann gelten sie als Werke geistiger Schöpfung mit individuellem Charakter. Konkret nennt das Schweizerische Urheberrechtsgesetz29 folgende hier relevanten Medientypen:

Solange Forschungsdaten nicht urheberrechtlich geschützt sind, sind sie Eigentum jener Institution, die die Forschung ermöglicht.30 Übernimmt ein Archiv oder eine Bibliothek urheberrechtlich geschützte Forschungsdaten, um sie in einem Repositorium vorzuhalten, muss der Urheber der Daten dem Betreiber des Repositoriums die Nutzungsrechte übertragen, z.B. über einen Schenkungsvertrag. Nur dann dürfen die Daten gemäss der Preservation-Strategie verändert und dem Publikum angeboten werden. Die Urheberrechte verbleiben beim Autor.31 Zu beachten ist schliesslich auch der Datenschutz.32 Der Forschende muss personenbezogene Daten vor der Publikation anonymisieren und sicherstellen, dass er keine anderen Rechte Dritter verletzt (z.B. bei Sponsoringverträge mit der Industrie).

Die Richtlinien der Forschungsinstitution in Bezug auf die Gute wissenschaftliche Praxis beeinflusst die Forschungsdatenarchivierung zusätzlich.33 Die Schweizerische Akademie der Wissenschaften gibt dazu den Rahmen vor. Sie hält fest:

Damit Forschung überprüft und Versuche reproduziert und Daten auch nach anderen Gesichtspunkten analysiert werden können, sind alle Daten (inkl. Rohdaten) vollständig, klar und genau zu dokumentieren. Daten und Materialien müssen in einer Weise aufbewahrt werden, welche Beschädigung, Verlust oder Manipulation ausschliesst. Dies gilt sowohl für handschriftliche wie auch für elektronische Daten. [...] Die Projektleitung ist dafür verantwortlich, dass Daten und Materialien nach Abschluss des Projektes während einer für das Fachgebiet adäquaten Dauer aufbewahrt bleiben. Sie hat für ihre Haltbarkeit und Sicherung zu sorgen.34

Gefordert wird somit die sichere Aufbewahrung der Daten für einen im spezifischen Fachgebiet angemessenen Zeitraum. Dies lässt Raum für unterschiedliche Lösungen z.B. für Beobachtungsdaten von dauerhaftem Wert oder für experimentelle Daten, die aufgrund der permanenten Weiterentwicklung der Methoden nur befristetet nachgenutzt werden können. Als Mindestmass hat sich die Frist von fünf Jahren etabliert. Die Verantwortung für die korrekte Aufbewahrung der Daten und Materialien obliegt dem Projektleiter. Jeder einzelne Forschende ist aber dazu angehalten, seine Daten klar und genau zu dokumentieren.

Mit dem Ziel, die Reproduzierbarkeit von Forschungsergebnissen sowie die Nachnutzung von Forschungsdaten sicherzustellen, hat der Schweizerische Nationalfonds (SNF) die Anforderungen an das Datenmanagement für geförderte Projekte erhöht. Seit 2017 müssen Antragssteller einen Datenmanagementplan (DMP) vorweisen, aus welchem ein bewusster Umgang mit den erzeugten oder wiederverwendeten Daten während und nach der Projektphase hervorgeht.35

Forschungsförderer und Hochschulen erwarten zunehmend, dass Forschende ihre Daten in einem Repositorium deponieren, das die sog. FAIR-Prinzipien garantieren kann: Die Daten sollen auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (re-usable) sein. Ähnliche Forderungen stellen zunehmend auch die Zeitschriftenverlage, um zum einen die sogenannten Supplement-Daten zu einem Artikel vorzuhalten, zum anderen aber auch, um die dem Artikel zugrunde liegenden Daten für die Nachvollziehbarkeit der Ergebnisse durch die Peer Reviewer bereit zu stellen.36

Zusätzlich zur Erwartung an Forschende, ihre Ergebnisse möglichst häufig in wissenschaftlichen Beiträgen zu publizieren, ist die Forderung erwachsen, die verwendeten und erzeugten Forschungsdaten unter Berücksichtigung rechtlicher und anderer Vorgaben zu verwalten, zu archivieren und zu publizieren. Klaus Nippert stellt im Hinblick auf die Entwicklung in Deutschland fest, dass es nicht die Universitätsarchive, sondern in erster Linie die Hochschulbibliotheken und Rechenzentren waren, die die Bedürfnisse der Forschenden aufgegriffen und entsprechende Infrastrukturen und Services aufgebaut haben.37 Die Frage, inwiefern dies auch für die Schweiz zutrifft, ist der Ausgangspunkt für das nachfolgende Kapitel.

3. Schweizer Hochschulbibliotheken und ihre Dienstleistungen für Forschungsdaten

Wie positionieren sich Hochschulbibliotheken bezüglich Forschungsdaten? Mit der folgenden Bestandsaufnahme wird ermittelt, wie Hochschulbibliotheken dem Thema Forschungsdaten als Aufbewahrungs- und Archivierungsobjekt begegnen, welche Strategien sie dabei verfolgen und wie sie die Forschenden in ihrer Arbeit unterstützen.

3.1 Hochschulbibliotheken und Kollaborationsprojekte

Eine Hochschulbibliothek zeichnet sich einerseits durch ihre organisatorische Zugehörigkeit zu einer Universität, Fachhochschule oder pädagogischen Hochschule aus und andererseits durch ihren Versorgungsauftrag mit wissenschaftlicher Literatur.38 Die Organisationsform der universitären Hochschulbibliotheken der Schweiz ist sehr heterogen. So gibt es einige Institutionen, die zusätzlich auch Kantons- oder Stadtbibliotheken sind und entsprechend auch einem Auftrag als öffentliche Bibliothek nachkommen. Nach Christian Oesterheld existieren in der Schweiz sogar «erstaunlich wenige Einrichtungen als reine Hochschulbibliotheken mit exklusivem Versorgungsauftrag für die Hochschule».39

Einige Hochschulbibliotheken führen eine Abteilung für Handschriften, in welcher nicht-gedrucktes, nicht-veröffentlichtes Material aufbewahrt wird, wie z.B. Nachlässe von bedeutenden Persönlichkeiten. Für verschiedenen Gattungen des kulturellen Erbes entstanden in den vergangenen Jahren mehrere Online-Portale, die durch die Konferenz der Universitätsbibliotheken der Schweiz und die Schweizerische Universitätskonferenz gefördert wurden.40

Zum Ende der Förderperiode 2013-2016 fand im Rahmen des Projekts AISOOP (Analyse der Informationsarchitektur, Schnittstellen und Organisation der Online-Plattformen) eine Evaluation dieser Online-Angebote statt, um herauszuarbeiten, «wie diese Plattformen in die zukünftige Forschungsdateninfrastruktur der Schweiz integriert werden können».41 Es zeigte sich, dass die Hochschulbibliotheken als Betreiber dieser Plattformen wohl die Forschenden als Zielgruppe anvisierten, aber bis dahin die angebotenen digitalen Objekte nicht als «Forschungsdaten im eigentlichen Sinn» 42 betrachtet hatten, obwohl die datengetriebene Forschung der Digital Humanities genau diese Inhalte als primäre Quellen und Rohdaten verwendet. Die Autoren der Studie empfahlen daraufhin,

Einige dieser Empfehlungen wurden im Rahmen der weiteren Förderung durch das P-5-Programm umgesetzt.44 Zudem engagierten sich einige Hochschulbibliotheken45 gemeinsam im Projekt Data Life-Cycle Management (DLCM) mit dem Fokus auf Forschungsdaten.

2018 stellte die Co-Leiterin des Förderprogramms jedoch fest, dass es dem DLCM-Projekt nicht gelungen sei, sich nachhaltig in die schweizweite Entwicklung im Bereich Forschungsdatenmanagement einzubringen, und dass das Projekt nicht auf die im Jahr 2017 kommunizierten Vorgaben des SNF hinsichtlich eines Datenmanagementplans vorbereitet war. Der Aufbau des nationalen Angebots für das Research Data Management rückte in der Folge trotz der Dringlichkeit vorerst in den Hintergrund, zugunsten eines jeweils lokalen, universitäts-internen Supports.46

Auch im Jahr 2020 existierte noch keine nationale Plattform für Forschungsdaten. Stattdessen sind institutionelle und fachspezifische Repositorien sowie disziplinspezifische Forschungsinfrastrukturen entstanden, die im nachfolgenden Abschnitt thematisiert werden.

3.2 Repositorien und Forschungsinfrastrukturen

Repositorien speichern, verwalten und präsentieren digitale Inhalte. Ein Repositorium ist in der Regel kein Langzeitarchivierungssystem, dazu fehlen ihm die entsprechenden Komponenten.47 Generische, meist institutionelle Repositorien einer Hochschule sind offen für sämtliche Forschungsdaten, während disziplinspezifische Angebote auf die besonderen Bedürfnisse einer Fachrichtung eingehen, z.B. in Bezug auf das Metadatenschema oder mit Schnittstellen zu üblichen Messinstrumenten.48 Das online-Verzeichnis für Forschungsdatenrepositorien re3data49 bietet Forschenden die Möglichkeit, das für sie passende Repositorium zu finden.

Im Jahr 2017 nahm die ETH-Bibliothek die Research Collection in Betrieb, die die Services Open Access-Dokumentenserver, Hochschulbibliographie und Forschungsdatenrepositorium in einer Applikation bündelt.50 ETH-Angehörige können neben ihren Forschungsergebnissen auch die Supplementdaten hochladen oder Forschungsdaten als eigenständige Einheiten über die Plattform publizieren. Bei den Forschungsdaten verbleibt die Hoheit über Zugriffsrechte und Aufbewahrungsfristen bei den Urhebern. Es werden archivfähige Formate empfohlen, doch diesbezügliche Vorschriften gibt es nicht. Die Langzeitarchivierung ist ebenfalls sichergestellt.51

Auch an der Universität Bern betreut ein Team der Bibliothek alle Dienstleistungen zum Themenkomplex 'Open Science'.52 Dazu gehören neben der Beratungsstelle zum Forschungsdatenmanagement und den Datenmanagementplänen auch mehrere Repositorien, darunter das Repositorium BerDA als Infrastruktur für die digitale Langzeitarchivierung.

Auch die Universität Genf will mit der Plattform YARETA Forschungsdaten öffentlich zugänglich machen.53 Technologisch orientiert sich YARETA am DLCM-Projekt (vgl. Kap. 3.1) und wird durch die Bibliothek betrieben. Es erfüllt die zentralen Anforderungen der Forschenden nach sofortiger Publikation, Compliance zu FAIR-Prinzipien, DOI-Registrierung, steuerbaren Zugriffsrechten, Freiheit hinsichtlich der Formate und Aufbewahrungsfristen. Auch eine Öffnung über die Kantonsgrenzen hinaus ist vorgesehen: Es ist geplant, im Rahmen des DLCM-Projekts und unter dem Namen OLOS mit derselben Technologie und Infrastruktur ein nationales Forschungsdatenrepositorium aufzubauen.54

Den Anspruch, das nationale Forschungsdatenrepositorium der Schweiz zu sein, erhebt auch das 2021 online gegangene Projekt SWISSUbase, das ebenfalls von swissuniversities unterstützt wird.55 Das Kooperationsprojekt zwischen den Universitäten Zürich und Lausanne, FORS (Schweizer Kompetenzzentrum für So­zial­wissenschaften) und Switch soll dieselben Bedürfnisse der Forschenden bedienen wie die Research Collection und YARETA. Es nutzt jedoch nicht das generische Metadaten-Schema von DataCite56, sondern disziplinspezifische Schemata.

Im Unterschied zu fachspezifischen Datenarchiven und Infrastrukturen überlassen die genannten Repositorien die Auswahl der Daten weitestgehend den Forschern selbst (im Rahmen der regulatorischen Vorgaben). Gemäss einer aktuellen Studie von Jisc entspricht dies dem üblichen Vorgehen:

In Higher Education Institutions researchers have the key role in final appraisal and selection decisions, aided by guidance and support that is available from the institutional research data service. This is an important distinction and difference from domain repositories where a curator has this final responsibility.57

Anzumerken ist, dass an keiner Schweizer Universität Fachpersonal des Archivs in die Entwicklung und Implementation solcher Repositorien involviert ist. Und mit Ausnahme der ETH Zürich ist es bislang nirgends angedacht, diese neuen Langzeitarchivierungssysteme für das digitale Verwaltungsschriftgut der Archive zu nutzen.58

4. Hochschularchive in der Schweiz

Das folgende Kapitel widmet sich zunächst der organisatorisch-rechtlichen Verankerung und der historischen Entwicklung der schweizerischen Hochschularchive. Im Anschluss wird konkret auf deren bisherigen Umgang mit dem Thema Forschungsdaten eingegangen.

4.1 Überblick und organisatorische Rahmenbedingungen

Anders als die traditionsreichen Handschriftenabteilungen der grossen Universitätsbibliotheken blicken die meisten Universitätsarchive auf eine kurze Geschichte zurück. An der ETH Zürich war das Archivierungsgesetz von 1998 ausschlaggebend für die Gründung des Hochschularchivs. An den meisten kantonal verankerten Universitäten, deren Unterlagen traditionell in den Staatsarchiven archiviert werden, sind erst in jüngerer Zeit selbständige Archive entstanden. An der Universität Bern bewertet ein wissenschaftlicher Archivar die angebotenen Unterlagen und bereitet sie für die Ablieferung ans Staatsarchiv auf – ein Modell, das sich in ähnlicher Weise auch an den Universitäten Basel, St. Gallen und Fribourg

Hochschule / Universität Grün­dungs­jahr Organisatorische Zugehörigkeit Selbständige Archivierung oder Archivierung im Staatsarchiv
EPF Lausanne -- -- --
ETH Zürich, Hochschularchiv 1999 ETH-Bibliothek Selbständige Archivierung
Universität Basel, Universitätsarchiv 2008 Generalsekretariat der Universität Archivierung im Staatsarchiv Basel Stadt
Universität Bern, Universitätsarchiv 2010 Generalsekretariat der Universität Archivierung im Staatsarchiv Bern
Université de Fribourg 2010 Direction administrative Archivierung im Staatsarchiv Fribourg
Université de Genève, Archives administratives et patrimoniales 1986 Division de l’information scientifique [Bibliothek] Selbständige Archivierung
Université de Lausanne, Archives historiques 2012 Service des ressources informationelles et archives (UNIRIS) / Generalsekretariat Selbständige Archivierung
Universität Luzern, Universitätsarchiv 2010 Generalsekretariat der Universität Selbständig seit 2019, zuvor Ablieferung ans Staatsarchiv
Université de Neuchâtel --- --- ---
Universität St. Gallen (HSG), Universitätsarchiv 2005 Generalsekretariat Archivierung im Staatsarchiv St. Gallen
Universität Zürich, UZH Archiv 1998 Generalsekretariat der Universität Selbständige Archivierung
Università della Svizzera Italiana --- --- ---

findet. Die EPF Lausanne, die Universität Neuenburg und die Università della Svizzera Italiana verfügen weder über ein eigenes Archiv noch über eine archivische Fachstelle in der Verwaltung:

Universitätsarchive sind mehrheitlich dem Generalsekretariat ihrer Hochschule angegliedert, da dort in der Vergangenheit am ehesten eine Registratur mit Zwischenarchiv geführt wurde. Zwar erfolgte in der Zwischenzeit eine Professionalisierung und Aufwertung der archivarischen Aufgaben, doch der Schwerpunkt in Bezug auf die Bestände, die Ressourcierung und das Selbstverständnis liegt bei diesen Archiven weiterhin bei den Verwaltungsabteilungen der Institution.59 Nur die Hochschularchive der ETH Zürich und der Universität Genf sind organisatorisch einer Bibliothek zugeordnet. Die ETH-Bibliothek hatte dies im Vorfeld der Einführung des Archivierungsgesetzes selber angestrebt und dazu seine reichen Bestände der Abteilung Handschriften und Nachlässe beigesteuert.60 Ausserhalb der Schweiz sind die Organisationsstrukturen vergleichbar heterogen. 61 Kaum belastbare Daten sind über die personelle Ausstattung der Institutionen verfügbar, jedoch bezeichnet Nippert zwei Vollzeitstellen für deutsche Hochschularchive bereits als «gute Mittelklasse»62, und es deutet vieles darauf hin, dass diese Grössenordnung auch für Schweizer Hochschularchive zutrifft.

4.2 Bisherige Erfahrungen mit Forschungsdaten

Im Rahmen der diesem Beitrag zugrundeliegenden Masterarbeit wurden die Leiterinnen und Leiter der Hochschularchive im Frühjahr 2020 zu Erfahrungen und Vorgehensweisen bei der Archivierung von Forschungsdaten befragt.63 Konkret wurden Aussagen zu folgenden Themenkomplexen erhoben:

  1. Forschungsdaten: Führt das Archiv analoge oder digitale Unterlagen, die dem eng gefassten Begriff «Forschungsdaten» zuzuordnen wären? Beispiele?

  1. Bewertungskriterien:Enthalten die Bewertungsrichtlinien oder anderen Vorgaben (z.B. des Staatsarchivs) explizite Angaben zur Archivwürdigkeit von Forschungsdaten?

An den Universitäten Basel, Bern, Fribourg, Genf, Lausanne, St. Gallen und Zürich werden bis anhin keine Forschungsdaten i.e.S. archiviert. Dies korreliert mit der organisatorischen Nähe zu den administrativen Stellen der jeweiligen Hochschule, in der Regel dem Generalsekretariat. Das Archivkonzept des ebenfalls im Generalsekretariat angesiedelten Archivs der Universität Luzern sieht explizit vor, dass keine Forschungsdaten übernommen werden, mit Ausnahme von wenigen ausgewählten Beständen. Die Universität Zürich arbeitet mit einem umfassenden Dokumentationsplan, welcher an Funktionskategorien (und nicht Provenienzen) ausgerichtet ist und die Kategorie 'Forschen' mit 'Forschungskonzepten', 'Forschungsdaten' und 'Forschungsergebnissen' einschliesst. Die Überlieferung der 'Forschungskonzepte' ist gesichert, und gleiches gilt für die 'Forschungsergebnisse', wobei das Archiv hier auf die Bibliotheken verweist. 'Forschungsdaten' wurden bislang nicht abgeliefert, und auch ein Bewertungskonzept ist noch nicht definiert.

Ähnliches zeigt sich an anderen Institutionen. In einem der befragten Fälle besteht zwar der gesetzliche Auftrag, die Tätigkeit der Universität im Archiv abzubilden, in der bisherigen Überlieferung sind aber die Kernaufgaben der Universität – Forschung und Lehre – kaum dokumentiert. Liegen Bewertungskonzepte der Archive vor, erfassen sie Forschungsdaten gar nicht oder nur am Rande. Eines der Archive folgt den Empfehlungen des durch deutsche Hochschularchivare erarbeiteten Dokumentationsprofils64 und leitet daraus ab, grundsätzlich keine Forschungsdaten zu archivieren.

Über Erfahrungen mit analogen Forschungsdatenbeständen verfügt das Hochschularchiv der ETH Zürich. Durch die Fusion mit der Handschriftensammlung der ETH-Bibliothek im Jahr 2000 gelangten diese in seine Obhut. 2010 erhielt die ETH-Bibliothek den Auftrag, Infrastruktur und Dienstleistungsportfolio für die langfristige Archivierung von Forschungsdaten aufzubauen.65 So verfügte die ETH Zürich vergleichsweise früh über ein digitales Langzeitarchivierungssystem, das neben Forschungsdaten auch für klassisches (genuin digitales) Archivgut verwendet wird.

Die Universität Bern schreibt ihren Forschenden eine fünfjährige Aufbewahrungsfrist für Forschungsdaten vor. Danach ist eine – nicht näher definierte – Auswahl der Daten in Absprache mit dem Universitäts- und dem Staatsarchiv für die dauerhafte Archivierung vorgesehen. In der Praxis wird dies sehr rigide gehandhabt, und nur Daten mit Bezug zum Kanton werden übernommen. Die Datenauswahl orientiert sich so am Sammlungsprofil des Staatsarchivs und wird dem Wirkungsfeld einer Universität kaum gerecht.

Die Universitätsarchive von Fribourg und Lausanne arbeiten mit der Methode des 'Calendriers de Conservation', die auf der Erfassung aller Dokumententypen einer Organisationseinheit und ihrer prospektiven Bewertung abzielt. Fribourg hat zwei Aufbewahrungskalender erarbeitet und durch das Staatsarchiv bestätigen lassen, Bewertungskriterien für Forschungsdaten sind jedoch nicht enthalten.66 In Lausanne stehen ebenfalls Verwaltungsunterlagen im Vordergrund, und die Verantwortung für die Aufbewahrung und den Entscheid über die spätere Vernichtung von Forschungsdaten wird den Forschungsleitern übertragen. Die entsprechende Direktive eröffnet aber auch die Möglichkeit, in Einzelfällen die dauerhafte Archivierung von Forschungsdaten anzuordnen.67

Zusammenfassend nehmen die Schweizer Hochschularchive nur in Ausnahmefällen eine aktive Rolle in der Überlieferung von Forschungsdaten ein. Einige Archive verfügen zwar über vereinzelte, analoge Bestände, diese sind jedoch nicht auf eine systematische Akquisitionspolitik zurückzuführen. Konsequenterweise existieren auch keine explizit ausformulierten Bewertungskriterien für Forschungsdaten.

5. Forschungsdaten für Hochschularchive

Wenn Forschungsdaten zum Arbeitsgebiet für Hochschularchive werden sollen, dann kann der Fokus – im Unterschied zu den Services der Hochschulbibliotheken – nicht primär auf den Bedürfnissen der Forschenden liegen. Vielmehr muss eine proaktive Überlieferungsbildung und eine Aufwertung der bereits vorhandenen Forschungsdaten stattfinden. Die nachfolgenden Kapitel bereiten dafür den Boden, indem die Archivwürdigkeit von Forschungsdaten und Ansätze für deren Bewertung erörtert und diskutiert werden.

5.1 Rahmenbedingung der Archivgesetze

Regulatorische Bestimmungen zur Archivierung bzw. zur Archivwürdigkeit finden sich sowohl auf eidgenössischer Ebene (für ETH Zürich und EPF Lausanne) als auch in den kantonalen Archivgesetzen.

Das Bundesgesetz über die Archivierung (BGA, Archivierungsgesetz)68 spricht ganz allgemein von «Unterlagen» und nennt keine spezifischen Dokumentenarten. Darunter fallen «alle aufgezeichneten Informationen, unabhängig vom Informationsträger, welche bei der Erfüllung öffentlicher Aufgaben des Bundes empfangen oder erstellt worden sind, sowie alle Hilfsmittel und ergänzenden Daten, die für das Verständnis dieser Informationen und deren Nutzung notwendig sind» (Art. 3). Diese Definition zielt zwar auf Verwaltungsvorgänge ab, schliesst aber Forschungsdaten zumindest nicht aus.

Das BGA gibt in zwei Abschnitten Anhaltspunkte zur Ermittlung der Archivwürdigkeit von Unterlagen:

Darauf aufbauend hebt das Archivreglement der ETH Zürich den historischen Wert von Unterlagen hervor:

Bleibenden Wert haben Unterlagen, denen historische Bedeutung zukommt oder die aufgrund von Rechts- und Verwaltungsvorschriften zur Sicherung berechtigter Belange der Bürger oder zur Bereitstellung von Informationen für Gesetzgebung, Verwaltung oder Rechtspflege dauernd aufzubewahren sind. (...).69

Die Bewertungspraxis der vergangenen Jahre ging vom Grundsatz aus, dass der gesetzliche Auftrag "Verwaltungsschriftgut sowie Unterlagen aus der Lehre einschliesst, nicht jedoch Forschungsdaten».70

Nun ist das BGA richtungsweisend für die kantonalen Gesetzgebungen, die wiederum für die Universitätsarchive relevant sind.71 Inwiefern dadurch Forschungsdaten als archivwürdig gelten können, wird im Folgenden exemplarisch für das Archiv der Universität Bern dargelegt. Hier wird im kantonalen Archivgesetz ebenfalls der Begriff «Unterlagen» verwendet72; und auch hier kann die grundsätzliche Archivwürdigkeit von Forschungsdaten mit dem Informationswert begründet werden:

[Die Unterlagen] werden nach ihrer Bedeutung und ihrem Informationsgehalt bewertet. Die Aufbewahrungsdauer richtet sich nach dieser Bewertung.73

In Bern entscheidet das Staatsarchiv «in Zusammenarbeit mit dem Universitätsarchiv und den jeweiligen Organisationseinheiten der Universität über die Archivwürdigkeit».74 Archivwürdig können Unterlagen aus «wissenschaftlichen, wirtschaftlichen, politischen oder kulturellen Gründen» sein.75 Wie auch an der ETH Zürich lässt das Berner Archivreglement eine Archivwürdigkeit von Forschungsdaten grundsätzlich zu.76 In der Praxis sehen sich Berner Forschende jedoch nicht in der Pflicht, ihre Daten dem Universitätsarchiv anzubieten. Vielmehr erachten Forschende ihre Forschungsdaten als persönliches Eigentum, und dies wird von den Institutionen mehr oder weniger toleriert. Diese Haltung wurde in der Umfrage auch durch andere Institutionen bestätigt.77

5.2 Bewertung von Forschungsdaten

Der in den Regularien verwendete Begriff des 'Informationswerts' der Unterlagen geht zurück auf die grundlegenden Theorien von Theodore Schellenberg (1903-1970) zur Bewertung von administrativen Unterlagen.78 Demnach besitzt Schriftgut bei der Erzeugung und Nutzung durch den Produzenten einen Primärwert; Schriftgut, das als archivwürdig qualifiziert werden kann, besitzt darüber hinaus einen Sekundärwert für die Forschung oder für andere Zwecke. Der Sekundärwert begründet sich entweder in einer grossen inhaltlichen Dichte oder Aussagekraft der Unterlagen (Informationswert) oder in seiner Fähigkeit, Hinweise über den Produzenten und seine Arbeitsweise zu liefern (Evidenzwert). Oft liegen beide Werte gleichzeitig vor. So dient beispielsweise das Dossier eines Stipendiengesuchs der Bearbeitung durch die entsprechenden administrativen Stellen (Primärwert), in zeitlicher Distanz wird es zu Archivgut, das aufgrund des Inhalts wissenschaftliche Analysen ermöglicht (Informationswert) und Untersuchungen zum Ablauf eines Antrags und zum Funktionieren der betroffenen Behörden zulässt (Evidenzwert). Auch im digitalen Zeitalter haben Schellenbergs theoretischen Ansätze zur Bewertung nichts von ihrer Gültigkeit verloren.79

Weil nur schon aus Ressourcengründen nicht alle Unterlagen eines Archivsprengels aufbewahrt werden können, muss eine Auswahl vorgenommen werden. Die archivarische Bewertung hat zum Ziel, diese Auswahl nicht dem Zufall zu überlassen.80 Zudem soll die Bewertung die Benutzung erleichtern, indem sie z.B. Mehrfachüberlieferungen vermeidet und die Masse an Akten reduziert.

Dokumentationsprofil für Archive wissenschaftlicher Hochschulen

Als Hilfestellung für die Einpassung von Bewertungsentscheiden in den jeweiligen Ressourcenrahmen haben die Autoren des Dokumentationsprofils für Archive wissenschaftlicher Hochschulen eine «strukturierte Übersicht möglicher Überlieferungsinhalte» vorgelegt81 und ihre Bewertungsempfehlungen in vier Kategorien eingeteilt:

Auch dieses Dokumentationsprofil befasst sich nur am Rande mit Forschungsdaten.82 Die Forschungsergebnisse in Form von Publikationen werden durch die Bibliotheken gesammelt, und deren Vorstufen erachten die Autoren nicht als archivwürdig (Kategorie 4), ausser sie lassen über die publizierten Ergebnisse hinaus wesentlichen Informationen erkennen.

Die Autoren des Dokumentationsprofils plädieren dafür, dass die Archivierung forschungsprojekt-bezogener Akten im Sinne einer «verlaufsorientierte[n] Dokumentation» zumindest geprüft wird. Um die Menge zu beschränken sollen jene Projekte berücksichtigt werden, die zu «herausragenden Erkenntnissen» führten, mit «hohen Auszeichnungen bedacht wurden oder die auf andere Weise aus der Masse herausstechen». Unbedingt archiviert werden sollen zudem «unpublizierte Projektanträge, -bewilligungen und -berichte», damit die Aktivitäten dokumentiert sind (Kategorie 1). Die Forschungsdaten selbst fallen in Kategorie 3. Ob im Zuge eines Projekts gewonnene Daten zu archivieren sind, sei im Einzelfall zu prüfen.83 Dafür ausschlaggebende Kriterien sind die «Relevanz des Inhalts», die «Art der Datenaggregation», aber auch die dem Archiv zur Verfügung stehenden Ressourcen.84 Für eine echte Überlieferungsbildung im Bereich Forschungsdaten bietet das Dokumentationsprofil wenig Anhaltspunkte.

How to Appraise & Select Research Data for Curation

Der 2010 vom Digital Curation Centre veröffentlichte Leitfaden «How to Appraise & Select Research Data for Curation zielt darauf ab, durch eine fundierte Auswahl der zu archivierenden Forschungsdaten die langfristigen Kosten der Bewahrung zu rechtfertigen.85 Er verbindet dabei die Bewertungskonzepte des Data Life-Cycle Managements mit demjenigen des Records Managements, womit die Autoren ihr Konzept zur Evaluation und Auswahl von Forschungsdaten klar in den Kontext archivarischer Bewertung rücken. Verdeutlicht wird dies mit dem der Studie vorangestellten Zitat von Carole Couture: «Appraisal is the noblest function, the central core of contemporary archival practice».

Die Autoren des Leitfadens betonen, dass die gesetzlichen oder reglementarischen Vorgaben sowie die vorhandenen Ressourcen die Rahmenbedingungen des Bewertungsprozesses vorgeben.86 Deshalb soll ein transparenter, nachvollziehbarer Bewertungsprozess mit klaren, unzweideutigen und objektiven Kriterien zur Anwendung kommen, und er soll ein begründbares Ergebnis und eine effektive Kostenschätzung hervorbringen können.

Der Leitfaden formuliert sieben Grundkriterien zur Beurteilung der Aufbewahrungswürdigkeit von Forschungsdaten:

  1. Relevance to Mission

  1. Scientific or Historical Value

  2. Uniqueness

  3. Potential for Redistribution

  4. Non-Replicability

  5. Economic Case

  6. Full Documentation

Die Jisc-Studie von 2019 bestätigt die Relevanz dieser Kriterien. Sie hält fest, dass in der Community ein breiter Konsens über deren Nützlichkeit besteht.87 In Anlehnung an diese Einschätzung und unter Berücksichtigung der Tatsache, dass die sieben Grundkriterien auf archivwissenschaftlichen Grundlagen beruhen und einen ausreichend hohen Abstraktionsgrad aufweisen, dass sie für alle Arten von Forschungsdaten anwendbar sind, werden sie im nachfolgenden Kapitel 5.3 eingehend dargestellt.

5.3 Die sieben Grundkriterien im Kontext der Forschungsdatenarchivierung durch Hochschularchive

In Kapitel 4 wurden die organisatorischen Rahmenbedingungen und Bewertungsansätze für Forschungsdaten an Schweizer Hochschularchiven ermittelt, ergänzt wurden sie in Kapitel 5.1 durch eine Rekapitulation der gesetzlichen Grundlagen. Vor diesem Hintergrund lassen sich nun die sieben oben genannten Grundkriterien diskutieren. Ziel ist es, die abstrakten Anforderungen für Universitätsarchive zu konkretisieren und allenfalls zu hinterfragen. Einleitend werden pro Kriterium zunächst ausgewählte erläuternde Fragen aus der Originalpublikation aufgeführt.88

Bedeutung in Bezug auf den eigenen Auftrag (Relevance to Mission)

Mehrere Hochschul- und Staatsarchive erachten die Forschungsdatenarchivierung grundsätzlich nicht als Teil ihres Archivierungsauftrags. Für deren Archivierungsstrategie ist das entscheidend. Aber: Forschung stellt zusammen mit der Lehre das Kerngeschäft einer Hochschule dar. Sie allein durch Verwaltungsschriftgut (Anträge, Finanzierung, Protokolle) zu dokumentieren, verhindert eine Überlieferungsbildung, die in der Lage ist, die Grundlage für die wissens- und wissenschaftsgeschichtliche Forschung zu legen.

Reglementarisch kann ein Hochschularchiv nur Forschungsdaten übernehmen, die an der eigenen Hochschule entstanden sind. Bei Forschungsprojekten mit internen und externen Beteiligten oder finanziellem Support durch Dritte ist abzuklären, ob die Übernahme gegen Vereinbarungen verstösst.

Wissenschaftlicher oder historischer Wert (Scientific or Historical Value)

Für die wissenschaftsgeschichtliche oder biographische Forschung können Forschungsdaten von Interesse sein: Wie hat eine Person geforscht? Welche Hindernisse hat sie angetroffen? Welche Ansätze wurden nicht weiterverfolgt? Der historische Wert der Daten beruht dann nicht nur auf dem Informations-, sondern auch auf dem Evidenzwert. Die Übernahme von Vor- und Nachlässen von Personen, die für die Institution von Bedeutung sind, ermöglicht den Universitätsarchiven eine komplettere Überlieferungsbildung.

Auch der projektbezogene Kontext kann Forschungsdaten einen historischen Wert zukommen lassen. Daten, die in einem besonders kostspieligen, erfolgreichen, umstrittenen oder ausserordentlichen Forschungsprojekt entstehen, können archivwürdig sein, um eine spätere Aufarbeitung zu ermöglichen. Und auch die Forschungsdaten selbst können eine Archivwürdigkeit nahelegen: Wertet man z.B. Nutzungsstatistiken von Repositorien aus, ergeben sich wertvolle Hinweise zum gesellschaftlichen Wert der Daten.

Einmaligkeit (Uniqueness)

Die Abklärung, ob die zu bewertenden Daten bereits anderswo vorgehalten werden, ist auch für Hochschularchive bedeutsam. Doch auch wenn dem so ist, spricht das nicht zwingend gegen eine Übernahme. Der langfristige Erhalt in einem Repositorium ist je nach Strategie und Finanzierungskonzept eher unsicher, in einem Hochschularchiv ist der langfristige Zugriff hingegen sichergestellt.

Die Einmaligkeit der hinterlegten Daten steht für die Bewertung durch ein Hochschularchiv nicht im Vordergrund. Da es bei der digitalen im Vergleich zur analogen Archivierung keine Originale geben kann, ist es in erster Linie die Authentizität der digitalen Kopie, die sichergestellt werden muss.89

Möglichkeiten und Grenzen der Zurverfügungstellung (Potential for Redistribution)

Die rechtlichen Rahmenbedingungen müssen sorgfältig abgeklärt werden. Darf die abliefernde Stelle die Daten überhaupt einem Archiv übergeben? Sind die Urheberrechte gewahrt? Repositorien bieten freien Zugang und freie Nachnutzung der Daten, Archive wenden bei Bedarf das Konzept der Schutzfristen an.

Fachspezifische Repositorien verfügen vielfach über Personal und Ressourcen, um Forschungsdaten vor und auch während der Vorhaltung zu bearbeiten und aufzubereiten. Für Archive ist es wichtig, dass digitale Forschungsdaten mit wenig Aufwand in ein Langzeitarchivierungssystem eingelesen und ebenso wieder ausgegeben werden können. Für einen minimalen Erhaltungsaufwand muss das Datenformat archivtauglich sein. Archive sollten deshalb vorzugsweise Ergebnisdaten übernehmen. Dies gilt gerade auch bei Daten mit Personenbezug, da hier die Ergebnisdaten in der Regel anonymisiert vorliegen und der Datenschutz nicht tangiert wird.

Ergebnisdaten lassen sich anders als Rohdaten oder prozessierte Daten nicht in gleicher Weise wiederverwenden. Die zeitnahe Nachnutzung durch die Forschungscommunity steht bei der Übernahme durch ein Hochschularchiv somit nicht im Vordergrund.

Nicht-Reproduzierbarkeit (Non-Replicability)

Der intrinsische Wert von Forschungsdaten ist ein wichtiges Bewertungskriterium, auch für Archive. Messreihen oder Befragungen, die nicht wiederholt werden können, sind von grossem Wert. Für die klassischen langfristigen Beobachtungsdaten sind aus Forschersicht Repositorien vorteilhaft, da sie punkto Auffindbarkeit und Nachnutzung mehr bieten können als Hochschularchive. Dennoch kann es im Sinne der Hochschule sein, die Daten (auch als Investitionsschutz) im Hochschularchiv zusätzlich vorzuhalten.

Wirtschaftlicher Aspekt (Economic Case)

Die Zuteilung der Ressourcen erfolgt im Idealfall anhand einer Priorisierung aus der Gesamtsicht. Dass Forschungsdaten nicht zu den wichtigsten Kernbeständen der Universitätsarchive gehören, hat dazu beigetragen, dass sie bislang kaum überliefert wurden. Auch ist es legitim, angebotene Unterlagen abzulehnen, wenn die Ressourcen des Archivs nicht ausreichen, um den Bestand aufzubereiten, zu strukturieren und inhaltlich zu erschliessen.90 Fehlendes technischen Know-how und eine fehlende Systeminfrastruktur für den langfristigen Erhalt von digitalem Archivgut dürfen jedoch nicht dazu führen, dass digitale Forschungsdaten abgelehnt werden. Denn – wie eingangs gezeigt – unterscheidet sich der grösste Teil der Forschungsdaten hinsichtlich Medientypen nicht vom Archivgut, das ein Universitätsarchiv aus dem Verwaltungsbereich zu erwarten hat.

Ausführliche Dokumentation (Full Documentation)

Eine Dokumentation zum Entstehungszusammenhang und zum besseren Verständnis der Daten ist selbstredend auch aus Sicht des Archivs wünschenswert. Eine konzise read-me-Datei kann dafür bereits ausreichen. Das Fehlen einer Dokumentation kann durch Mitarchivierung der finalen Publikation kompensiert werden, insbesondere bei Ergebnis- und Supplementdaten. Dies entspricht zwar nicht dem Bewertungs-Usus von Universitätsarchiven, die normalerweise alles publizierte Material eines Nachlasses aussortieren mit dem Argument, dass dieses durch die Hochschulbibliothek überliefert wird. Doch der Wert von Forschungsdaten hängt entscheidend vom Ausmass der Dokumentation ab, sodass hier ein anderer Weg angezeigt ist.

Im Idealfall haben nicht nur die Dateinamen, sondern auch die Ordnerstruktur und die Ordnerbenennung eine Aussagekraft. Gleiches gilt für die in den Metadaten der Dateien enthaltenen Datumsangaben zur letzten Speicherung. Der Übernahmevorgang soll deshalb unbedingt informationserhaltend erfolgen.

Wie die obige Anwendung zeigt, erweisen sich die sieben Grundkriterien als geeignete Ansatzpunkte für die systematische Diskussion des Archivwerts von Forschungsdaten. Sie werden deshalb im Schlusskapitel 7.2 im Rahmen des Bewertungsrasters inhaltlich wieder aufgegriffen.

6. Kooperationsszenarien

Die vorangegangene Auslegeordnung der Aktivitäten schweizerischer Hochschulbibliotheken und -archive eröffnet nun Perspektiven, um Kooperationsszenarien mit den von Nippert (2013) vorgeschlagenen Partnern – Bibliotheken, Rechenzentren und Repositorien – anzudenken. Als gedanklicher Ausgangspunkt soll ein idealisiertes Universitätsarchiv dienen, das selektiv digitale Forschungsdaten i.e.S. in seinen Bestand aufnehmen will.

6.1 Zusammenarbeit mit Bibliotheken

Die gemeinsame Nutzung einer Systeminfrastruktur für den langfristigen Erhalt von digitalen Objekten ist vermutlich die naheliegendste Form der Zusammenarbeit. Zwar verwenden Bibliotheken und Archive unterschiedliche Metadaten-Schemata, um ihre Objekte inhaltlich zu beschreiben, doch für die technischen und administrativen Metadaten zur Langzeitarchivierung verwenden beide den PREMIS-Standard. Die deskriptiven Metadaten werden im jeweiligen Katalog oder Archivinformationssystem vorgehalten. Die digitalen Objekte sind für den direkten Aufruf aus dem Archivsystem persistent verlinkt. Die gemeinsame Nutzung eines digitalen Langzeitarchivs wird in den meisten Fällen ein mandantenfähiges System voraussetzen, um die internen und externen Zugriffsberechtigungen zu steuern.

Weitere Synergien liegen in der Beratung. Gewisse Inhalte der Datenmanagementberatung der Bibliotheken (Ordnungssystem und systematische Benennung der Dateien) sind denjenigen des Records Managements der Archive sehr verwandt. Eine gemeinsame Erarbeitung der Inhalte bzw. ein Wissenstransfer schaffen Vorteile. Zudem überschneiden sich die Zielgruppen, wenn auch möglicherweise zeitverschoben: junge Forschende, die Datenmanagementpläne erarbeiten müssen, werden später vielleicht zu Instituts- oder Fakultätsvorstehern und somit verantwortlich für die Geschäftsverwaltung ihrer Organisationseinheit.

Für den Entscheid, welche Daten aus einem institutionellen, generischen Forschungsdatenrepositorium der Bibliothek ins Universitätsarchiv übernommen werden sollen, sind die Nutzungsstatistiken des Repositoriums wertvoll. Sie geben z.B. Aufschluss über besonders nachgefragte Datenpakete. Ein Abgleich der Autorenliste des Repositoriums mit der ‚Wunschliste‘ des Archivs gibt dem Archiv die Möglichkeit, seine Forschungsdatenbestände gezielt zu erweitern. Das Repositorium seinerseits kann mittelfristig den Bedarf nach Langzeitarchivierung jener Datenpakete anmelden, die dauerhaft aufbewahrt werden sollen.

Wenn die Schnittstellen und Zuständigkeiten einer solchen Zusammenarbeit klar geregelt sind, können zwar beide Seiten profitieren, es ist aber auch eine Konkurrenzsituation denkbar. Ein Beispiel ergibt sich in Bezug auf Privatnachlässe: Das diesbezügliche Sammlungsprofil der Handschriftenabteilungen der Bibliotheken hat oftmals einen breiteren Fokus als dasjenige des Universitätsarchivs, insbesondere wenn die Bibliothek auch Kantonsbibliothek ist. Für Archive sind jedoch Privatnachlässe eine hervorragende Möglichkeit, Forschungsdaten in ihrem Entstehungskontext zu übernehmen. Andere Konkurrenzsituationen sind denkbar, wenn an einer Hochschule noch weitere, auf Fachrichtungen spezialisierte Archive bestehen (z.B. Architektur oder Medizin). Hilfreich ist es deshalb, aktiv den Dialog zu suchen und das eigene Dokumentationsprofil transparent zu machen. Zudem kann eine Publikation von digitalisierten Archivalien als Forschungsdaten im erweiterten Sinne über Plattformen wie e-manuscripta oder e-periodica die Nutzung gezielt fördern.

6.2 Zusammenarbeit mit Rechenzentren

Für die Forschenden sind die Informatikdienste und Rechenzentren der Hochschule die ersten Ansprechpartner für die Erzeugung, Speicherung, Verwaltung und Dokumentation ihrer Daten. Schon bevor an Bibliotheken Beratungsstellen für Forschungsdatenmanagement entstanden, suchte der Informatiksupport nach Lösungen für die Anliegen der Forschung. Die IT-Dienste sind es auch, die Anwendungen wie z.B. für digitale Laborjournale hosten.

Das Hochschularchiv bezieht bei den zentralen Informatikdiensten direkt oder indirekt den benötigten Speicherplatz. Wenn das Archiv digitale Ablieferungen aus der Universitätsverwaltung übernimmt, besteht meist eine erste Form von Zusammenarbeit mit der IT, da Daten aus einer Applikation oder Ablage exportiert, allenfalls gewandelt und dem Archiv zur Verfügung gestellt werden müssen. Wird das digitale Langzeitarchivierungssystem durch die zentralen IT-Dienste betrieben, existiert auch hier eine Zusammenarbeit entsprechend den Standardprozessen der jeweiligen Hochschule.

Die Formatanalyse mit den damit verbundenen Erhaltungsmassnahmen ist eine Kernaufgabe der digitalen Langzeitarchivierung. Sind die dafür notwendigen Kenntnisse im Archiv nicht vorhanden, bietet sich die Nutzung des Know-hows der IT-Dienste im Sinne einer Kooperation an. Bei einer geringen Anzahl digitaler Ablieferungen pro Jahr genügen für die Formatanalyse wenige Stellenprozente, während es für die Erhaltungsmassnamen wichtig ist, agil mit frei verfügbaren Analyse- und Bearbeitungstools umgehen zu können.91

Ein datenbezogenes Kooperationsszenario zwischen Rechenzentrum und Archiv könnte auch für «verwaiste» langfristige Beobachtungsdaten zielführend sein. Eher ephemere Fachgebiete, in welchen Messreihen so lange durchgeführt werden, bis der zuständige Lehrstuhlinhaber emeritiert, sind oft auf sich allein gestellt. Dennoch können solche Daten innerhalb und ausserhalb der Fachcommunity auf Interesse stossen, und sie besitzen durch ihre Eigenschaft der Nicht-Wiederholbarkeit eine intrinsische Archivwürdigkeit. Das Hochschularchiv kann in einem solchen Fall den IT-Diensten anbieten, die Daten zu übernehmen.

6.3 Zusammenarbeit mit fachspezifischen Repositorien

Ergänzend zu Kooperationsansätzen mit internen Stellen sind Partnerschaften mit externen Repositorien denkbar. Bei einer solchen Kooperation ist zu beachten, dass die Daten ausserhalb der eigenen Hochschule gespeichert werden. Für öffentlich zugängliche und zur Nachnutzung freie Forschungsdaten kann dies unbedenklich sein. Bei Ablieferungen aus der Verwaltung, die unter höheren Schutzanforderungen stehen, muss die Situation jedoch kritisch analysiert werden.

Die Nachhaltigkeit der Überlieferung ist beim Aufbau einer Forschungsdateninfrastruktur ein zentrales Anliegen. Eine an der iPres 2016 vorgestellte Studie zur Webarchivierung von Forschungsprojekten hatte festgestellt, dass nach Ablauf von 20 Jahren nur 7% der ursprünglich im Web greifbaren Forschungsdaten und -informationen aufrufbar sind.92 Forschende müssen demnach immer wieder feststellen, dass die Serviceinfrastruktur, die ihre Daten vorhält, den Betrieb einstellt. Dagegen kann das Hochschularchiv Hand bieten und Daten längerfristig archivieren. Allerdings ist im Einzelfall abzuwägen, ob eher die Bibliothek oder das Archiv besser geeignet ist, diese Aufgabe zu übernehmen.

Zusammenfassend lässt sich festhalten, dass mit allen genannten Partnern auf unterschiedlichen Ebenen Kooperationsszenarien und Synergiepotentiale bestehen, und zwar in Bezug auf Wissenstransfer, Beratung, Infrastruktur und archivischer Nachhaltigkeit. Je transparenter die Haltung des Hochschularchivs in Bezug auf die Übernahme von digitalen Forschungsdaten kommuniziert wird, umso einfacher ist es für die potentiellen Kooperationspartner, die Möglichkeiten und Vorteile einer Zusammenarbeit zu erkennen.

7. Handlungsempfehlungen

Die Erkenntnisse aus den vorangegangenen Kapiteln bieten Raum und Bedarf für Handlungsempfehlungen an die Adresse der Hochschularchive. Die Empfehlungen fokussieren zwei Aktionsfelder: Ausgehend von einem umfassenden Forschungsdatenbegriff geht es um die Frage, wie sich das Archiv proaktiv in Bezug auf Forschungsdaten positionieren und wie es seine Daten für die Forschung aufwerten kann. Anschliessend richtet sich die Perspektive auf Forschungsdaten i.e.S., und es wird ein Frageraster skizziert, das die Bewertung von angebotenen Forschungsdaten ermöglicht.

7.1 Proaktiv: Forschungsdaten akquirieren und aufwerten

(Auch) Universitäten befinden sich in der digitalen Transformation. Die Verwaltungen führen eine elektronische Geschäftsverwaltung ein und in der Forschung werden Infrastrukturen für die Nachnutzung und Reproduzierbarkeit der Daten geschaffen. Mit neuen Arbeitsweisen ändern sich auch Reglemente und Vorschriften. Das Universitätsarchiv profitiert, wenn die betroffenen Akteure die Dienstleistungen des Archivs kennen und entsprechend in der Ausarbeitung ihrer Policies berücksichtigen. Aber: Die durch das DLCM-Projekt erarbeitete Vorlage für die Research Data Management Policy für ein Hochschulinstitut93 ignoriert die Existenz eines Hochschularchivs und seine allfällige Zuständigkeit für die langfristige Archivierung von Forschungsdaten, was als symptomatisch angesehen werden muss. Will das Universitätsarchiv im Gesamtgefüge der Archivierung von Forschungsdaten eine Rolle spielen, muss es sich deshalb proaktiv einbringen.

Die gesetzlichen Grundlagen der Universitätsarchive schliessen eine Übernahme von Forschungsdaten zwar nicht aus, doch in den Archivreglementen spielen sie neben den Verwaltungsunterlagen meist keine Rolle. Um den Kernauftrag der Hochschule (Forschung und Lehre) umfassender dokumentieren zu können, muss das Archiv seinen eigenen Auftrag gegebenenfalls erweitern.

Es entspricht der kontextorientierten Herangehensweise der Archive, Forschungsdaten zusammen mit Projektunterlagen zu übernehmen. Die Abgrenzung zu den Forschungsdatendienstleistungen der Hochschulbibliotheken gelingt, wenn Archive zu diesem Zweck ein Sammlungsprofil definieren, das die gezielte Akquisition von Privatarchiven von Angehörigen der Hochschule vorsieht. Mit der Überlieferungsbildung durch die Übernahme von Vor- und Nachlässen wird gleichzeitig das Selbstverständnis der Forschenden und deren Überzeugung respektiert, dass Forschungsdaten persönliches Eigentum seien.

Mit Fokus auf Forschungsvorhaben aus dem Bereich der digital Humanities und der Geschichtswissenschaft gerät das angestammte Archivgut der Universitätsarchive als ‚Forschungsdaten im erweiterten Sinn‘ in den Blick. Sollen die Forschenden hier optimal unterstützt werden, besteht auf drei Ebenen Handlungsbedarf: bei den Quellen, bei den Schnittstellen und bei den Metadaten.

Die datengesteuerte Forschung benötigt digital aufbereitetes Archivgut. Von vorrangigem Interesse sind dabei die grossen Serien wie kommentierte Vorlesungsverzeichnisse oder Protokolle der Leitungsgremien. Sind die Archivalien einmal digitalisiert und haben sie das Forschungsinteresse geweckt, stellt sich die Frage nach einer Auslieferung der Daten, um einen digitalen Quellenkorpus zu formen. Damit kommen angestammte Benutzungsvorschriften und Bestimmungen zum Datenschutz rasch an ihre Grenzen. Frühzeitige rechtliche Abklärungen und Regelungen sind deshalb empfehlenswert.

Nach dem Vorbild jener Bibliotheken, die ihre Digitalisate nach Quellentyp über nationale Plattformen wie e-rara, e-manuscripta, e-periodica etc. anbieten, stellt sich auch für Universitätsarchive die Frage, wie sie ihre digitalisierten Quellen publizieren. Die Kooperation mit einer der genannten Plattformen ist denkbar, doch unabhängig davon, welches System genutzt wird, soll neben einer Metadaten-Suche auch eine Volltextsuche angeboten werden. Das setzt aber voraus, dass der ursprünglich gedruckte oder handschriftliche Text durch geeignete Verfahren erkannt und der Inhalt im Suchindex hinterlegt wird.

Im Hinblick auf eine Nutzung durch die Forschung ist Transparenz über die Auswahl, den Inhalt, die Nutzungsbedingungen und die Schnittstellen von Bedeutung. Sie muss proaktiv sichergestellt werden. Die Schnittstellen sollen es erlauben, sowohl die Metadaten des Datenkorpus‘ als auch die Daten selbst herunterzuladen; die Nutzungsbedingungen sollen soweit als möglich auf Einschränkungen verzichten.

Digitalisiertes analoges und genuin digitales Archivgut ist in demselben Archivinformationssystem gemäss den internationalen Normen und Standards zu verzeichnen. Die Übernahme von digitalem Archivgut aus der Verwaltung oder aus der Forschung bietet unter Umständen die Möglichkeit, Metadaten aus dem Quellsystem zu übernehmen und über geeignete Verfahren ins Archivinformationssystem einzupflegen.

7.2 Reaktiv: Angebotene digitale Forschungsdaten bewerten

Ob einem Archiv Forschungsdaten angeboten werden oder ob es proaktiv solche übernehmen möchte: Vor der Datenübernahme muss eine Bewertung erfolgen. Das nachfolgende Frageraster, das auf den Erkenntnissen aus dieser Arbeit basiert, bietet dazu eine Hilfestellung. Mit ihm werden die digitalen Daten geprüft und die Urheberschaft befragt, um beurteilen zu können, ob sich die Daten nach technischen, formalen, inhaltlichen und ökonomischen Kriterien für die Langzeitarchivierung eignen.

Kategorie Kriterium Fragen Antwort
Technische und formale Kriterien Reifegrad Handelt es sich um bereinigte Ergebnisdaten? Wenn nicht: Gibt es gute Gründe, die Daten eines anderen Reifegrads dauerhaft zu archivieren (z. B. Rohdaten)?

JA

NEIN

Medientyp Handelt es sich um verbreitete Medientypen (Text, Bild, strukturierte Daten, Audio, Video), die mit Standardsoftware wiedergegeben werden können?

JA

NEIN

Dateiformat Handelt es sich um archivtaugliche Dateiformate? Wenn nicht: ist eine Umwandlung ohne Verluste machbar, sind die Daten migrationsfähig? Kann dies die abliefernde Stelle übernehmen? Gibt es gute Gründe, die Daten in einem (nach heutigem Ermessen) nicht-archivtauglichen Format zu übernehmen?

JA

NEIN

Umfang Handelt es sich um eine handhabbare Datenmenge?

JA

NEIN

Bestands­spezifische Kriterien Bedeutung für die eigene Institution Entstanden die Daten an der eigenen Institution? Steht / stand der Bestandsbildner / Nachlassgeber in einer genügend engen Beziehung zur eigenen Institution, um den Archivierungsaufwand zu rechtfertigen? Ist der Bestandsbildner selbst von genügend grosser Bedeutung, dass sich die Datenübernahme rechtfertigt?

JA

NEIN

Bedeutung für den Bestandsbildner Sind die Daten von grosser Bedeutung in Bezug auf die (lebenslange) Forschungstätigkeit des Bestandsbildners / Nachlassgebers?

JA

NEIN

Inhaltliche Kriterien Wissenschaftlicher oder historischer Wert Entstanden die Daten im Kontext eines herausragenden Projekts? Bilden sie die Grundlage für eine bahnbrechende Publikation? Sind die Daten für das Verständnis der Entwicklung des betroffenen Fachgebiets besonders aufschlussreich? Gibt es ein unmittelbares, bereits angemeldetes Forschungsinteresse an den Daten?

JA

NEIN

Entstehungskontext und Methode (Nicht-Reproduzierbarkeit) Besitzen die Daten einen hohen intrinsischen Wert? Handelt es sich z.B. um langfristige Beobachtungsdaten? Oder um sozialwissenschaftliche Befragungsdaten?

JA

NEIN

Urheberrecht und Datenschutz

Ist die abgebende Stelle urheberrechtlich befugt, die Daten zu übergeben?

Ist der Datenschutz gewährleistet?

JA

NEIN

Kontextinformationen Sind genügend Informationen vorhanden, damit eine archivarische Erschliessung möglich ist?

JA

NEIN

Authentizität Sind die Daten authentisch?

JA

NEIN

Ökonomische Kriterien Machbarkeit Kann es dem Archiv mit den aktuell (allenfalls mittelfristig) verfügbaren Mitteln und Kenntnissen voraussichtlich gelingen, die Daten zu übernehmen, zu archivieren und Benutzern zur Verfügung zu stellen?

JA

NEIN

Im Idealfall werden sämtliche Fragen mit Ja beantwortet. Häufen sich Nein-Antworten ist Vorsicht geboten. Entweder fehlen dann die technischen oder inhaltlichen Voraussetzungen oder die Machbarkeit ist in Frage gestellt. Die technischen und formalen Kriterien stützen sich auf die Erkenntnisse zu Forschungsdaten (Kapitel 2). Die bestandsspezifischen und die inhaltlichen Kriterien leiten sich aus der Diskussion zur Archivwürdigkeit von Forschungsdaten in Kapitel 5 ab. Die ökonomischen Kriterien dürfen nicht unterschätzt werden, sind sie doch essentiell für die praktische Umsetzung des Übernahmeprojekts.

Der Frageraster enthält keine Muss- oder Kann-Kriterien für den Übernahmeentscheid und verfolgt nicht den Anspruch, eine absolute Entscheidungsgrundlage zu bieten. Stattdessen orientiert er sich an den realen Gegebenheiten im Archivaren-Alltag, in welchem jeder Datenbestand einzigartig ist, weshalb Freiraum für einen individuellen Ermessensentscheid bewahrt bleiben muss. Der Nutzen des Fragerasters liegt darin, die archivarische Fachperson systematisch durch den Bewertungsprozess zu leiten und die Bewertung und letztlich die Entscheidungsgrundlage nachvollziehbar und transparent festzuhalten.

Schlussbetrachtung

Klaus Nipperts Plädoyer für ein aktives Engagement der Hochschularchive in der Überlieferung von Forschungsdaten bildete den Ausgangspunkt für die vorliegende Arbeit. Man könnte argumentieren, dies sei nicht nötig, denn Forschungsdaten seien heute in Repositorien mit ihren vielseitigen Diensten zur Aufbewahrung und Nachnutzung der Daten bereits gut aufgehoben. Aber: Diese Dienste sind auf die spezifischen Bedürfnisse der Forschenden zugeschnitten. Die Ziele eines Archivs sind andere.

Hochschularchive übernehmen Forschungsdaten, um ihren Überlieferungsauftrag zu erfüllen. Dieser ist zeitlich nicht limitiert. Gerade digitale Daten stellen deshalb hohe Anforderungen an die technische Langzeitarchivierung – sowohl in Bezug auf Know-how als auch in Bezug auf Infrastruktur und personelle Ausstattung. Ebenfalls benötigt wird ein institutioneller Konsens darüber, inwiefern Forschungsdaten überhaupt zum Überlieferungsauftrag gehören, um den Kernauftrag einer Hochschule – nämlich Forschung und Lehre – angemessen dokumentieren zu können. Die Untersuchungen in dieser Arbeit zeigten auf, dass die überwiegende Mehrheit der Archive der Schweizer Hochschullandschaft in allen diesen Bereichen erst am Anfang steht.

Wenn diese Arbeit die Hochschularchive dazu anregen kann, die eigenen Policies zu hinterfragen und Forschungsdaten als elementares Archivgut einer Forschungsinstitution zu begreifen, ist bereits viel erreicht. Als praktische Hilfestellung konnten aber auch weitergehende Handlungsempfehlungen erarbeitet werden. Sie münden in einem Bewertungsraster, das dem Archivar und der Archivarin ein Werkzeug in die Hand legt, um die richtigen Fragen zu stellen und die wichtigen Argumente für oder gegen eine Langzeitarchivierung zu finden. Mit diesem Beitrag, so die Hoffnung, können Inputs gegeben werden, um dem Anliegen aus dem Plädoyer Nipperts ein Stück weit die Tür in die Praxis zu öffnen.

Bibliographie

Fachliteratur

Alle am 25.08.2021 zuletzt abgerufen

Akademien der Wissenschaften Schweiz (2008). «Wissenschaftliche Integrität. Grundsätze und Verfahrensregeln.» http://www.akademien-schweiz.ch/index/Schwerpunkte/Wissenschaftliche-Integritaet.
html

Ball, A. (2012). «Review of Data Management Lifecycle Models. University of Bath, UK.
https://purehost.bath.ac.uk/ws/portalfiles/portal/206543/redm1rep120110ab10.pdf

Bauer, B., Ferus, A., Gorraiz, J., Gründhammer, V., Gumpenberger, Ch., Maly, N., Mühlegger, J. M., Preza, J. L., Sánchez Solís, B., Schmidt, N., Steineder, Ch. (2015). «Forschende und ihre Daten. Ergebnisse einer österreichweiten Befragung», Report 2015. Version 1.2. http://doi.org/10.5281/zenodo.32043

Beagrie, Neil (2019). «What to Keep: A Jisc research data study», Jisc Bristol.
https://repository.jisc.ac.uk/id/eprint/7262

Becker, T., Moritz, W., Müller, W., Nippert, K., Plassmann, M. (2009). GDokumentationsprofil für Archive wissenschaftlicher Hochschulen: Eine Handreichung», Saarbrücken: Universität des Saarlandes.

Bicho, D., Gomes, D. (2016). «Preserving Websites of Research & Development Projects», in Signori, B., Knight, S., Milic-Frayling, N., iPres 2016 – Proceedings of the 13th International Conference on Digital Preservation, S. 247-253. https://doi.org/10.5281/zenodo.1255964

Bütikofer, N., Keller-Marxer, P. (2008). «Konzeptstudie zur Entwicklung eines Modells für eine zentrale Langzeitarchivierung von digitalen Primär- und Sekundärdaten der Forschung für die Schweiz: Situation, Bedarf, Nutzenziele, Modelle, Anspruchsgruppen, Rahmenbedingungen und europäisches Umfeld», Bericht erstellt für die ETH-Bibliothek und das E-lib.ch Projekt Elektronische Bibliothek Schweiz, Schweizerische Universitätskonferenz. http://doi.org/10.3929/ethz-a-006070903

Büttner, S., Hobohm, H.-C., Müller, L. (Hrsg.) (2011). Handbuch Forschungsdatenmanagement», Bad Honnef: Bock + Herrchen. http://opus.kobv.de/fhpotsdam/volltexte/2011/241/pdf/HandbuchFor
schungsdatenmanagement.pdf

Corrado, E. M., Moulaison Sandy H. (2014). «Digital preservation for libraries, archives, and museums». Lanham: Rowman & Littlefield.

DLCM (2016). «Research Data Management Policy Template», Version 1.3: September 2016.
https://www.dlcm.ch/resources/dlcm-policy

Fähle, D., Maier, G., Neuburger, A. (2020). «Bereitstellung, Aufbereitung, Langzeitarchivierung. Funktionen der Archive in der Forschungsdateninfrastruktur», in Der Archivar 2020 Bd. 73(1) S. 13-18.

Geisser, F., Suri, R.E., Töwe, M. (2016). «To Act or Not to Act – Handling File Format Identification and Validation Issues in Practice», iPres Conference Poster. https://doi.org/10.3929/ethz-a-010735897

Gemperli, S. (2002). «Das Archiv der ETH Zürich: Einblick in seine Bestände”, in Arbido 17 (2002), S. 23-24. http://doi.org/10.5169/seals-768732

Hirschmann, B. (2018). «Die Research Collection der ETH Zürich», in ABI Technik 2018 Bd. 38 (3), S. 223-233. http://doi.org/10.1515/abitech-2018-3003

Huber, Ch. J. (2015). «Digitale Langzeitarchivierung im Hochschularchiv der ETH Zürich. Eine Herausforderung für das Archivmanagement», in Birgit Rehse und Irina Schwab (Hg.), Archivmanagement. Ressourcen nutzen, Potentiale erkennen, Leipzig 2015, S.44-52.

I2S2 (2011). «Idealised Scientific Research Activity Lifecycle Model». Online publiziert. https://www.
ukoln.ac.uk/projects/I2S2/documents/I2S2-ResearchActivityLifecycleModel-110407.pdf

Jambé, C. (2015). «La gestion des données de recherche à l’Université de Lausanne : enjeux transdisciplinaires». Travail de Bachelor réalisé en vue de l’obtention du Bachelor HES.
http://doc.rero.ch/record/258023/files/TDB_Jambe_Carmen.pdf

Keitel, Ch. (2015). «Auswahl und Bewertung digitaler Forschungsdaten aus archivwissenschaftlicher Perspektive», nestor-Workshop Forschungsdaten, Essen 17.11.2015. https://www.forschungsdaten.org/
images/9/99/04–keitel–Bewertung-Forschungsdaten.pdf

Keitel, Ch. (2018). «Zwölf Wege ins Archiv: Umrisse einer offenen und praktischen Archivwissenschaft», Stuttgart: Franz Steiner Verlag.

Kindling, M., Schirmbacher P., Simukovic E. (2013). «Forschungsdatenmanagement an Hochschulen: das Beispiel der Humboldt-Universität zu Berlin», in Libreas – Library Ideas 2013 S. 43-63.
https://libreas.eu/ausgabe23/07kindling

KOST, Koordinationsstelle für die dauerhafte Archivierung elektronischer
Unterlagen, (2020). «Katalog archivischer Dateiformate", Version 6.1, August 2020.
https://kost-ceco.ch/cms/kad_main_de.html

Mumenthaler, R., Schuldt, K., Wenk, B. (2017). «Bericht: AISOOP. Analyse der Informationsarchitektur, Schnittstellen und Organisation der Online-Plattformen», Eine Studie der HTW Chur, gefördert im Rahmen des Programms «Wissenschaftliche Information» (SUK 2013-2016 P-2) von swissuniversities. https://www.fhgr.ch/fileadmin/fhgr/angewandte_zukunftstechnologien/SII/projekte/Projekt-AISOOP_Bericht.pdf

nestor (2008). «nestor-Kriterien: Kriterienkatalog vertrauenswürdige digitale Langzeitarchivierung». Frankfurt am Main: nestor c/o Deutsche Nationalbibliothek. https://d-nb.info/1000083241/34

Neuroth, H., Strathmann, S., Oßwald, A., Scheffel, R., Klump, J., Ludwig, J. (Hrsg.) (2012). «Langzeitarchivierung von Forschungsdaten – Eine Bestandsaufnahme», Boizenburg: Verlag Werner Hülsbusch.
http://nestor.sub.uni-goettingen.de/bestandsaufnahme/

Nippert, K. (2013). «Forschungsdaten: Ein Arbeitsgebiet für Archive von Hochschulen und wissenschaftlichen Institutionen?», in Der Archivar 2013 Bd. 66 (2) S. 154-159. https://www.archive.nrw.de/
sites/default/files/media/files/ARCHIVAR_02-13_internet.pdf

Oesterheld, Ch. (2018). «Die Wissenschaftlichen Bibliotheken der Schweiz zwischen Literatur- und Informationsversorgung, Dienstleistungen für Studium, Forschung und Bildung und kulturellem Auftrag: eine Standortbestimmung 2018”, in Keller, A., Uhl, S. (Hrsg.). Bibliotheken der Schweiz: Innovation durch Kooperation. Festschrift für Susanna Bliggenstorfer anlässlich ihres Rücktrittes als Direktorin der Zentralbibliothek Zürich, Berlin, Boston: De Gruyter Saur, S. 27-53.

Schellenberg, T. (1990). «Die Bewertung modernen Verwaltungsschriftguts», übers. u. hg. v. A. Menne-Haritz, Veröffentichungen der Archivschule Marburg 17.

Schneider, G. (2018). «Das Programm P-5 «Wissenschaftliche Information: Zugang, Verarbeitung und Speicherung: teilnehmeroffene Dienste der Hochschulen, für die Hochschulen», in Keller, A., Uhl, S. (Hrsg.). Bibliotheken der Schweiz: Innovation durch Kooperation. Festschrift für Susanna Bliggenstorfer anlässlich ihres Rücktrittes als Direktorin der Zentralbibliothek Zürich, Berlin, Boston: De Gruyter Saur, S. 78-96.

Schneider, U.J. (2020). «Deutsche Nationalkataloge – Herausforderungen an das deutsche Bibliothekssystem. Was aus der Perspektive der Digital Humanities zu tun wäre», in ABI Technik 2020 Bd. 40 (1), S. 40-51. https://doi.org/10.1515/abitech-2020-1005

Sesartić Petrus, A., Töwe, M. (2019). «Forschungsdatenmanagement an der ETH Zürich: Ansätze und Wirkung», in Bibliothek Forschung und Praxis 2019 Bd. 43 (1,) S. 49-60. http://doi.org/10.1515/bfp-2019-2002

Starr, J., Gastl, A. (2011). «IsCitedBy: A Metadata Scheme for DataCite", in D-Lib Magazine 2011 Bd. 17 (1/2). https://doi.org/10.1045/january2011-starr

Tibelius, S. (2016). «Universitätsarchive im Aufbruch in das digitale Zeitalter. Zur digitalen Langzeitarchivierung am Beispiel des Universitätsarchivs Tübingen», Transferarbeit im Rahmen des 49. Wissenschaftlichen Lehrgangs an der Archivschule Marburg, Marburg 2016. https://www.landesarchiv-bw.de/sixcms/media.php/120/60860/Transferarbeit2016_Tibelius.pdf

Töwe, M. (2014). «Infrastruktur für die digitale Langzeitarchivierung an der ETH Zürich.» Vortrag am VSA-Zyklus Archivpraxis Schweiz, publiziert in der Research Collection. https://doi.org/10.3929/ethz-a-010341054

UK Data Service (2018). «Collections Development Selection and Appraisal Criteria”. Online publiziert. https://www.ukdataservice.ac.uk/media/455175/cd234-collections-appraisal.pdf

Whyte, A., Wilson, A. (2010). «How to Appraise and Select Research Data for Curation”. DCC How-to Guides. Edinburgh: Digital Curation Centre. http://www.dcc.ac.uk/resources/how-guides/

Ziehmer, M. M. (2018). «Research Data Management Workshop at RCS18». Präsentation an der EPFL und ETHZ Summer School on Reproducibility in Computational Sciences 2018; veröffentlicht in der Research Collection der ETH Zürich. https://doi.org/10.3929/ethz-b-000296565

Rechtliche und institutionelle Grundlagen

Alle am 25.08.2021 zuletzt abgerufen

Bundesgesetz über das Urheberrecht und verwandte Schutzrechte (Urheberrechtsgesetz, URG) vom 9. Oktober 1992 (Stand am 1. April 2020), SR 231.1. https://www.admin.ch/opc/de/classified-compilation/19920251/index.html#a2

Bundesgesetz über die Archivierung (Archivierungsgesetz, BGA) vom 26. Juni 1998 (Stand am 1. Mai 2013), SR 152.1. https://www.admin.ch/opc/de/classified-compilation/19994756/index.html

Bundesgesetz über die Eidgenössischen Technischen Hochschulen (ETH-Gesetz) vom 4. Oktober 1991 (Stand am 1. Mai 2017), SR 414.110. https://www.admin.ch/opc/de/classified-compilation/19910256/index.html#a36

ETH Zürich, Reglement für das Archiv der ETH Zürich vom 3.12.2002, Stand vom 1. April 2015, RSETHZ 420.1. https://rechtssammlung.sp.ethz.ch/Dokumente/420.1.pdf

Kanton Bern, Gesetz über die Archivierung (ArchG) vom 31.3.2009, BSG 108.1.
https://www.belex.sites.be.ch/frontend/versions/24

Universität Bern, Reglement über die Archivierung vom 1.5.2012. https://www.unibe.ch/e152701/
e322683/e325057/e460419/senat_rgl_archivierung_ger.pdf

Université de Fribourg, Documents en lien avec les études, les grades et les diplômes – Typologie des documents et calendrier de conservation (2018). [nicht mehr online]

Université de Fribourg, Facultés – Calendrier de conservation des dossiers généraux des décanats (2018). [nicht mehr online]

Université de Lausanne, Calendrier de conservation – documents administratifs (2013). https://www.unil.
ch/uniris/files/live/sites/uniris/files/documents/unites/UNIL_Calendrier_conservation_20130906.pdf

Université de Lausanne, Convention de donation d’un fonds d’archives privées (2014). https://
www.unil.ch/uniris/files/live/sites/uniris/files/documents/unites/UNIRIS_Modele_convention_donation_2014.pdf

Université de Lausanne, Directive de la Direction 4.5, Traitement et gestion des données de recherche (2021). https://www.unil.ch/files/live/sites/central/files/textes-leg/4-rech/dir4-5-donnees-rech4.pdf

UZH Archiv, Konzept für den Umgang mit Institutsakten im UZH Archiv (2017). https://www.archiv.uzh.ch/de/dienstleistungen/dokumente_download.html

UZH Archiv, Sammlungskonzept für Privatarchive im UZH Archiv (2017). https://www.archiv.uzh.ch/de/dienstleistungen/dokumente_download.html


  1. Nippert (2013), S. 155.↩︎

  2. DLCM (2016), S. 5.↩︎

  3. Whyte (2010).↩︎

  4. DLCM (2016), S. 5.↩︎

  5. Neuroth (2012), S. 300.↩︎

  6. Fähle (2020), S. 14.↩︎

  7. Schneider (2020), S. 48ff.↩︎

  8. Ziehmer (2018).↩︎

  9. Ball (2012), S. 5-6. Das Model entstand an der University of Bath im Rahmen des I2S2-Projekts.↩︎

  10. Beagrie (2019), S. 31.↩︎

  11. I2S2 (2011), S. 1-2.↩︎

  12. Beagrie (2019), S. 4 und 29.↩︎

  13. Bauer (2015), S. 25.↩︎

  14. Jambé (2015), S. 31 und S. 94.↩︎

  15. Kindling (2013), S. 49.↩︎

  16. Neuroth (2012), S. 301.↩︎

  17. KOST (2020).↩︎

  18. Neuroth (2012), S. 302.↩︎

  19. Fähle (2020), S. 17.↩︎

  20. Neuroth (2012), S. 300.↩︎

  21. Neuroth (2012), S. 300.↩︎

  22. Sesartić (2019), S. 49.↩︎

  23. Bauer (2015), S. 29. Vergleichbar auch: Universität Lausanne, Jambé (2015), S. 35.↩︎

  24. Kindling (2013), S. 49.↩︎

  25. Bütikofer (2008), S. 4.↩︎

  26. Bütikofer (2008), S. 4↩︎

  27. Nestor (2008).↩︎

  28. Nestor (2008), S. 24.↩︎

  29. Urheberrechtsgesetz, Art. 2.↩︎

  30. Vgl. dazu stellvertretend das ETH-Gesetz, Art. 36.↩︎

  31. Beispielhaft: Standard-Schenkungsvertrag des Uniarchivs Lausanne, https://www.unil.ch/uniris/files/live/sites/uniris/files/documents/unites/UNIRIS_Modele_convention_donation_2014.pdf↩︎

  32. Büttner (2011), S. 69.↩︎

  33. Siehe auch die Vorlage für die Erstellung einer Research Data Management Policy. DLCM (2016).↩︎

  34. Akademien der Wissenschaft Schweiz (2008), S. 17.↩︎

  35. SNF-Leitlinien für Forschende für das Erstellen des Data Management Plans, http://www.snf.ch/de/derSnf/forschungspolitische_positionen/open_research_data/Seiten/data-management-plan-dmp-leitlinien-fuer-forschende.aspx↩︎

  36. Beagrie (2019), S. 30 und 32.↩︎

  37. Nippert (2013), S. 156.↩︎

  38. Oesterheld (2018), S. 29f.↩︎

  39. Oesterheld (2018), S. 37.↩︎

  40. Projektprogramme e-lib.ch (2008-12) und SUK-P-2 (2013-16). Zu den Online-Portalen gehören: e-codices, Virtuelle Handschriftenbibliothek der Schweiz: https://www.e-codices.unifr.ch; e-rara, Plattform für digitalisierte Drucke aus Schweizer Institutionen: https://www.e-rara.ch; e-manuscripta, Plattform für digitalisierte handschriftliche Quellen aus Schweizer Bibliotheken und Archiven: https://www.e-manuscripta.ch; e-periodica, Schweizer Zeitschriften online: https://www.e-periodica.ch/; e-newspaper, Digitalisierte Schweizer Zeitungen: https://www.e-newspaperarchives.ch; e-pics, Plattform für Bildkataloge der ETH Zürich: https://www.e-pics.ethz.ch.↩︎

  41. Mumenthaler (2017), S. 4.↩︎

  42. Mumenthaler (2017), S. 7.↩︎

  43. Mumenthaler (2017), S. 17-22.↩︎

  44. Schneider (2018), S. 89 und Oesterheld (2018), S. 47.↩︎

  45. EPF Lausanne, HEG/HES-SO, Universität Lausanne, Universität Basel, Universität Zürich, ETH Zürich, Universität Genf und Switch.↩︎

  46. Schneider (2018), S. 91.↩︎

  47. Vgl. dazu Corrado (2017), S. 147-157.↩︎

  48. Oesterheld (2018), S. 51.↩︎

  49. re3data, Registry of Research Data Repositories: https://www.re3data.org/.↩︎

  50. Hirschmann (2018).↩︎

  51. Töwe (2014).↩︎

  52. https://www.unibe.ch/universitaet
    /dienstleistungen/universitaetsbibliothek/service/open_science/index_ger.html
    ↩︎

  53. https://yareta.unige.ch/↩︎

  54. https://www.dlcm.ch/olos/about↩︎

  55. https://swissubase.ch/de/↩︎

  56. Vgl. Starr (2011).↩︎

  57. Beagrie (2019), S. 12.↩︎

  58. Töwe (2014), S. 2.↩︎

  59. Vgl. dazu z.B. das Zürcher Uniarchiv, siehe UZH Archiv (2017, Institutsakten), S. 3, sowie UZH Archiv (2017, Privatarchive), S. 1.↩︎

  60. Gemperli (2002), S. 23.↩︎

  61. Tibelius (2016), S. 6. Ähnlich auch: Nippert (2013), S. 158.↩︎

  62. Nippert (2013), S. 158.↩︎

  63. Masterarbeit von Angela Gastl-Hartmann, Master (MAS ALIS) of Advanced Studies in Archival, Library and Information Science, Universitäten Bern und Lausanne, 2020.↩︎

  64. Becker (2009). Siehe dazu das nachfolgende Kapitel 5.2.↩︎

  65. Huber (2015), S. 44.↩︎

  66. Université de Fribourg (2018, études/grades/diplômes) und Université de Fribourg (2018, Facultés).↩︎

  67. Université de Lausanne, Directive de la Direction 4.5 (2021).↩︎

  68. In der Bibliographie sind die gesetzlichen Grundlagen mit URL aufgelistet.↩︎

  69. ETH Zürich, Reglement für das Archiv der ETH Zürich vom 3.12.2002. Art. 3 Abs. 4.↩︎

  70. Huber (2015), S. 44.↩︎

  71. Bütikofer (2008), S. 35.↩︎

  72. Kanton Bern, Gesetz über die Archivierung (ArchG), Art. 3.↩︎

  73. ArchG, Art. 5 Abs. 2.↩︎

  74. Universität Bern, Reglement über die Archivierung, Art. 10 Archivierungspflicht.↩︎

  75. Universität Bern, Reglement über die Archivierung, Art. 1 Zweck.↩︎

  76. Nippert (2013, S. 155) konstatiert Vergleichbares für deutsche Hochschularchive.↩︎

  77. Siehe dazu die in Kapitel 4.2 erwähnte Umfrage.↩︎

  78. Schellenberg (1990).↩︎

  79. Keitel (2015), Folie 3-4. Siehe auch Keitel (2018), S. 99-121, besonders S. 105.↩︎

  80. Keitel (2015), S. 6.↩︎

  81. Becker (2009), S. 10.↩︎

  82. Becker (2009), S. 33-34.↩︎

  83. Becker (2009), S. 34.↩︎

  84. Becker (2009), S. 14.↩︎

  85. Whyte (2010).↩︎

  86. Whyte (2010), S. 4-6.↩︎

  87. Beagrie (2019), S. 5.↩︎

  88. Whyte (2010), S. 5-6.↩︎

  89. Vgl. dazu Keitel (2018), S. 122-154, bes. S. 124.↩︎

  90. Becker (2009), S. 14, UK Data Service (2018), S. 4.↩︎

  91. Geisser (2016).↩︎

  92. Bicho (2016), S. 249.↩︎

  93. DLCM (2016).↩︎