Nutzen und Grenzen der Formatidentifizierung

Stephanie Kortyla, Christian Treu

Abstract


Digitale Bestandserhaltung erfordert einen Überblick über den Content im eigenen Repository. Dazu gehört u.a. die Formatidentifizierung. Eines der derzeit gängigsten Hilfsmittel dafür ist DROID mit der dahinterliegenden Formatdatenbank PRONOM. DROID erlaubt eine schnelle, automatische Formaterkennung und setzt dabei bei Bedarf verschiedene Methoden ein. PRONOM wird laufend fortgeschrieben und soll so eine aktuell gehaltene Bestandsplanung ermöglichen. In der Praxis haben sich jedoch - zum Teil durch Zufall - einige Herausforderungen, Fehler und Lücken beim Einsatz von DROID/PRONOM erwiesen. Als Beispiel seien (noch) nicht in PRONOM aufgenommene Formate (Verzögerung anstehender Ingests? Platzhalter-ID?), Differenzen bei Ergebnissen je Scaneinstellung und im Vergleich zu anderen Tools sowie generelle Persistenzfragen von PRONOM-IDs genannt. Solche Ereignisse verursachen einen manuellen Mehraufwand beim Ingest sowie insgesamt beim Preservation Planning. Grundlegend zeigt dies, dass Formaterkennung heute zwar schnell und einfach möglich ist und auch sein muss, jedoch auch fehler- und lückenhaft ist und immer sein wird. Nicht zuletzt ergibt sich diese Begebenheit aus einer steten Weiter- bzw. Neuentwicklung von Formaten. Learning by doing, Kompromisse sowie Improvisation an einigen Stellen und Austausch in der Community sind gefragt.

Volltext:

HTML PDF


DOI: http://dx.doi.org/10.18755/iw.2018.9

Refbacks

  • Im Moment gibt es keine Refbacks


Creative-Commons-Lizenz
Dieses Werk steht unter der Lizenz Creative Commons Namensnennung 4.0 International.