Fischen im Trüben

oder eben nicht: Erschliessungsstrategien für einen Bildbestand im unternehmerischen Kontext

Thomas Fink

Einleitung

The primacy of the image“ – das Primat des Bildes[1] scheint Realität geworden zu sein. Fotos sind allgegenwärtig, ihre Bedeutung für die Kommunikation zwischen Menschen wird inzwischen als grösser angesehen als die von Text[2]. Das soll keine wertende Aussage sein – die Anzahl Bilder aber, die täglich gemacht (und manchmal auch publiziert) werden, ist überwältigend. Mit den Möglichkeiten der digitalen Fotografie hat sich die Bilderflut in einen gigantischen Strom verwandelt. Auf Flickr zum Beispiel, der Plattform für Fotografie des Internet-Unternehmens Yahoo, werden jeden Tag 3.5 Millionen Bilder von Amateurfotografen[3] hochgeladen; allein im Jahr 2012 wurden – so wird geschätzt - 350 Milliarden Fotos gemacht[4]. Auf diesem reissenden Fluss – um im Bild zu bleiben – schwimmen riesige Schiffe mit schwerer Fracht, Bildanbieter wie Shutterstock, Corbis oder Getty Images, die mit Gebrauchsfotografie oder Preziosen aus ausgewählten Sammlungen das Bedürfnis nach Bildern zu befriedigen hoffen. Mit der steigenden Bedeutung des Bildes, dem damit verbundenen Anwachsen von Beständen und nicht zuletzt durch die Digitalisierung und die einfachere Zugänglichkeit und Verbreitung von Bildern ergeben sich neue Fragen nach der Art ihrer Ordnung und Erschliessung. Bei analogen Beständen – und dies gilt natürlich grundsätzlich - standen in Bezug auf Ordnung und Findmittel die Bedürfnisse der Mitarbeitenden der jeweiligen Gedächtnisinstitution im Vordergrund. Diese suchten im Auftrag des Kunden“. Heute hat ein Paradigmenwechsel stattgefunden: der Nutzer delegiert nicht mehr, sondern wird selber aktiv und benutzt für seine Suche Findmittel, die ihm erlauben, in entsprechend erschlossenen Beständen genau das zu finden, was er sucht. Im Kontext der Digitalisierung kommt speziell bei Bildern eine weitere Herausforderung dazu: das Übersetzen von visuellen Informationen in Text und das Findbar Machen des Textes resp. seiner Repräsentation für den Nutzer.

Die Bedeutung von Bildern hat auch in der internen und externen Kommunikation des untersuchten Unternehmens, einer global agierenden Firma aus dem Gesundheitsbereich, zugenommen; die Einsatzmöglichkeiten des Bildes im Unternehmen sind mannigfach, und der Bedarf nach entsprechenden Ressourcen ist steigend. Noch um die Jahrtausendwende war der Bilderdienst der globalen Kommunikationsabteilung des untersuchten Unternehmens eine sehr lokale Angelegenheit, der sich alimentierte aus in Schachteln verpackten Dia-Positiven, abgestellt in einem Nebenraum. Heute ist diese Dienstleistung eine unternehmensweit zugängliche Intranet-Plattform mit einem Angebot an verschiedensten visuellen Materialien wie Illustrationen, Fotos, Videos oder Animationen.

Bis März 2017 stand im untersuchten Unternehmen allen Mitarbeitenden ein PhotoLibrary“ genannter Bilder-Service zur Verfügung. Er erfreute sich einer regen Nutzung, die Anzahl eingeschriebener User war hoch, ebenso die Anzahl getätigter Downloads. Die PhotoLibrary aber spiegelte nicht nur den Stellenwert des Bildes in der Kommunikation wieder, zugleich manifestierten sich in ihr auch die durch die veränderten Nutzerbedürfnisse hervorgerufenen neuen Herausforderungen in Bezug auf Ordnung und Erschliessung – Herausforderungen, denen die PhotoLibrary nicht immer gewachsen schien. So wurde dieses Angebot kritisiert, weil in Anbetracht eines stetig steigenden Bedürfnisses der Umfang und die thematische Vielfalt des Bildmaterials zu gering waren. Dazu kamen Probleme bei der usability – bei Suche, Auswahl und Downloading; gerade bei der Suche offenbarten sich Defizite, die teilweise zurückzuführen waren auf nicht fachgerechte Erschliessungen und der inkohärenten, partiell nicht sachgemässen Anwendung und Pflege der dafür notwendigen Erschliessungshilfen.

Aufgrund der Ablösung der PhotoLibrary und der Einführung eines neuen Systems im Frühling 2017 ergab sich eine neue Situation. Dadurch konnten Probleme im Bereich der Performance und der Usability behoben werden. Andere kritische Punkte freilich bleiben weiterhin virulent[5] – auch weil sie eher organisatorische Fragen betreffen, die systemunabhängig relevant sind und bleiben werden; diese sind:

   Die (sinnvolle) Äufnung des Bestandes

   Die Kohärenz der Erschliessungssprache

   Die regelmässige, korrekte Pflege der Daten und des Thesaurus

   Die Sicherstellung von Zuständigkeiten und Kompetenz

Im Vorfeld der Umstellung auf das neue System wurde im für den Bilderdienst zuständigen Team diskutiert, wie die inhaltliche Bilderschliessung organisiert werden kann und welche Werkzeuge dafür zur Verfügung stehen sollen - mit dem Ziel, den Zugang zum Bestand zu verbessern.

In der PhotoLibrary wurde die inhaltliche Bilderschliessung über vier Elemente ermöglicht: die freitextliche Bildbeschreibung (Bildtitel und Bildinhalt), die Verschlagwortung von Bildinhalten anhand eines Thesaurus, bildtypologische Vermerke (sogenannte Kategorien) sowie eine Dossierfunktion für ausgewählte Themenbereiche. Die Probleme in der Bilderschliessung akzentuierten sich v.a. in der Struktur des Thesaurus. In seiner bestehenden Form war er unbrauchbar, da Einsatz und Pflege nicht reguliert waren und so über die Jahre das Potenzial eines kontrollierten Vokabulars ungenutzt blieb. Dennoch war klar, dass auch im neuen System ein Thesaurus Kernstück der inhaltlichen Erschliessung sein soll, da die Vorteile der terminologischen Kontrolle für Erschliessung und Retrieval erkannt wurden. So ergab sich natürlich die Frage: Soll der in der PhotoLibrary implementierte Thesaurus in das neue System übertragen werden – und wenn ja, wie? Dies ist auch die zentrale Fragestellung dieses Artikels, die anschliesst an eine Analyse der verschiedenen Methoden der inhaltlichen Bilderschliessung, wie sie für die PhotoLibrary angewendet wurden.

Theoretische Grundlagen

Was ist ein Bild? Und was begründet seine Wirkungsmacht? Diesen Fragen sind schon verschiedene wissenschaftliche Disziplinen nachgegangen – allen voran die Bildwissenschaften, aber auch die Semiotik. Aus informationswissenschaftlicher Sicht interessieren in Bezug auf die inhaltliche Analyse von Bildern folgende Fragen: Was ist darauf sichtbar, wie lässt sich das Sichtbare benennen, was ist das Thema eines Bildes, und – wenn auch nur am Rande – welche Bedeutung hat das Abgebildete? Ebenso zentral in einem informationswissenschaftlichen Kontext ist die Frage nach der Repräsentation der Bildinformationen als Grundlage der Ordnung und des Retrievals. Die wichtigste Form der Repräsentation visueller Information ist (nach wie vor) ein Text[6]. Auch wenn aufgrund des schnell voranschreitenden technologischen Fortschritts heute vor allem die Möglichkeiten der automatisierten Bilderkennung und –beschreibung im Fokus des theoretischen Diskurses stehen, dominiert in der Praxis immer noch die sprachliche Referenzierung des Sichtbaren.

Nachstehend soll kurz eine Übersicht über jene theoretischen Grundlagen versucht werden, die auch für die Bilderschliessungspraxis von Relevanz sind. Im Zusammenhang mit dem Thema dieser Arbeit interessieren zum einen die Bildanalyse, da sie Anhaltspunkte darüber geben kann, nach welchen Regeln Bilder beschrieben und indexiert werden können, zum anderen das weite Feld der Wissensrepräsentation und –organisation. Die Literatur dazu ist sehr umfangreich; ich habe mich im Wesentlichen auf die Publikationen von Stock, Gödert und de Keyser abgestützt, weil sie immer auch einen speziellen Fokus auf das Thema Bilderschliessung richten.

Die inhaltliche Bildanalyse

In Bezug auf die inhaltliche Bildanalyse werden in der Literatur drei unterschiedliche Ansätze diskutiert: die high level“-Analyse, d.h. die intellektuelle Analyse und deren Repräsentation in Text, die content-basierte low-level“-Analyse, d.h. die maschinen-gestützte Analyse von Bildmerkmalen sowie kombinierte Ansätze[7]. Im Folgenden möchte ich mich auf die beiden erstgenannten, die high level“- und die low-level“-Analyse beschränken.

High-level-Analyse

1986 publizierte Sara Shatford ihren Aufsatz Analyzing the Subject of a Picture: A theoretical Approach“[8]; er bleibt bis heute der Referenztext zum Thema der inhaltlichen Bildanalyse im Umfeld der Informationswissenschaft. Corinne Jörgensen et al. haben später mit ihrem Pyramiden-Modell Shatfords Ansatz aufgegriffen und weiterentwickelt[9], und auch Peter Ensers Indexierungsmodell verleugnet das Vorbild Shatford nicht[10].

Shatford selber bezieht sich in ihrem Ansatz auf die Überlegungen des Kunsttheoretikers Erwin Panofsky zur Bildbetrachtung. Dieser unterscheidet dabei drei Ebenen:

1.   die vor-ikonographische Beschreibung z.B. von Formen, Farben, abgebildeten Figuren oder Objekten; diese Beschreibung kann faktisch oder expressiv sein.

2.   die ikonographische Analyse, d.h. die Verortung des Sichtbaren in einem kulturellen, auch individuellen Kontext.

3.   die ikonologische Ebene, auf der eine Interpretation des zuvor Beschriebenen und Analysierten geleistet wird[11].

Basierend auf Panofskys Theorie schlägt Shatford ein Klassifizierungssystem für Bildinhalte vor, dass diese auf vor-ikonographischer und ikonographischer Stufe in Ofness und Aboutness unterteilt[12]. Of-Worte beschreiben im Bild manifeste Objekte – und zwar allgemein (Generic Of: ein Gebäude) und spezifisch (Specific Of: das Empire State Building). About-Worte hingegen beschreiben von Bildern transportierte Stimmungen oder abstrakte Konzepte[13]. Schliesslich verbindet Shatford diese drei inhaltlichen Kategorien (Generic Of, Specific Of, About) mit sogenannten Facetten, also einer Teilbegriffsordnung, die quer zu einer Wissensordnung steht[14], und mit der jeweils nach dem Wer, Was, Wann und Wo in einem Bild gefragt werden kann[15].

Jörgensens et al. Pyramiden-Modell verbindet Shatfords inhaltlichen Ansatz mit Aspekten der bild-formalen Analyse[16]. Dieses unterscheidet zwischen syntaktischen Ebenen – bezogen auf Aspekte der Wahrnehmung, genauer die physikalische Beschaffenheit des Bildes[17] - und sechs semantischen Ebenen, anhand derer Objekte und Szenerien allgemein und spezifisch beschrieben, resp. das abstrakte Konzept, das sie darstellen, bezeichnet werden können[18].

Ensers Modell wiederum präzisiert Shatfords Systematik weiter, zentral bleibt aber auch bei ihm die Unterscheidung zwischen Generischem und Spezifischem. Enser definiert vier Stufen:

   Generic Object Instance: die Identifizierung des Abgebildeten

   Generic Object Class Hierarchy: Spezifizierung aufgrund von Wissen

   Specific Named Object Class: Zuordnung eines Objekts zu einer spezifischen Klasse

   Specific Named Object Instance: Einzigartiger Name eines Objects

Ähnlich wie bei Shatford beinhaltet auch Ensers Ansatz Facettierungen – in diesem Fall Facetten des Ortes, der Zeit und für Aktivitäten/Ereignisse -, die wiederum in spezifische und generische Aspekte unterteilt werden[19].

Alle beschriebenen Modelle haben den Nachteil – und dies trifft natürlich auch auf andere, nicht-bildliche Dokumente zu –, dass die inhaltliche Erschliessung stets subjektiv ist. Schon Jörgensen stellte fest:

(…) indexing [visual] information can be particularly complex for several reasons. First, visual content carries information at many different levels (…). Second, descriptions of visual content can be highly subjective.“[20]

Das Primat der Subjektivität zeigt sich in allen beschriebenen Modellen der Inhaltsanalysen. Deutlich wird dies v.a. in Bezug auf die Aboutness, d.h. die Aussage darüber, welche Idee (abstraktes Konzept) oder Stimmung (Expressivität) mit einem Bild vermittelt wird. Aber auch die Bezeichnung des spezifischen Ofs, also die ikonographische Analyse, ist immer abhängig von den Kenntnissen und dem kulturellen Hintergrund der analysierenden Person. Kommt hinzu, dass neben der Interpretation des Sichtbaren auch die Frage nach der Erschliessungstiefe und -hierarchie, d.h. Abfolge der zu beschreibenden Bildinhalte eine individuelle ist[21].

Low-level-Analyse

In der Forschung über die Inhaltsanalyse von Bildern hat sich der Fokus seit Ende des letzten Jahrtausends verschoben[22], weg von der intellektuellen hin zu einer automatischen Analyse. Und damit verschiebt sich auch der Fokus der Analyse selber. Die konzept-basierte, oder eben high level“-Analyse, zielt, mit Jörgensen gesprochen, auf die semantische Ebene des Bildinhaltes[23], die content-basierte, die low level“-Analyse auf automatisch erkennbare Bildmerkmale. Diese Methode, das sogenannte Content-based Image Retrieval“ (CBIR), ermöglicht eine Bilderschliessung auf der Basis von Farb-, Textur- und Formmerkmalen.“[24] CBIR-Systeme allerdings, und das zeigt auch der aktuelle Diskurs, haben ihre Schwächen und ermöglichen in ihrer heutigen Form nur Recherchen mit eng begrenzter Zielsetzung.“[25] Im Retrieval lassen sie nur Treffer zu, die sehr ähnlich oder gleich sind zu vordefinierten Beispieldokumenten. Da es aber keine Verknüpfung gibt zwischen low level“, d.h. syntaktischen Merkmalen und den in Sprache gefassten Beobachtungen in der high level“-, d.h. semantischen Analyse, entsteht ein sogenannter semantic gap. De Keyser schreibt dazu:

CBIR systems index and retrieve images based on their low-level features, such as colour, texture, and shape, and it is difficult to find desired images based on these low-level features, because they have no correspondence to high-level concepts in humans´minds. This is the so-called semantic gap problem.“[26]

Methoden der Wissensrepräsentation und Wissensordnung

Nur die menschliche Kognition und die Vermittlung des Erkannten in Sprache können diesen semantischen Graben überbrücken. Entsprechend herrschen in der (Bild)-Suche und Erschliessung noch immer sprachbasierte Methoden vor. Wie vorher gezeigt, gelangt man von der Analyse des Bildinhalts zu einer sprachlichen Repräsentation – Benennungen – der im Bild manifesten Objekte und Szenerien, abstrakten Konzepte und Emotionen[27]. Gödert et al. schlagen vor, bei der Inhaltsanalyse und Bildbeschreibung wie folgt vorzugehen:

   Beschreibung der Ofness

   Beschreibung der Aboutness

   Schwerpunktsetzung: Zentralmotiv, Wichtiges / Unwichtiges, Vorder- / Hintergrund

   Kontextinformationen[28] (z.B. zu Ort, Zeit, Ereignissen, etc.)

Beschreibend entsteht zunächst ein Text. Diesen Text gilt es anschliessend in ein Vokabular der Inhaltsrepräsentation, in eine Dokumentationssprache zu übersetzen[29]. Gödert schreibt dazu:

Umso wichtiger ist für die Erschliessung von Bildern (…) das Vorhandensein von begrifflichen Repräsentationen für Gegenstände oder Themen, die unabhängig von den Dokumenten sind. Auf diese Repräsentationen müssen im Vorgang Erschliessung die aus der Inhaltsanalyse gewonnenen Erkenntnisse abgebildet werden.“[30]

Und weiter:

Zielsetzung für den Einsatz von Dokumentationssprachen ist der Findeerfolg bei Suchvorgängen. Dieser Findeerfolg wird entscheidend durch die Konsistenz und Homogenität der für eine Suche verwendeten Sprachelemente beeinflusst. (…) Wichtigste Massnahme zur Herstellung von Homogenität ist es, in einer Dokumentationssprache Varianten von Wörtern zu vermeiden (…). Die Zielvorstellung ist, dass ein Element einer Dokumentationssprache immer nur eine Bedeutung haben und eine Bedeutung immer durch dasselbe Element ausgedrückt werden soll.“[31]

Die verschiedenen Formen von Dokumentationssprachen sind hinlänglich bekannt und lassen sich wie folgt aufteilen:

   Kontrollierte Vokabulare (Nomenklatur, Klassifikation, Thesaurus, Ontologie)

   Methoden der freien Verschlagwortung (Social Tagging, Folksonomies)

   Abstracting[32]

Im Zusammenhang mit der Verschlagwortung (Indexierung) wird in der Theorie zudem noch unterschieden zwischen automatisierten – probalistische und regelgeleitete Indexation, auf die hier nicht näher eingegangen werden soll[33] - und intellektuellen Verfahren. Aufgrund der Fragestellung dieser Arbeit fokussiere ich auf die kontrollierten Vokabulare, speziell den Thesaurus. Seine Vorteile liegen, auch unter Berücksichtigung von Göderts Aussage (s.o.), auf der Hand: Zum einen kann wegen der Begrenztheit des Vokabulars und wegen der terminologischen Kontrolle idealiter in der Erschliessung eine grosse Konsistenz erreicht werden, zum anderen bewirken das kontrollierte Vokabular und die gesetzten Relationen zwischen den darin enthaltenen Begriffen (Deskriptoren) eine hohe Flexibilität und Varianz im Retrieval, konkret die Ausweitung der Suche auf verwandte und übergeordnete Themen (Oberbegriffe) oder die Eingrenzung der Suche in ein Teilthema (Unterbegriff). Zudem wird über die terminologische Kontrolle ermöglicht, Synonyme und Schreibweisen bei der Sucheingabe zu neutralisieren.

Dies bedeutet aber, dass das Einrichten und Pflegen von kontrollierten Vokabularen mit erheblichem Aufwand verbunden ist. Sie bedingen bei den Verantwortlichen Expertise in Bezug auf das durch den Thesaurus abgebildete Wissensgebiet, organisatorische Planung, ein verbindliches Regelwerk und nicht zuletzt eine profunde Kenntnis der Nutzerbedürfnisse.

In der Praxis der Bilderschliessung dominieren Konzepte basierend auf Methoden kontrollierter Vokabulare. Standardisierte Thesauri – die bekanntesten sind wohl ICONCLASS, Thesaurus for Graphic Materials und Art & Architecture Thesaurus[34] – und Metadatenstandards wie Dublin Core können diese unterstützen, wie und wie oft sie in der Praxis tatsächlich eingesetzt werden, kann an dieser Stelle nicht abschliessend beurteilt werden.

Die Bilddatenbank PhotoLibrary“

Profil

In der globalen Kommunikationsabteilung des untersuchten Unternehmens wird ein Digital Asset Management System eingesetzt, das die Erfassung des Produktionsprozesses für audio-visuelle Medien sowie deren Verwaltung und Nutzung ermöglicht. Die Applikation beinhaltet eine Workflow-Komponente MediaManager, in der Fotos aus Bildproduktionen für die (Wieder)benutzung ausgewählt, erschlossen und freigeschaltet werden können. Darin befanden sich zum Zeitpunkt der Untersuchung 158’395 Fotos (unerschlossen, gesperrt / nicht freigegeben, freigegeben). Davon waren 5400 Bilder freigegeben“, d.h. über eine im Intranet zugängliche Plattform, die MediaLibrary, für alle Mitarbeitenden und Externe[35] recherchier- und downloadbar.

Neben dem Fotobestand, suchbar über die Komponente PhotoLibrary, ermöglicht die MediaLibrary den Zugang zu weiteren audio-visuellen Produkten wie Videos, Illustrationen, Logos, etc. Zudem sind auf dieser Plattform Kontaktinformationen und diverse Beratungsangebote ausgewiesen.

Die MediaLibrary ist ein rege genutzter Service. Seine starke Nutzung gründet in der zunehmenden Bedeutung des Bildes und bildhafter Formen in der Kommunikation und damit einhergehend in einem stetig ansteigenden Bedarf nach entsprechenden Materialien. Die über 14´0 registrierten Nutzer – für die Recherche und Bilderdownloads ist eine persönliche Anmeldung unabdingbar – haben 2014 im Durchschnitt gut 400 Bilder täglich heruntergeladen.

Der Bestand in der PhotoLibrary ist zeitgemäss, d.h. die auf den Bildern abgebildeten Objekte, Personen etc. besitzen Aktualität und Gültigkeit, die Bilder selber entsprechen (mehr oder weniger) der aktuell verbindlichen Bildsprache des Unternehmens. Thematische Schwerpunkte sind Produkte, Personen (Management), Standorte und Anlagen, Mitarbeitende (Sitzungen, Einsatz von IT, Gespräche, etc.) sowie Symbolbilder aus den unternehmensrelevanten Themenbereichen[36].

Prozessbeschreibung

Ein Fotograf übermittelt die im Rahmen eines Auftrags gemachten Bilder an das System MediaManager. Dabei werden Auftragsnummer, inhaltliche Angaben zum Auftrag selber sowie technische Informationen zum einzelnen Bild (Angaben zu Bildformat- und dimension, aufnahmetechnische Informationen) automatisch übernommen und in der Erschliessungsmaske dem Indexierer[37] angezeigt. Ebenso automatisch mitgeliefert werden Zeit und Datum der Aufnahme. Hat der Fotograf seine Kamera entsprechend konfiguriert, könnte auch ein Copyrightvermerk (Angabe der Urheberschaft) mitgeliefert werden. Der Fotograf hat zudem die Möglichkeit, seine Bilder vor der Übermittlung mit einem Bildtitel und einem beschreibenden Text zu versehen – es ist hier also eine Form des Datentransfers möglich, die vergleichbar ist mit IPTC[38]-Protokollen, die v.a. im Bereich des Journalismus genutzt werden.

Der Indexierer wählt aus den unter einer Auftragsnummer zusammengefassten Bildern diejenigen aus, die er für eine bestimmte Art der Nutzung zugänglich machen will. Die Auswahl wird dabei geleitet von Kriterien wie der Relevanz des Dargestellten in Bezug auf das Thema und seine Aktualität sowie in Bezug auf die Erfüllung gestalterischer Vorgaben.

Pro Jahr produzieren die beauftragten Fotografen ca. 25’0 Bilder; davon wurden 2013 2800, 2014 noch 982 Bilder ausgewählt, erschlossen und für die PhotoLibrary freigeschaltet.

Die eigentliche Erschliessung beinhaltet im Wesentlichen zwei Aufgaben: zum einen das Definieren von Berechtigungen, zum anderen die inhaltliche Bildbeschreibung. Mögliche Formen der Berechtigung sind z.B. der Status gesperrt“, temporäre oder partielle Berechtigungen und Freigabe“. Letztere bedeutet, dass das Bild auf dem für alle registrierten Nutzer zugänglichen Intranet-Portal PhotoLibrary such- und downloadbar ist. Für die inhaltliche Erschliessung stehen dem Indexierer vier Komponenten zur Verfügung:

   Freitextfelder (eines für den Bildtitel, eines für die Bildbeschreibung, die sog. caption)

   Stichworte: Verschlagwortung mit dem systemimmanenten Thesaurus

   Themenbaum/Klassifikationsobjekte: ermöglicht die Zuordnung eines Bildes zu einem Themen-Dossier

   Kategorien: bildtypologische Verweise (z.B. Luftaufnahme, Produkt- oder Architekturbild, etc.)

Der Indexierer hat zudem die Aufgabe, bei auf Bildern erkennbaren Personen sogenannte consent forms, d.h. die Erlaubnis für die Freigabe ihres“ Bildes einzuholen.

Zentral für die inhaltliche Erschliessung ist natürlich, dass der Indexierer Zugang zu Informationen über die Bildinhalte hat. Aber der Weg zu diesen Informationen ist oft ein beschwerlicher. Grundsätzlich gibt es zwei Möglichkeiten: Der Fotograf erstellt beim Fotografieren bereits genaue Beschreibungen; oft sind aber die Angaben des Fotografen äusserst rudimentär und beschränken sich in den meisten Fällen auf einen Auftragstitel. Dies liegt zum einen daran, dass der Fotograf unter erheblichem Zeitdruck steht, zum anderen sind die Bildinhalte meistens sehr technisch und speziell, sodass für deren korrekte Beschreibung eine gewisse Expertise vonnöten ist. Da also in der Erfassung und Realisierung eines Auftrags nur spärliche Informationen zu Bildinhalten entstehen, ist es schliesslich dem Indexierer überlassen, diese bei den Experten, die vertraut sind mit den im Bild dargestellten Tätigkeiten, Apparaturen, etc., einzuholen - ein aufwändiges und zeitraubendes Verfahren.

Probleme bei der inhaltlichen Erschliessung

Meine nachstehende Beschreibung über die aktuelle Situation in der Bilderschliessung basiert auf eigenen praktischen Erfahrungen mit dem System sowie einer Analyse des Thesaurus und Gesprächen mit den Entwicklern des MediaManagers und mit einer Gruppe von ausgewählten Systemnutzern im Unternehmen.

In einer internen Umfrage 2013 wurden die Nutzer zu den Angeboten der Media Library im Allgemeinen und der darin integrierten Bilddatenbank PhotoLibrary im Speziellen befragt. Dabei wurden Angebot und usability stark kritisiert; etwa, dass die PhotoLibrary grundsätzlich zu wenig Fotos anbiete und thematisch sehr eingeschränkt sei, dass die Benutzerfreundlichkeit (Anmeldeverfahren, Downloading, etc.) zu wünschen übriglasse und dass zudem die Suche oft keine oder nicht die gewünschten Resultate generiere.

Neben den oben genannten Problemen im Bereich der usability wurde erkannt, dass die Qualität der inhaltlichen Erschliessung, die sehr disparat und zum Teil eben auch ungenügend ist, mit ein Hauptgrund dafür ist, dass sich auf dem Weg zum passenden Bild beim Nutzer oft Frustrationen einstellen. Die Gründe dafür sind systemisch bedingt und organisatorischer Natur, zudem fehlen verbindliche Regeln für das Beschreiben von Bildern und für die Benutzung der dafür einsetzbaren Komponenten und Tools.

Wie bereits im Theorieteil dargelegt, wird die Qualität der Beschreibung u.a. bestimmt durch die Kenntnisse der Indexierer über die spezifischen Bedürfnisse der Nutzer, den Zugang zu einer Dokumentationssprache und die Existenz verbindlicher (Indexierungs)regeln. Für die PhotoLibrary kann festgestellt werden, dass die beiden letztgenannten Punkte nur bedingt erfüllt werden.

Thesaurus

Fast schon exemplarisch“ dafür steht der im MediaManager implementierte Thesaurus. Tatsächlich zeitigte eine vertiefte Analyse der durch den Thesaurus ausgewiesenen Begriffsstruktur u.a. nachstehende Inkonsistenzen und Fehler:

a)      Es wurden sehr viele Begriffe definiert, aber nur wenige Relationen

b)    Schreibweisen werden nicht in Relation (synonym), sondern als eigenständige Begriffe ohne Relationen gesetzt. Beispiele:

   weibl./männl. Form: Künstlerin/Künstler

   uneinheitliche Schreibweisen von Kompositaformen

   Gross-Kleinschreibung: portrait/Portrait ODER landschaft/Landschaft

   Singular/Plural: Qualitätskontrolle/Qualitätskontrollen ODER Produkt/Produkte ODER Lehrling/Lehrlinge

   falsche Schreibweisen: für den Begriff Porträt/Portrait z.B. existieren die Schreibweisen Portrat/Portraut/Portrsait/Portrtait/Porttrait

   Unterschiedliche Schreibweisen von Eigennamen

   Umlaute: Gespräch/Gespraech ODER Frühling/Fruehling

c)   Grundsprache des Thesaurus ist Deutsch; es wurden aber auch englische Begriffe definiert ohne Übersetzung

d)     Adjektive als Begriffe: tiefgreifend

e)      Personennamen mit Anrede

f)      Datumsangaben als Begriffe: 2013, 2014, 22.9.2011

g)      Örtlichkeiten (generisch): 3.OG, 4. Obergeschoss

h)     Bildbeschreibungen werden als Begriff gesetzt: Portrait Frau Tessa Chapman[39]

i)       falsche Zeichen: &, a

j)       nicht-definierte Kürzel

k)     Phrasen: top ten by 2015 / ORA-1403: no data found

Themenbaum/Klassifikationsobjekte

In den Klassifikationsobjekten in der Nutzeransicht werden Themen mit Angaben der Ordnung (Collections“) oder bildtypologischen Verweisen (Themed photo shoots“) vermischt.

Und: Eine genauere Unterteilung von Themenbereichen wäre manchmal sinnvoller; so sind die Mitglieder der Konzernleitung zwar alle über den Menu-Punkt Corporate Executive Committee“ abrufbar, allerdings werden die in dieser Subkollektion eingestellten Bilder chronologisch geordnet – eine weitere Unterteilung der Baumstruktur aufgrund der einzelnen Personen wäre an dieser Stelle sinnvoller.

Freitextfelder

Wie nachstehende Abbildungen zeigen, werden die Textfelder (Bild)titel und –beschreibung sehr unterschiedlich befüllt. Stichproben ergaben die folgenden Auffälligkeiten, die aber nicht als abschliessend repräsentativ für die Inkonsistenz in der freitextlichen Bildbeschreibung stehen. In Abbildung 1 wird ersichtlich, dass der Titel ein Ausschnitt aus dem Beschreibungstext ist.


 

 

 

 

Abbildung 1

Abbildung 2 und 3 zeigen grosse Unterschiede der inhaltlichen Beschreibung; zum einen knappe, zu generische Beschreibungen,


 

 

 

 

Abbildung 2

oder solche mit (unnötig vielen) Kontextinformationen:


 

 

 

 

 

 

Abbildung 3

Ebenso inkonsistent ist die Handhabung des Feldes Titel“, das – wie z.B. in Abbildung 4 – nur Kontextinformationen ohne Referenz auf das Abgebildete oder eine (kurze) textliche Repräsentation des Sichtbaren (Abbildung 5) beinhaltet:


 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Abbildung 4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Abbildung 5


Organisation

In Gesprächen mit den Entwicklern der Applikation MediaManager und mit Personen aus einer Gruppe von internen Systemnutzern wurde evident, dass die vorab dargelegten Inkonsistenzen und Fehler bei den Bildbeschreibungen und Indexierungen sowie das Begriffswirrwarr im Thesaurus in erster Linie bedingt sind durch die Art und Weise, wie die Bilderschliessung organisiert ist, und durch den Umstand, dass dort, wo inhaltliche Bildinformationen vermerkt werden – beim Produzenten während der Übertragung der Bilder ins System, bei der eigentlichen Bilderschliessung und Pflege des Thesaurus -, keine für diese Tätigkeiten verbindlichen Regeln vorhanden sind.

In Bezug auf die Organisation fällt auf, dass die Zuständigkeiten für die Bilderschliessung nicht klar geregelt und dass die personellen Ressourcen eingeschränkt sind. Sicher, die Applikation MediaManager ist sehr mächtig, aber auch komplex, und bietet entsprechend viele Möglichkeiten für die Verwaltung von Bildern und anderen digital assets; das heisst aber auch, dass mit einem solchen System die Pflege und Erweiterung des Bildbestandes ressourcen-intensiv ist und eine klare Regelung bezüglich der Zuständigkeiten und Verantwortlichkeit benötigt.

Lösungsszenarien

Soweit die Ausgangslage. Aufgrund der vorgängig beschriebenen Situation hat sich die innerhalb des Unternehmens für die PhotoLibrary zuständige Abteilung entschlossen, den Thesaurus zu erneuern, um so zumindest teilweise eine Verbesserung beim Retrieval zu erzielen. Im Folgenden soll dargelegt werden, welche Bedingungen mit dieser Erneuerung verknüpft sind und welche Lösungsszenarien sich anbieten.

Die Ausarbeitung von Lösungen geschah in erster Linie im Dialog mit dem Systementwickler und Systemanwendern; zugleich hat mich darüber hinaus auch interessiert, wie in anderen Institutionen die Abläufe der Bilderschliessung gestaltet sind. Dazu habe ich Personen kontaktiert, die in Bildarchiven und –agenturen tätig sind, resp. für solche (und vergleichbare) Einrichtungen beratend tätig sind. Angefragt wurden zehn Personen, fünf davon waren bereit, mir einen Einblick in ihre Institution und Arbeit zu gewähren und die Situation bei der PhotoLibrary zu diskutieren; sie wurden auch aufgefordert, zu den Lösungsszenarien Stellung zu nehmen. Basis der Gespräche war ein Fragebogen, anhand dessen die jeweilige Institution charakterisiert und die verschiedenen Vorgehensweisen bei der Bilderschliessung festgehalten werden konnten.

Kriterien für eine Erneuerung

In Absprache zwischen Systementwickler und der Anwendergruppe im Unternehmen wurden die nachstehenden Massnahmen vorgeschlagen:

   Ein clean-up des bestehenden Thesaurus

   Die Etablierung von Methodenstandards zur Pflege und Nutzung des Thesaurus

   Allgemeine Etablierung von Methodenstandards zur Beschreibung von Bildern

Von Seiten der Anwender wurde formuliert, dass auf die Vorteile eines kontrollierten Vokabulars nicht verzichtet werden soll; diese Vorteile wären auf der Nutzer-, resp. der Retrieval-Seite:

   das Suchergebnis lässt sich eingrenzen (Unterbegriffe)

   das Suchergebnis lässt sich ausweiten (Oberbegriffe)

   das Suchergebnis verweist auf Bilder mit ähnlichem Inhalt

   eine Synonym-Verwaltung (Synonyme, Schreibweisen, etc.) ermöglicht, verschiedene Bezeichnungen für den gleichen Sachverhalt in einem verbindlichen Begriff zu repräsentieren

Zudem wird anerkannt, dass der Thesaurus wegen der (potentiellen) terminologischen Kontrolle konsistente Bildbeschreibungen gewährleistet.

Weiter wurden für einen clean-up als Voraussetzungen definiert: in Zukunft soll der Thesaurus nur noch einsprachig, auf Englisch, geführt werden; er muss über Excel oder XML in eine andere Software-Umgebung migriert werden können; und: wenn immer möglich soll der Prozess des clean-ups automatisiert werden. Dies beträfe in erster Linie den Abgleich des erneuerten Vokabulars auf die "alten" Verschlagwortungen der einzelnen Bilder.

Ziel ist ein bereinigtes Vokabular und bereinigte Begriffsrelationen im Thesaurus und als Konsequenz die Anpassung der Metadatenstruktur des bestehenden Bestandes.

Szenarien

Der Zeitpunkt der bereits erwähnten Nutzerumfrage (2013), aber auch weitere Dokumente und Korrespondenzen, die zwischen den Systemanwendern und dem Systementwickler ausgetauscht wurden, zeigen, dass die Problematiken in der Bilderschliessung hinlänglich bekannt waren und die entsprechenden, oben beschriebenen Massnahmen und die Voraussetzungen, unter welchen diese umgesetzt werden sollten, bereits 2014 definiert wurden. Die nachstehenden Lösungsansätze waren also zum Teil schon vorhanden, sie wurden aber im Rahmen meiner Auseinandersetzung mit dem Thema ergänzt und präzisiert.

Die folgenden Szenarien waren Grundlage meiner Diskussionen mit den Systementwicklern und den Experten, d.h. Personen, die sich beruflich mit dem Thema Bilderschliessung“ auseinandersetzen. Aufgrund der vorhin genannten Kriterien standen in der Evaluation Thesaurus-gestützte Lösungen im Vordergrund, daneben aber wurden zumindest im Ansatz mit den Experten auch weitere Methoden diskutiert; die in Frage kommenden Erschliessungsstrategien lassen sich demnach in Thesaurus-basierte, automatisierte und freitextliche“ einteilen.

 

Die Lösungsszenarien im Einzelnen sind:

 

Bewertung der Szenarien

Es hat sich gezeigt, dass in der Expertengruppe Einstimmigkeit darüber herrscht, dass grundsätzlich an der Benutzung eines kontrollierten Vokabulars festzuhalten sei; die Gründe dafür sind vielfältig. In erster Linie natürlich – und das ist wohl ganz banal – wurde darauf verwiesen, dass ein Thesaurus ja schon angelegt sei und bei korrekter Pflege aufgrund der möglichen Standardisierung der Beschreibungssprache Vorteile bei der Erschliessung und im Retrieval bringe – gerade auch im Hinblick auf die Perspektive der Bestandesgrösse, die tendenziell zunehmen wird. Favorisiert wird also v.a. eine Lösung mit einer Bereinigung des Thesaurus (A oder B), was je nach Ausführung mit grösserem (B) oder kleinerem Aufwand (A) verbunden ist.

Das Szenario Löschung“ (C) kommt aber auch in Frage, obwohl mit mehr Aufwand verbunden; dieser sei aber – betroffen wären ja ca. 5500 Datensätze - sehr überschaubar.

Entscheidend für alle Lösungen ist natürlich, dass sich die Thesaurus-Bereinigungen im Bereich der Begriffe und der Begriffsrelationen schliesslich auch in den Datensätzen sprich Indexierungen manifestieren, d.h. am besten in einem automatisierten Abgleichverfahren auf diese übertragen lassen.

Obwohl attestiert wurde, dass der Einsatz eines kontrollierten Vokabulars sinnvoll sei, wurde die Frage aufgeworfen, ob bei einem so kleinen Bestand eine aufwändige Verschlagwortung Sinn mache – und ein Szenario G nicht eine mögliche Variante sein könnte. Gerade das heutige Nutzerverhalten zeige, dass die Möglichkeiten der Verschlagwortung selten genutzt werden, da User eine äusserst einfache Suchstrategie verwenden, bereit, eine grosse Treffermenge in Kauf zu nehmen. In vielen Fällen würden die Möglichkeiten einer komplexeren Such-Strategie – z.B. Suche über Verschlagwortung oder Facetten – nur von Spezialisten genutzt.

Es muss an dieser Stelle festgehalten werden, dass die automatisierten Verfahren (E und F) nur peripher thematisiert wurden. In Bezug auf content“-basierte Erschliessung muss von einem zurzeit noch wenig erprobten und damit auch einem Verfahren gesprochen werden, mit dem keiner der Experten Erfahrungen hatte; in Bezug auf automatisiertes Tagging bestehen zudem in der Expertengruppe Zweifel wegen der Genauigkeit und Effizienz fürs Retrieval. Wie auch schon de Keyser ausführt, verunmöglichen automatisierte Indexierungsverfahren begriffliche Kohärenz, missachten Begriffsähnlichkeiten und –gleichheit bei Synonymie, divergierenden Schreibweisen und Übersetzungen und haben das Potenzial, unpräzise sowie unnötige Begriffe zu extrahieren[40]. Halbautomatische Verfahren schliesslich, so die Meinung in der Expertengruppe, basieren auf dem Abgleich mit intellektuell erstellten und gepflegten Wortlisten, was wiederum mit einem erheblichen Aufwand verbunden ist.

Einstimmig auf Ablehnung stösst in der Expertengruppe die Idee einer Implementierung eines fertigen“ Thesaurus. Die Erfahrungen zeigen, dass dies immer mit aufwändigen Anpassungsarbeiten verbunden ist, weil Begriffe und Relationen im eingekauften Thesaurus geändert, ergänzt und gelöscht werden müssten. Es ist klar, dass solche Anpassungen auch auf das untersuchte Unternehmen zukämen, zumal die PhotoLibrary Bilder enthält, die zum einen sehr speziell, d.h. auch sehr technisch sind, zum anderen allgemeine, symbolhafte Inhalte zeigen. Eine Erkundung im Markt (Herbst 2016) ergab, dass ein solcher Thesaurus, der die geforderte spezifisch-thematische Tiefe und zugleich eine universelle thematische Breite besitzt, nicht existiert.

Ebenso klar kam zum Ausdruck, dass die bereinigenden Massnahmen beim Thesaurus zwingend verknüpft werden müssen mit solchen im organisatorischen Bereich; dies betrifft auf der einen Seite die Situation in Bezug auf Zuständigkeit, Regelmässigkeit und Kompetenz, auf der anderen die Etablierung von Regeln in Form von Handbüchern und Anleitungen.

 

Konkret:

   Konsistenz in der Erschliessung wird gewährleistet durch die Festschreibung von Regeln, wo festgehalten wird, wie ein Bild beschrieben werden muss, d.h. wie die verschiedenen Kategorien der inhaltlichen Erschliessung (Freitext, Thesaurus, Kategorien, Themenbaum) genutzt werden müssen.

   Eine Person ist zuständig für die Pflege des Thesaurus.

   Die Erweiterung und Pflege des Bestandes, sowie die Datenpflege allgemein sind Aufgaben, die der Regelmässigkeit bedürfen.

Mit den Experten diskutiert wurde auch die Frage, ob Personen, die Bilder im Rahmen einer Bestandeserweiterung auswählen, erschliessen und recherchieren, Spezialisten sein müssen, d.h. eine Ausbildung in den Bereichen Archiv, Bibliothek oder I+D oder eine entsprechende Berufserfahrung vorweisen müssen. Diese Frage wurde unterschiedlich beantwortet: sie wird zum einen bejaht, zum anderen wird betont, dass eine Affinität zum Medium Bild oder vertiefte Kenntnisse der relevanten Themen in Bezug auf das betriebliche, resp. institutionelle Umfeld wichtiger seien.

Empfehlung

Wie vorhin ausgeführt, hat eine vertiefte Analyse der inhaltlichen Metadaten gezeigt, dass die Inkonsistenzen und Fehler bei den Bildbeschreibungen und den Indexierungen, die u.a. verantwortlich sind für die unbefriedigende Situation beim Retrieval, zurückzuführen sind auf systemische (bedingt) und organisatorische Defizite.

Ebenso wurde deutlich, dass eine Verbesserung der Erschliessungsqualität erreicht werden kann durch eine Bereinigung der Termini und Begriffsrelationen im Thesaurus. Vorgezeichnet ist dieser Weg natürlich auch dadurch, dass die Systemanwender an einem kontrollierten Vokabular festhalten wollen, da es sowohl in der Erschliessung durch Standardisierung als auch im Retrieval Vorteile mit sich bringt.

Zieht man diese (einigermassen eng definierten) Bedingungen in Betracht, werden Thesaurus-gestützte Erschliessungskonzepte bevorzugt. Die Szenarien A und B – beide basierend auf einer Bereinigung des bestehenden Thesaurus – bieten sich dabei am ehesten an; die Implementierung eines fertigen“ Thesaurus ist nicht empfehlenswert, die Lösung C – Neuaufbau der inhaltlichen Metadaten und des Thesaurus – doch mit einem erheblichen Aufwand verbunden. Favorisiert wird das Szenario B, da mit ihm neben einer terminologischen Bereinigung im Thesaurus auch die weiteren retrieval-unterstützenden Elemente – die Klassifikationsobjekte (Dossierfunktion) und Kategorien (bildtypologische Vermerke) – einer Überprüfung und Bereinigung in Bezug auf Struktur und Inhalt unterzogen werden können.

Wie oben dargelegt ist es zudem dringend erforderlich, ein Regelwerk für die Nutzung und Pflege des Thesaurus sowie für die freitextliche Bildbeschreibung und die Anwendung von Kategorien und Klassifikationsobjekten zu definieren und niederzuschreiben. Dazu kommt, dass auch die personellen Zuständigkeiten und eine Regelmässigkeit in der Wahrnehmung der Aufgaben gewährleistet sein müssen. Denn ohne solche Methodenstandards und organisatorischen Massnahmen besteht die Gefahr, dass nach einer Bereinigung sich die aktuellen Zustände wiederholen.

Sind die für eine Thesaurus-Bereinigung erforderlichen Schritte klar ausgewiesen, so wird es Gegenstand weiterer Diskussionen sein müssen, welche Regeln v.a. für die Bildbeschreibungen und die Klassifikationsobjekte definiert werden sollen. Fragestellungen und Anregungen dazu können sein:

   Was gehört in einen Bildtitel? Soll mit ihm das Sichtbare oder der thematische Kontext eines Bildes repräsentiert werden?

   Wieviel Kontextinformation gehört in die Caption“ (Feld für die Bildbeschreibung)?

   Soll über die Verschlagwortung nur das Sichtbare indexiert werden (Ofness) oder auch konzeptuelle resp. emotionale Bildaspekte (Aboutness)?

   Die Möglichkeiten der Klassifikationsobjekte können noch besser genutzt werden; die Dossiers“ unterstützen die Recherche entscheidend.

Es wurde an anderer Stelle auch schon darauf hingewiesen, dass die Beschaffung von Informationen zu den Bildinhalten z.T. sehr aufwändig ist; der Fotograf ist dabei nur eine – zudem unsichere – Quelle, da er seine Bilder meistens rudimentär, manchmal auch falsch beschriftet. So ist es oft an der indexierenden Person, nach Bildinformationen zu forschen – ein Umstand, der auf weitere wichtige Voraussetzungen verweist, die mit der Aufgabe der Bilderschliessung zusammenhängen: nämlich das Wissen darüber, welche Themen für das Unternehmen relevant sind, im weiteren genaue Kenntnisse der Nutzerbedürfnisse, das Bewusstsein für die Bedeutung der Dienstleistung PhotoLibrary und das heisst auch Kenntnisse über deren Bestand und darüber, wie sich dieser zu entwickeln hat.

Literaturverzeichnis

Amrane, Abdesalam; Mellah, Hakima; Amghar, Youssef: Semantic indexing of multimedia content using textual and visual information. In: International Journal of Advanced Media and Communication, 5(2/3) 2014, S.182-194.

Bulysheva, L.; Jones, J.; Bi, Z.: A new approach for image databases design. In: Information

Technology and Management, 2015

Charbonneau, Normand; Robert, Mario: La gestion des archives photographiques. Québec 2011

Charbonneau, Normand; Robert, Mario: La description des photographies. In: Archives, 30 (1) 1998-1999, S. 25-43.

Clerici, Peter: Die elektronische Bilddokumentation – das digitale Bildarchiv. Script zur Vorlesung an der HTW Chur (2015)

Clerici, Peter: Bilderschliessung – Physisches Bildarchiv. Script zur Vorlesung an der HTW Chur (2015)

Enser, Peter (A): The evolution of visual information retrieval. In: Journal of Information Science, 34 (4) 2008, S. 531-546

Enser, Peter (B): Visual Image Retrieval. In: Annual Review of Information Science and Technology, 42 2008, S. 3-42

Fredewess-Wenstrup, Staphanie: Von Ackerwagen bis Zylinder. Der Schlagwortkatalog in Bilddatenbanken. In: Digitale Bilderwelten. Zur elektronischen Erschliessung von Bildsammlungen, hsg. Andreas Martin, Dresden 2003, S.93-109

Gödert, Winfried; Lepsky, Klaus; Nagelschmidt, Matthias: Informationserschliessung und Automatisches Indexieren. Ein Lehr- und Arbeitsbuch. Berlin, Heidelberg 2012

Jörgensen, Corinne: Image Retrieval. Theory and Research. Oxford 2003

Jörgensen, Corinne; Jaimes, Alejandro; Benitez, Ana B.; Chan, Shih-Fu: A conceptual framework and empirical research for classifying visual descriptors. In: Journal of the American Society for Information Science and Technology, 52(11) 2001, S. 938–947

Jörgensen, Corinne: Attributes of images in describing tasks. In: Information Processing and Management: an International Journal, 34 (2-3) 1998, S. 161 – 174

Keyser, Pierre de: Indexing. From thesauri to the Semantic Web. Oxford 2012

Lebrecht, Heike: Methoden und Probleme der Bilderschliessung. Köln 2004

Pichler, Rafaela: Annäherung an die Bildsprache. Ontologien als HilFsmittel der Bilderschliessung und Bildrecherche in Kunstbilddatenbanken. Chur 2007

Rasmussen, E.M.: Indexing Images. In: Annual Review of Information Science and Technology, 32 1997, S. 169-196

Reimer, Ulrich: Wissensorganisation. In: Rainer Kuhlen, Wolfgang Semar, Dietmar Strauch (Hsg.): Grundlagen der praktischen Information und Dokumentation. Berlin/Boston 2014

Shatford, Sara: Analyzing the Subject of a Picture: A Theoretical Approach. In: Cataloging & Classification Quarterly, 6 (3) 1986, S. 39-62

Stock, Wolfgang G.; Stock, Mechtild: Wissensrepräsentation. Informationen auswerten und bereitstellen. München 2008

Vollmer, Stephan: Inhaltsbasierte Bildsuche mittels visueller Merkmale. Eine Alternative zur Erschliessung digitaler Bildinformation. Saarbrücken 2007



Anmerkungen

[1]    Enser, Peter (B): Visual Image Retrieval. In: Annual Review of Information Science and Technology, 42 2008, S. 3; in diesem Text werden Bild resp. Foto synonym benutzt; sie bedeuten eine bildliche Repräsentation einer Person, einer Szenerie oder eines Objekts.

[2]    Vgl. Enser (B), S.3 

[3]    Der einfacheren Lesbarkeit zuliebe wird für Berufsbezeichnungen u.Ä. die männliche Form verwendet; die weibliche Form ist immer mitgemeint.

[4]    Clerici, Peter: Die elektronische Bilddokumentation – das digitale Bildarchiv. Script zur Vorlesung an der HTW Chur (2015), S. 3

[5]    Und so beschreibt das Nachstehende zwar einen teilweise vergangenen Zustand, die vorgeschlagenen Szenarien können aber durchaus exemplarisch verstanden werden und über die Zeit und die Institution hinaus gültige Lösungsansätze aufzeigen.

[6]    (…) the annotation of images is a translation of documents cast in a non-textual medium into a textual surrogate.ʺ Zitiert nach Enser (B), S.17

[7]    Vgl. Amrane, Abdesalam; Mellah, Hakima; Amghar, Youssef: Semantic indexing of multimedia content using textual and visual information. In : International Journal of Advanced Media and Communication, 5(2/3) 2014, S.182; sowie Rasmussen, E.M.: Indexing Images. In: Annual Review of Information Science and Technology, 32 1997, S.170

[8]    Shatford, Sara: Analyzing the Subject of a Picture: A Theoretical Approach. In: Cataloging & Classification Quarterly, 6 (3) 1986, S. 39-62

[9]    Jörgensen, Corinne; Jaimes, Alejandro; Benitez, Ana B.; Chan, Shih-Fu: A conceptual framework and empirical research for classifying visual descriptors. In: Journal of the American Society for Information Science and Technology, 52(11) 2001, S. 938–94

[10]    Vgl. Enser (B), S. 10 ff.

[11]    Vgl. Pichler, Rafaela: Annäherung an die Bildsprache. Ontologien als Hilfsmittel der Bilderschliessung und Bildrecherche in Kunstbilddatenbanken. Chur 2007, S.12

[12]    Laut Shatford ist in einem informationswissenschaftlichen Kontext die ikonologische Ebene vernachlässigbar. Vgl. Shatford, S. 45

[13]    Rasmussen, S.177/178

[14]    Vgl. Stock, Wolfgang G.; Stock, Mechtild: Wissensrepräsentation. Informationen auswerten und bereitstellen. München 2008, S. 273 ff.

[15]    Vgl. Rasmussen, S. 178

[16]    Vgl. Pichler, S.14

[17]    Ausgedrückt in Farbe, Form und Textur; vgl. Enser (B), S.10

[18]    Vgl. Jörgensen (2001), S. 939-S. 940

[19]    Vgl. Enser (B), S. 10 ff.

[20]    Jörgensen (2001), S. 939

[21]    Shatford, S. 55 ff.

[22]    Vgl. Enser, Peter (A): The evolution of visual information retrieval. In: Journal of Information Science, 34 (4) 2008, S. 537

[23]    Vgl. Jörgensen (2001), S. 940

[24]    Pichler, S. 14

[25]    Pichler, S. 15

[26]    Keyser, Pierre de: Indexing. From thesauri to the Semantic Web. Oxford 2012, S.95

[27]    Vom Erkennen, resp. dem Gedanken zum Benennen: Im informationswissenschaftlichen Kontext entspricht dem Gedanken der Begriff, dessen sprachliche Repräsentation die Benennung (vgl. Stock, S. 51 ff.). In der dokumentarischen Praxis wiederum steht Begriff für einen in einem kontrollierten Vokabular definierten Term (ein Deskriptor).

[28]    Stock übrigens bezeichnet Kontextinformationen als Isness (vgl. Stock, S. 161)

[29]    Gödert, Winfried; Lepsky, Klaus; Nagelschmidt, Matthias: Informationserschliessung und Automatisches Indexieren. Ein Lehr- und Arbeitsbuch. Berlin, Heidelberg 2012, S. 62 ff.

[30]    Gödert, S. 7

[31]    Gödert, S. 26/27

[32]    Vgl. Stock, S. 176 ff.

[33]    Vgl. Stock, S 366 ff.

[34]    Rasmussen, S. 179/180

[35]    Der Zugang für Externe ist sehr restriktiv und wird in der Regel nur temporär in Verbindung mit einem Projekt gewährt. Nach Abschluss des Projekts werden die Zugangsberechtigungen wieder gelöscht.

[36]    Eine Statistik der in der PhotoLibrary nachgefragten Themen ergab für die letzten ca. 18 Monate: F&E (Forschung und Entwicklung) / Mitarbeitende / Patienten / Produktion und Verpackung / Nachhaltigkeit / Produkte. Die zehn meistgenannten Suchbegriffe 2013/2014 waren: diagnostics / meeting / patient / pharma / employees / cobas / management / basel / ventana / herceptin / research

[37]    Indexierer = die Person, die mit der inhaltlichen Erschliessung von Bildern beauftragt ist.

[38]    IPTC = International Press Telecommunications Council

[39]    Das Beispiel verweist auf eine Problematik, die zum einen systemisch, zum anderen bedingt ist durch die Absenz von Regeln. Vor der Abgabe hat der Fotograf sein Bild beschriftet und befüllt das Feld Stichworte“ mit dem Vermerk Portrait Frau Tessa Chapman“. Alle in diesem Feld eingeschriebenen Begriffe, Phrasen, etc. werden aber direkt im Thesaurus als Begriff abgelegt. Die Anweisung an den Fotografen aber müsste sein, inhaltliche Informationen ins Titelfeld zu schreiben, von wo aus Begriffe etc. nicht übernommen werden. Es fehlen hier demnach eine klare Handlungsanleitung und ein etabliertes Kontrollverfahren.

[40]    Vgl. Keyser, S. 51ff.