Le modèle de description archivistique RiC-CM permet la saisie d’un fonds d’archives sous la forme de graphes de connaissances - ou ontologies. Cette solution signifie un enrichissement indéniable de la compréhension d’un fonds et sa mise en œuvre requiert des solutions techniques. Cependant, la description archivistique dans RiC relève avant tout de questions épistémiques sur la nature des documents et leur production, dont les réponses relèvent de l’archivistique. A travers l’exemple de la saisie d’un fonds, l’article montre l’importance pour l’archiviste de s’approprier le vocabulaire de RiC-CM afin de répondre à ces questions, mais surtout afin de conceptualiser de manière cohérente la description d’une collection documentaire.
Der archivische Verzeichnungsstandard RiC-CM ermöglicht die Erfassung eines Archivbestands mittels Wissensgraphen – oder Ontologien. Diese Lösung bedeutet eine deutliche Bereicherung des Verständnisses eines Bestands, und ihre Umsetzung erfordert technische Lösungen. In erster Linie wirft die archivische Verzeichnung in RiC jedoch epistemische Fragen zur Natur der Dokumente und ihrer Produktion auf, die archivwissenschaftlich beantwortet werden müssen. Am Beispiel der Erfassung eines Bestands zeigt der Artikel, wie wichtig es ist, dass sich Archivar*innen das Vokabular von RiC-CM aneignen, um auf diese Fragen antworten zu können, aber vor allem, um die Beschreibung einer Dokumentensammlung in kohärenter Weise konzeptualisieren zu können.
The RiC-CM archival description standard enables the description of archival holdings using knowledge graphs or ontologies. This solution significantly enriches the understanding of a collection and requires technical solutions for its implementation. First and foremost, however, archival description in RiC raises epistemic questions about the nature of documents and their creation, which need to be answered from an archival science perspective. Using the example of the descriptive processing of an archival fonds, the article shows how important it is for archivists to acquire the vocabulary of RiC-CM to be able to answer these questions, but above all to be able to conceptualise the description of a document collection in a coherent way.
L’intention de ce travail est double. D’une part, il y a la volonté d’analyser le cas pratique de la saisie du fonds d’archives du TheaterFalle dans la base de données de la fondation SAPA1. D’autre part, cette base de données étant construite sur le modèle de description archivistique RiC-CM23, il s’agit de présenter les notions qui fondent cette norme dans la perspective du cas pratique TheaterFalle.
La première partie théorique aborde les notions de métadonnées, langage RDF et ontologie, qui permettent une représentation des connaissances comme un réseau de données liées. Cette partie se termine par la présentation de la norme de description archivistique RiC. Nous examinerons brièvement les différents éléments de ce modèle qui permet de décrire un document à travers les contextes dans lesquels il s’insère.
La seconde partie, après une présentation du fonds TheaterFalle, se concentre sur les formulaires de saisie et décrit la solution mise en place par SAPA. Nous en faisons une analyse critique et proposons une autre approche qui nous semble plus en phase avec le modèle RiC et plus cohérente épistémologiquement.4
Notre perspective porte sur les aspects conceptuels et épistémiques du travail archivistique de saisie et de description. À travers notre examen de la littérature, il nous a semblé que ces aspects étaient peu abordés et que les discussions se focalisaient rapidement sur les enjeux techniques. L’examen de notre cas pratique soutient l’idée qu’une réflexion sur les notions épistémiques utilisées pour structurer une représentation des connaissances est nécessaire afin d’obtenir un modèle cohérent, épistémiquement plus riche, et probablement aussi plus facile en termes de recherche d’informations.
Ce travail porte sur une description numérique d’un fonds d’archives. Cette description s’appuie sur un vocabulaire constitué de métadonnées, sur une syntaxe – dite RDF – les mettant en relation, et d’un standard de description archivistique RiC-CM. Ce sont ces trois notions qui font l’objet de cette section.
Une description s’appuie sur un vocabulaire, qui dans le cas d’une description numérique, est constitué de métadonnées. Au sens étymologique, les métadonnées sont des données qui portent sur des données. Par conséquent le vocabulaire pour décrire le fonds concerné est constitué de données et de métadonnées.
Dans la littérature, il semble parfois difficile de savoir clairement ce qui distingue données et métadonnées. Une approche est celle de Pringuet « Une donnée est une information ; elle peut être par exemple une date, un lieu, une mesure, un événement, ou encore la description de quelque chose. »6 Nous notons qu’une donnée est une information qui porte sur « quelque chose ». Rapporté à des documents à décrire, nous dirons qu’une donnée porte alors sur une réalité du monde. Les métadonnées, elles, portent sur une donnée et « [font] référence à des détails spécifiques de celle-ci. »7 Ainsi, une donnée permet un ancrage épistémique dans une réalité.
Cette première approche doit être précisée, l’usage montrant que le statut de donnée ou métadonnée peut changer. Une métadonnée peut être utilisée comme la donnée sur laquelle porte une métadonnée d’un niveau supérieur, de sorte que les niveaux en viennent à se superposer : « Just as you can always add an extra lego piece on top of another, you can always add another layer of metadata to describe metadata. »8 Les niveaux supérieurs correspondent alors à des informations plus abstraites que ceux inférieurs suivant le point de vue descriptif adopté : « Was als Metaebene oder Datenebene gelten soll, ist abhängig von der Betrachtungsperspektive […]. »9 Cette idée de point de vue peut s’appliquer aux données, puisque celles-ci reflètent le niveau de détail désiré sur la chose. Ce faisant, nous retrouvons l’idée de granularité de la description : la donnée étant alors l’information la plus proche de la réalité et permet un ancrage, bien que relatif, dans celle-ci.
Alemu souligne encore une autre caractéristique de la notion de métadonnée : « Metadata provides the context for information. Metadata makes context explicit.»10 Tandis que la donnée caractérise une réalité, une métadonnée, en étant d’un niveau d’abstraction plus abstrait, explicite le contexte de l’information sur laquelle elle porte et en permet une compréhension. Par exemple, les métadonnées « production » ou « institution » participent chacune à expliciter un contexte et une compréhension différente de l’information « théâtre ».
En résumé, nous dirons qu’une donnée est une information qui caractérise une chose, tandis qu’une métadonnée donne le contexte d’une information (qu’elle soit du niveau d’une donnée ou d’une métadonnée) ; où le rapport entre réalité, donnée et métadonnée dépend du point de vue descriptif choisi par un agent en accord avec ses intentions.
Données et métadonnées font partie des éléments constitutifs du langage RDF – l’abréviation pour Ressource Description Framework. Plutôt que la notion de modèle de graphe10, nous utiliserons ici la notion de langage suivant Allemange et Hendler : « RDF, RDFS, and OWL are the basic representation languages of the Semantic Web, with RDF serving as the foundation. »12 Pour notre propos, seuls les langages RDF et RDFS nous importent.12 L’idée fondamentale de ces langages est le modèle de proposition Sujet-Prédicat-Objet, nommé triplet, qui permet d’associer deux informations à l’aide d’une relation.13 Le langage RDF correspond à la syntaxe de base indiquant comment agencer les mots d’un vocabulaire.
Dans le modèle RDF, le monde est décrit en premier lieu en termes de choses et de noms de choses : « In essence RDF reduces everything in the world that is knowable, or has existed, into either a thing or a thing’s label ; this separates the identity of a thing from strings of text […]. »15 On peut aussi dire qu’un schéma RDF relie une ressource à une autre ressource ou à un littéral ; où une ressource est une chose décrite par des données et métadonnées, et un littéral est le nom d’une chose, à savoir une information qui caractérise directement une entité, c’est-à-dire une donnée. Par exemple, « Shakespeare a écrit Othello en 1603» est représenté sous la forme de deux triplets: « Shakespeare» – « a écrit » – « Othello » et « Othello – date de – 1603 », où « 1603 » est considéré comme un littéral, « Shakespeare » et « Othello » des ressources15, « a écrit » et « date de » des relations. Les deux triplets pouvant être liés par la ressource commune « Othello » (cf. schéma ci-dessous)
On peut alors prédiquer d’autres objets écrits par la ressource « Shakespeare » : « Hamlet » ou « La Tempête ». On peut former le triplet indiquant qu’il « a vécu » « en Angleterre », une caractéristique partagée avec la ressource« Virginia Woolf » dont on pourrait affirmer qu’elle « a lu » « Shakespeare ». À l’aide de triplets RDF, nous pouvons décrire les différentes caractéristiques d’un sujet identifié et lier des entités ayant des ressources communes, formant ainsi un réseau de triplets.

Un intérêt de ce genre de réseau est la possibilité pour la machine d’établir des inférences. Par inférence, nous entendons l’émergence de nouveaux triplets à partir du réseau existant.17 Par exemple, de nos quelques triplets, nous pouvons inferer le triplet « Virginia Woolf » – « a lu » – « Hamlet » qui n’existe pas dans le réseau.17 Une nouvelle information est affirmée, qui enrichit ce réseau. Ce principe appliqué à un réseau plus grand permettra des connexions moins attendues et plus intéressantes.
Dans l’analyse du cas pratique, nous aurons aussi besoin de la notion de classe qui permet de réunir les éléments « Virginia Woolf » et « Shakespeare » sous la dénomination « auteur·ice ». Le langage RDF Schema (RDFS) – une extension de RDF – permet à une métadonnée de désigner une classe ou un ensemble18.
Une classe peut être définie par son extension,19 c’est-à-dire par la collection d’éléments partageant au moins une propriété – une classe peut aussi ne contenir qu’un seul élément. La classe « Auteur·ice» contient, dans notre exemple, la collection des deux éléments « Virginia Woolf » et « Shakespeare» définit une classe. Cette classe peut aussi être définie par son intention qui, ici, est « Auteur·ice». L’intention correspond alors à une métadonnée. Une classe peut aussi contenir une sous-classe, qui en est une spécification.22 Par exemple, « Auteu·rice anglais·e » spécifie la classe « Auteur·ice ». Nous retrouvons le rapport d’abstraction entre les différents niveaux de métadonnées.
Les langages RDF et RDFS permettent de modéliser un réseau d’informations ou de connaissances nommés ontologies : « […] ontologies are specification (rules) that deal with concepts (informations) in a formal (standard) and shared (community-accepted) way. »23 Ramené à ce qui précède, nous dirons qu’une ontologie est une description dans un langage RDF ou RDFS (rules) d’une composition de classes, de sous-classes et d’instances (standard) caractérisées par des données, métadonnées et de relations (informations) s’appuyant sur la représentation (community-accepted) d’une réalité.22
Notons que si une ontologie se fonde sur des éléments formels, celle-ci demeure une représentation subjective d’un ensemble de connaissances - un objet épistémique. La notion d’ontologie autorise des perspectives dissemblables, de sorte que plusieurs représentation d’une même réalité peuvent se compléter, voire s’opposer.
Le modèle de description archivistique RiC – Records in Contexts – est fondé sur les langages RDF et se présente sous deux formes : l’une conceptuelle, le RiC-CM23, l’autre technique, le RiC-O24. Ce dernier correspond à l’implémentation informatique du RiC-CM selon le standard de langage Web Ontology Language (OWL). Ici, il ne sera question que du modèle conceptuel, le RiC-CM.
Dans RiC, nous retrouvons l’idée de triplets conçus alors à partir des notions d’entité, de relation et d’attribut. Une entité est liée à des entités ou des attributs, de manière similaire que dans le modèle RDF.
Les entités sont des objets conçus au sens large des choses (things). Quatre types d’entités constituent le cœur du modèle RiC25 : record Ressources, agent, activity et instantiation. Les trois premières font l’objet de sous-catégories ou de catégories rattachées – reprenant la hiérarchie classe, sous-classe. Cas particulier, l’instantiation constitue une catégorie à elle seule. Au total, il y a 22 entités.
Pour caractériser ces entités, le modèle contient 41 attributs - plus quelques-uns spécifiques aux relations – et 78 relations pour désigner les liens entre ces entités. Les attributs servent ainsi principalement à décrire les entités, tandis que les relations servent à décrire les contextes dans lesquels s’insèrent les entités.
Si nous regardons plus en détail les entités, nous notons qu’une instanciation porte sur la matérialité – physique ou digitale – du document, renvoyant ainsi au support de l’information. Il peut s’agir d’un texte papier ou d’un fichier numérique. Les record ressources renvoient eux à la conception intellectuelle des documents. Il y a trois types de record ressources : le record set, le record et le record part. Ces deux derniers sont nécessairement liés à une instanciation au moment de leur création – celle-ci peut néanmoins ensuite disparaître29. Par exemple, une édition de la pièce Othello est un record dont un exemplaire papier sera une instanciation, de sorte qu’il peut y avoir plusieurs instanciation d’un record ou record part.27 Si ces instanciations disparaissaient, le record en tant qu’entité intellectuelle perdure. Enfin, un record set est un ensemble qui possède pour élément un ou plusieurs records ayant un ou des attributs communs, de sorte qu’il ne dépend pas directement d’une ou de plusieurs instanciations : « A record set […] is an intellectual and not a physical aggregation. »31 Record set, record et record part correspondent à des entités intellectuelles dépendant indirectement ou directement d’une instanciation, l’instanciation correspondant à une entité matérielle. L’ancrage dans la réalité se fait alors à travers l’instanciation.
La notion d’agent est définie en relation avec celles d’activité et de records : « Agents are entities that act or perform activities in the world and in the course of performing the activities that are the products or by-product of the activity performance »32. Un agent peut être une personne ou un groupe de personnes. Dans ce dernier cas, il est possible de distinguer entre famille et corporation. Quant à l’entité activity, elle est définie comme : « The doing of something for some human purpose »33. Une activité peut être comprise par rapport à sa finalité. Par exemple, la mise en scène d’une pièce de théâtre est le résultat d’une activité. Une activité peut aussi être comprise comme le processus lui-même. La focalisation se fera alors par exemple sur le travail de mise en scène d’une pièce de théâtre. Ainsi, suivant le point de vue adopté et les documents (les records) à disposition, une activité pourra être conçue selon un résultat ou selon un processus.
Dans RiC-CM, les entités occupent une place centrale dans la structure et le développement d’une ontologie. Elles sont les nœuds du réseau et sont les éléments que relient les relations. Le développement d’une ontologie fondée sur RiC-CM commencera par définir les entités nécessaires, puis les décrire au moyen d’attributs : « Once the metadata are reorganized per entity according to RiC, each entity described can be assigned a unique identifier and linked to other entities by using one of RiC relations. »34 Leur mise en réseau, et ainsi la description de leurs contextes se font dans un second temps. Par conséquent, la démarche impose un important travail pour concevoir les entités et déterminer les attributs nécessaires. Elle impose par là une réflexion sur la perspective adoptée et les parties de la réalité à décrire que l’on souhaite modéliser.
Les collections de SAPA comportent une partie documentaire et une partie archivistique. La partie documentaire (nommée « Special Collections ») possède une section « Personalia », composée des coupures de presse sur les personnalités des arts de la scène suisse, et une section « Panorama », rassemblant les documentations publiques produites par les institutions suisses, ainsi que les articles de presse. La partie archivistique rassemble des fonds de personnes ou d’institutions pouvant comporter un mélange de documents papier, documents audiovisuels ou artefacts. Cette politique d’acquisition permet aux collections de se compléter, de sorte qu’un fonds d’archives pourra être relié avec un ou des collections documentaires – et réciproquement.
Étant donnée la structure de ses collections et constatant l’augmentation à venir des documents digitaux, SAPA a choisi de développer une base de données sur le modèle archivistique RiC et les langages associés RDF et RDFS. Cette plateforme, toujours en développement, a été mise en ligne en 2020 (www.performing-arts.ch) et permet à la fois la consultation des documents et leur saisie. Les données de « 30'000 acteur·ices du théâtre suisse »35 ont ainsi été mises à disposition, l’accent étant mis sur la saisie et la préservation des documents numériques.
Le TheaterFalle est une compagnie de théâtre bâloise fondée par Ruth Widmer en 1986, active jusqu’en 2016. Ce fonds est une donation faite en 2023 et correspond à environ 1,50 m linéaire organisé autour des productions théâtrales, chacune faisant l’objet d’un dossier physique.
L’inventaire du fonds a montré que les dossiers contenaient des documents textuels (tapuscrits des pièces, matériel de production ou matériel pédagogique) ou audiovisuels (vidéos, photographies ou cassettes audio). La priorité étant mise sur les documents vidéo, une douzaine de productions ont été sélectionnées pour numérisation. Les documents textes ont fait l’objet d’un tri en vue de compléter le dossier documentaire du « Panorama » consacré au TheaterFalle. Des documents ont ainsi été retirés du fonds au profit au dossier du « Panorama ».33 Enfin, les doublons ont été éliminés. Au final, la saisie a porté sur des documents textes – tapuscrits, matériels de production ou matériel pédagogique –, et sur des documents iconographiques – photographies, diapositives des productions.
Pour cette saisie, l’unité de description correspond au dossier d’une production théâtrale, dossier conçu par la fondatrice du TheaterFalle Ruth Widmer.
Nous présentons tout d’abord la saisie telle qu’elle a été décidée par l’archiviste responsable, puis, dans la section suivante, nous en faisons l’analyse critique. Pour cette saisie, deux formulaires ont été utilisés : le formulaire correspondant au record set et celui correspondant au record. Le formulaire lié à l’entité instantiation étant en cours de validation, il n’a pas été utilisé, de sorte que la saisie reste au niveau intellectuel de la description des documents.
Le formulaire record set a été utilisé pour décrire un dossier de production lorsque celui-ci contenait une partie texte et une partie iconographique. Celles-ci étaient alors saisies avec la sous-catégorie record. Si un dossier contenait uniquement des documents texte, il était traité comme un record. Le plan de classement se présente alors de la manière suivante avec à droite les dossiers constitutifs du fonds:

Un dossier du fonds est ainsi traité comme un record set ou un record suivant qu’il possède un contenu photographique ou non. Singulièrement, l’entité correspondant à un dossier peut alors correspondre à des niveaux conceptuels différents. La distinction conceptuelle entre record set et record paraît alors pour le moins ambigüe et on se demande ce qui distingue la saisie du record set « Leo und Ich » de celle du record « Tango in Tanger ». Matériellement, les deux sont des dossiers de production.
Un document élaboré par SAPA explique la procédure de saisie. Il indique les champs à remplir obligatoirement et les métadonnées utilisées pour décrire une entité. La saisie est ainsi facilitée et peut se faire relativement rapidement.
Le formulaire pour un record set contient 20 métadonnées obligatoires, 1 recommandée, 15 facultatives – et 11 à ne pas utiliser. Seules les métadonnées obligatoires ont été utilisées.

Le formulaire pour un record contient 22 métadonnées obligatoires, 2 recommandées, 13 optionnelles et 12 à ne pas utiliser.

Étonnamment, il y a peu de différences entre les métadonnées obligatoires d’un record set et celles d’un record. Les changements – en couleurs dans le tableau –, sont la disparition de la métadonnée « niveau » RiC-A36, et l’ajout d’une visée « droit » avec trois métadonnées spécifiques aux documents vidéos – soulignant cette priorité. À cela s’ajoute une métadonnée permettant d’introduire des mots-clefs, mais étant obligatoire seulement pour les documents audiovisuels, elle n’a pas été utilisée. Par contre, deux métadonnées facultatives – en jaune dans le tableau – ont été employées : l’une permet la description du contenu, l’autre la mention du droit d’auteur pour les documents photographiques.
Relevons que dans le plan de classement, le fonds « TheaterFalle » s’insère sous « Personnes morales », mais que le « TheaterFalle » en tant qu’agent produisant des pièces de théâtre n’apparait pas. L’entité RiC-E11 « corporate body » n’est ainsi pas utilisée. Le « TheaterFalle » n’apparaît que dans la partie documentaire « Panorama » renvoyant aux dossiers contenant articles de presse et documentation. Par contre, la fondatrice Ruth Widmer est décrite en tant qu’agent auquel les dossiers du fonds TheaterFalle sont liés (grâce à la métadonnée RiC-A28 « Auteur·ices »).
La comparaison de l’ontologie développée pour décrire les collections de la fondation avec les prescriptions de RiC-CM suscite plusieurs interrogations quant aux choix des entités et de leur description.
Un premier élément à souligner est que le document de saisie ne porte que sur la description des entités appartenant à la catégorie record ressources, ainsi qu’à la catégorie instantiation. Les catégories d’entités agent et activity ne sont pas décrites et ne sont pas utilisées dans une saisie standard. L’ontologie développée est constituée principalement de records ressource. Les contextes liés aux producteurs et à leurs actions ne sont donc pas décrits. Cette absence nous paraît entraîner des confusions et des complications inutiles.
Une série d’interrogations est causée par la similarité entre les entités record set et record. Cette similarité apparaît notamment dans la redondance des métadonnées de sorte que l’on ne voit pas le gain épistémique d’un niveau record set.
Si un record set rassemble des records ayant un ou des attributs en commun, cela ne signifie pas que ces attributs doivent être repris dans la description de l’ensemble. Au contraire, le principe de la hiérarchie des record ressources est que les métadonnées portant sur les attributs des entités, elles ne sont pas ces attributs. Autrement dit, le passage au record set devrait induire un changement de niveau d’abstraction et ainsi permettre un gain épistémique. Ce principe du gain épistémique, nous semble aussi aller dans le sens d’une hiérarchie d’informations en cascade, qui permettrait de clarifier l’attribution des métadonnées suivant les niveaux et éviter tant que faire se peut les redondances, mais aussi le choix des entités à utiliser.
Sur la question des entités, il nous semble plus cohérent d’utiliser les entités record et activity. Les documents textes et photographiques sont alors traités comme des records et font alors l’objet d’une description à l’aide des métadonnées du document de saisie avec des cotes d’identification et de localisation uniques. Ces records sont ensuite considérés comme les produits d’une activité, à savoir la création d’une pièce de théâtre décrite comme une entité activity. Poussant plus loin l’usage de RiC-CM, cette entité activity peut être liée à l’entité Person « Ruth Widmer » et à l’entité à créer corporate body « TheaterFalle ». Dès lors, il y a une différence évidente entre la description de la création d’une pièce de théâtre liée à des agents (institutions, metteur·ses en scène ou acteur·ices) et les produits de cette activité qu’ils soient sous forme papier, photographiques ou vidéo.
Nous obtiendrions ainsi un plan de classement structuré comme suit :

L’ensemble des records liés au TheaterFalle serait alors un record set intitulé « Material der Theaterproduktionen » et constitue un classement parallèle ou en sus à celui de gauche. Il y a ainsi un début de réseau qui offre à la fois une description du contexte de production des documents, ainsi qu’une description de leur contenu matériel et des ensembles qu’ils constituent. Ce faisant, on génère un gain informationnel qui pourrait augmenter en spécifiant d’autres ensembles ou en élargissant le réseau.
Ces gains épistémiques se font aussi au niveau des descriptions des entités. Par exemple, le nombre de productions que comporte le fonds n’apparaît pas en l’état, mais peut être attribué de manière cohérente au record set « Material der Theaterproduktionen ». Cette approche évite aussi d’avoir une multiplication des cotes uniques (dans la saisie actuelle, record et record set possèdent chacun une cote d’identification unique). Dans notre description, seuls les records possèdent une cote d’identification unique, le record set possédant une cote générique.34 Cette solution fait des records les entités centrales de cette ontologie autour desquelles se développent les contextes décrits avec les entités à disposition dans RiC-CM.
L’usage des entités agent et activity permettrait aussi de palier un manque lié à la spécificité de SAPA, qui est les arts de la scène. RiC-CM offre peu d’attributs pour caractériser le sujet ou le domaine des record ressources. En n’utilisant que celles-ci, l’ajout devrait passer par l’attribut descriptive note (RiC-A16) et la rédaction d’un texte. Par contre, l’emploi des entités agent et activity donne l’accès à des attributs spécifiques au type d’institution ou à l’activité de cette entité. Ainsi, l’attribut occupation type (RiC-A30), répétable, permet d’indiquer la ou les différentes occupations d’une entité person comme acteur·ice, metteur·se en scène ou danseur·se. De même, l’attribut corporate body type (RiC-A12) permet de décrire une entité tels que Centre de création théâtrale, Compagnie de danse ou de théâtre. Enfin, le type d’une entité activity peut être caractérisé par l’attribut activity type (RiC-A02) et désigner une production, une création ou une représentation. Ce faisant, il est possible d’enrichir le contenu sémantique d’une ontologie.
L’usage de multiples entités et ce faisant l’ajout d’attributs peuvent paraître une complication exigeant temps et énergie, ce qui est vrai. Cependant cela paraît vrai surtout au début du processus de conceptualisation de l’ontologie. La difficulté semble principalement de choisir les différentes entités nécessaires structurant l’ontologie à décrire puis de spécifier et répartir les métadonnées entre elles. La saisie paraît ensuite devoir gagner en clarté et efficacité, et donc en temps et énergie. Par ailleurs, l’usage des différentes entités, et c’est l’un des intérêts de RiC-CM, permet d’enrichir la représentation d’un fonds et d’en souligner pour partie sa valeur épistémique.
Un autre argument en faveur de l’emploi, ici, de nouvelles entités est lié à la recherche d’information dans une base contenant des données au format RDF. De telles bases de données exigent pour faire des requêtes de passer par l’emploi du langage SPARQL conçu pour les machines et les humains. Si ce langage permet d’obtenir des réponses précises à des questions complexes, il implique une difficulté d’emploi qu’il s’agit de surmonter. Cette difficulté m’a paru d’autant plus grande dans le cas de la plateforme de SAPA que quasi toutes les entités qui structurent son ontologie sont des record ressources, de sorte que la distinction entre records set et record devient ambigüe. Par conséquent, une requête portant uniquement sur les records set n’inclut pas le record « Tango in Tanger » qui correspond pourtant aussi à un dossier de production (cf. figure 2). La requête devra alors porter sur les records set et les records, et signifie une connaissance préalable de l’ontologie35. En utilisant, différentes entités et des attributs spécifiques à celles-ci, les requêtes sur les records liées aux activités de tel agent nous paraissent facilitées. Néanmoins, cette remarque est, en l’état, une hypothèse, car il ne nous a malheureusement pas été possible d’analyser plus en détail la base de données de SAPA, ou d’en discuter avec la personne responsable. De plus, si nous avons pu avoir la présentation d’une autre base de données sur ce modèle et découvrir une manière de l’interroger bien plus simple, nous n’avons pu véritablement tester celle-ci. Néanmoins, les requêtes SPARQL paraissaient moins complexes à rédiger et les résultats obtenus plus précis. Il semble bien y avoir un gain manifeste en termes de valorisation du fonds et de recherche d’informations à structurer clairement et distinctement une ontologie.
Avec ce travail, nous avons voulu décrire les différentes notions qui fondent une ontologie de type RDF, cela afin d’examiner leur portée épistémique. Il nous semble au final que nous n’avons qu’effleuré l’articulation de ces notions et leur portée. L’analyse et la critique d’un cas pratique ont cependant permis d’aborder une partie des enjeux en suggérant la nécessité d’une réflexion sur la partie de réalité à décrire, sur le choix des entités pour ancrer et développer une ontologie qui permet une compréhension plus précise des informations. L’examen des enjeux épistémiques nous paraît ainsi important pour aller au-delà d’une archive constituée uniquement de dossiers, et capter des connaissances qui permettent une meilleure compréhension et un usage facilité du fonds décrit.