Le spécialiste des métadonnées "assez bon"
Mon premier emploi dans le domaine des musées remonte à 2008, au plus fort de la Grande Récession. L'équipe de numérisation que j'ai rejointe venait de perdre environ un quart de son personnel dans une série de rachats et de licenciements, et l'ambiance était sombre. Nous étions chargés de mettre en ligne une grande collection de photographies historiques, et le plus tôt serait le mieux. Le seul problème était que la collection n'était pas entièrement cataloguée, et le faire correctement prendrait du temps que nous n'avions pas. La pression était forte pour justifier nos travaux, et donc les discussions que nous avons eues sur les métadonnées penchaient vers le provisoire. Si la base de données n'est pas remplie, le numéro d'accession seul suffit-il ? D'accord, qu'en est-il du numéro d'accession et de l'artiste ? Les solutions que nous avons proposées reflétaient les facteurs de stress de ce moment : nous visions quelque chose d'assez bon au lieu de quelque chose d'exemplaire, en équilibrant soigneusement les exigences en matière de données avec la volonté de générer du contenu.
Au cours de la décennie et demie qui a suivi, le parent "assez bon" de Winnicott a été un principe directeur dans mon rôle de gardien des données... J'ai été un "assez bon" catalogueur dans un certain nombre d'institutions différentes, ne fournissant jamais à ma base de données que les choses les plus simples : où elle se trouve, par qui elle est, qui nous l'a donnée, et si elle sera s'adapter à notre monte-charge. J'ai été un conservateur numérique "assez bon" lorsqu'il s'agit de partager du matériel de collections en ligne, en ne donnant que les métadonnées nécessaires pour rendre nos actifs numériques utilisables dans des contextes locaux.
Travailler chez LINCS a été un changement de paradigme majeur pour moi sur le plan professionnel, notamment parce que «assez bon» est une référence différente dans ce nouveau contexte. Je suis actuellement spécialiste des métadonnées, aidant Erin Canning, analyste du système d'ontologie du LINCS, à générer de la documentation pour certains de nos partenaires dans ce projet, en me concentrant sur le Centre canadien d'ethnomusicologie, HistSex.org, la Yellow Nineties Personography, et la University of Saskatchewan Art Gallery. Pour chacun d'entre eux, j'ai été chargé de générer des extraits de code TTL et des diagrammes décrivant comment les données seront mappées dans notre triplestore utilisant CIDOC CRM et FRBRoo, qui étend le CRM pour capturer les sémantique sous-jacente de l'information bibliographique.
Ces diagrammes et extraits font partie de notre profils d'application—un profil parapluie qui capture le projet LINCS dans son ensemble, et un pour chacun des ensembles de données que LINCS comprend. Ceux-ci rassemblent ontologie modèles, nos éléments de métadonnées tirés de plusieurs espaces de noms, les politiques et directives relatives à leur utilisation, les décisions que nous avons prises qui s'écartent des normes communautaires afin de capturer avec précision les nuances de notre ensemble de données, et d'autres décisions concernant à l'objectif de données vers lequel nous travaillons. Le profil d'application est un document vivant qui permet les communications entre les chercheurs, les spécialistes de l'ontologie, les développeurs d'interfaces de données et d'autres, mais il fournit également un fil d'Ariane pour d'autres organisations qui pourraient être intéressées à reproduire la façon dont nous avons cartographié, ingéré, et fédéré tant d'ensembles de données culturelles divergentes dans ResearchSpace. Tout documenter de manière aussi complète nécessite beaucoup de soin et d'attention aux détails, mais c'est le point : alors que dans certains projets, il peut être suffisant pour quelqu'un de déduire des détails non spécifiés à partir d'une documentation peu abondante, ou de téléphoner à une personne et de lui demander ce qu'elle dans ce cas, une documentation suffisamment bonne permet à un projet comme le nôtre d'avoir un impact longtemps après que les fonds de la subvention ont été dépensés et que les rapports finaux ont été déposés. Pour être non seulement durable, mais reproductible, nous devons prendre le temps de documenter les choses maintenant. En ce sens, nous sommes attentifs à la fois aux données et aux contenus : aucun ne prime sur l'autre.
Il y a une sorte de satisfaction à faire quelque chose de très bien. Bien que je sois heureux de participer à toute activité qui facilite la communication au sein d'une grande équipe géographiquement dispersée, j'aime aussi l'idée de jeter du fil d'Ariane derrière nous au fur et à mesure. Les données ouvertes liées n'ont pas encore atteint leur pleine utilité dans le domaine culturel, et j'attends avec impatience le jour où je pourrai interroger une base de données de musée pour déterminer non seulement si une œuvre d'art tient dans un ascenseur, mais aussi des questions plus complexes qui reflètent le type d'inférence possible avec des données sémantiques. C'est excitant de savoir que ce que nous faisons pourrait inspirer d'autres à suivre et que les documents qui s'y trouvent sont assez bons pour guider leur chemin.