OpenRefine
OpenRefine est une application de traitement de données qui vous permet de nettoyer et de transformer des données structurées. Elle dispose de plusieurs fonctionnalités adaptées à la création deDonnées ouvertes et liées (LOD), telles que la réconciliation, la traduction de format, l’élaboration de cartographies RDF (Resource Description Framework) et les options d’exportation.
OpenRefine et LINCS
Dans le cadre du projet LINCS, OpenRefine est utilisé pour le nettoyage et la réconciliation des données. Il est principalement utilisé par les chercheurs qui apportent leurs propres ensembles de données au projet. OpenRefine permet à ces experts dans le domaine d’avoir un contrôle total sur les modifications apportées à leurs données.
OpenRefine est le mieux adapté aux données structurées, car il représentera les données dans un format similaire à une feuille de calcul ou à un tableau. Tout type de fichier qui suit un système similaire, tel que les valeurs séparées par des virgules (CSV), est préférable, bien qu’il soit également compatible avec d’autres types de fichiers tels que XML, JSON et RDF. Si les données d’un chercheur relèvent d’un certain domaine ou ne sont pas structurées, un autre outil peut être plus approprié :
- Utilisez LINCS-API ou NERVE pour un ensemble de données non structuré.
- Utilisez VERSD pour réconcilier un jeu de données entièrement bibliographique.
Le logiciel peut être téléchargé à partir du site Web d’OpenRefine. Une fois lancée, l’application s’ouvrira dans un onglet de navigateur qui s’exécute localement sur votre ordinateur.
Bien que cet outil puisse être utile pour les chercheurs et les spécialistes des données en dehors de LINCS, il est important pour ceux qui sont en train d’introduire leurs données dans le système LINCS de commencer à les nettoyer et à les réconcilier dans OpenRefine dès que possible dès le début du processus de préparation des données.
Vous souhaitez créer des données ouvertes et liées et les publier dans l’entrepôt de triplets de LINCS ? Consultez Publier des données avec LINCS pour plus d’informations.
Réconciliation avec LINCS
Consultez le service d’autorité pour réconcilier vos données avec le graphe de connaissances LINCS à partir d’OpenRefine.
Conditions préalables
Les utilisateurs d’OpenRefine :
- Doivent venir avec leur propre ensemble de données
- Ont besoin d’une compréhension de base de la réconciliation et du nettoyage des données
- Ne doivent pas créer de compte utilisateur
OpenRefine prend en charge les entrées et les sorties suivantes :
- Entrée : CSV, TSV, XLS, XLSX, JSON, XML, RDF, texte brut, etc.
- Sortie : CSV, TSV, XLS, XLSX, tableaux au format HTML, etc.
Ressources
Pour en savoir plus sur OpenRefine, consultez les ressources suivantes (en anglais) :
Nettoyer les données :
- OpenRefine User Manual
- Rue & Hernandez (2019) “Using OpenRefine to Clean Your Data”
- Hervieux (2020) "OpenRefine Activity" [PowerPoint]
- van Hooland, Verborgh et De Wilde (2021) "Cleaning Data with OpenRefine"
Réconcilier les entités :