Utilisation d'OpenRefine pour le nettoyage des données

Description

OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données. (https://fr.wikipedia.org/wiki/OpenRefine)

Mise en route

Page de téléchargement: https://openrefine.org/download

Ressources utiles

Ecole d'hivers SHS 2023 (1h24) (L'Alliance, Canada)

Description: Tutoriel sous forme de cours donné à des étudiant-e-s. Très bien expliqué depuis la base, en français.

A retenir:

Vidéo tutoriel Tuto@Mate , 2019(2h05)

Wiki sur Github , mars 2015)

Manipulations à connaître

Effacer toutes les données d'une colonne:

""

Cette expression remplace chaque cellule de la colonne par une chaîne vide, effaçant ainsi toutes les données

Changer le format d'une colonne contenant des dates

Si votre date est au format D.M.YYYY (comme 1.1.2023 pour le 1er janvier 2023), vous pouvez utiliser l'expression suivante pour la transformer en M/d/yyyy :

value.toDate("d.M.yyyy").toString("M/d/yyyy")

Cette expression fait deux choses :

Astuces

Utiliser Copilot ou Mistral AI pour trouver les expressions dont on a besoin sur GREL


Révision #14
Créé 7 février 2025 07:42:40 par Laurence Gauvin
Mis à jour 19 février 2025 13:59:09 par Laurence Gauvin