Saving Italian hydRological measuremeNs (SIREN), un nouveau projet en Italie vise à sauver 70 ans de mesures hydrométéorologiques en externalisant le travail de bénévoles. Le travail consistera à numériser des données hydrologiques historiques pour permettre aux chercheurs de tester de nouvelles méthodologies ou de former de nouveaux modèles.
La collecte de données hydrométéorologiques en Italie a été gérée au niveau national par le Service hydrologique et maréographique national (Servizio Idrografico e Mareografico Nazionale, SIMN) depuis ses débuts au début des années 1900.
Il y a environ 30 ans, le SIMN a été démantelé et la responsabilité de la collecte des données a été transférée au niveau régional, composé de 19 régions et de 2 provinces autonomes.
Ce changement a causé des difficultés dans la disponibilité d’enregistrements complets et homogènes pour l’ensemble du pays. Les données acquises au cours des dernières années sont généralement disponibles au format numérique, ce qui facilite la combinaison d’ensembles de données régionales disparates. Cependant, les mesures historiques n’existent que sous forme imprimée, à travers les Annuaires Hydrologiques publiés par le Service Hydrologique et Maréographique National.
Il y a eu quelques initiatives pour tenter de récupérer partiellement ces informations dans le passé, mais elles étaient souvent de portée limitée, se concentrant sur des périodes ou des zones géographiques spécifiques.
Pourquoi le manque de données numériques est-il un problème ?
L’un des principaux problèmes auxquels les hydrologues et les climatologues sont confrontés est la quantité limitée de données historiques pouvant être utilisées pour tester de nouvelles méthodologies ou former des modèles. Ce manque de données est encore plus critique dans un pays comme l’Italie, avec une morphologie complexe et un climat qui varie considérablement sur le territoire. La récupération de cette quantité considérable de données permettrait non seulement de mieux comprendre le climat du siècle dernier mais servirait également à estimer comment le climat et le cycle hydrologique pourraient évoluer dans le futur.
Pourquoi ne pas utiliser un logiciel de reconnaissance optique de caractères ?
Malgré les améliorations remarquables apportées aux logiciels de reconnaissance optique de caractères (OCR) et aux techniques d’apprentissage automatique/d’intelligence artificielle, l’approche de numérisation la plus précise repose toujours sur la transcription manuelle.
La plupart de ces enregistrements sont imprimés dans d’anciens documents et l’encre peut être partiellement endommagée. Par exemple, un « 8 » peut facilement être confondu avec un « 3 » dans ces conditions. De plus, ces tableaux contiennent plusieurs corrections manuscrites effectuées par différentes personnes avec une écriture différente. Toutes ces particularités limitent l’applicabilité des approches automatisées standardisées.
Comment vous pouvez aider
Le projet SIREN recherche des volontaires pour aider dans le processus de numérisation. Vous pouvez en savoir plus ici.
L’objectif du projet est la numérisation des archives hydrométéorologiques historiques italiennes afin de produire un ensemble de données cohérent à l’échelle nationale. La tâche des bénévoles est la transcription des données et l’interprétation des corrections manuscrites qui pourraient être rapportées sur ces documents imprimés.
Toutes les pages des Annuaires hydrologiques sont disponibles sous forme d’images sur le site Internet. Les pages sont sélectionnées au hasard pour que les utilisateurs les transcrivent. Aucune connaissance spécifique du sujet n’est nécessaire et il existe un tutoriel simple sur le site Web qui permet aux utilisateurs d’identifier rapidement les données pertinentes et le nom de la station de jaugeage. Aucun équipement spécifique n’est nécessaire, juste un ordinateur et une connexion internet suffisent.
Paola Mazzoglio, assistante de recherche au Politecnico di Torino, qui est impliquée dans l’organisation du projet, a déclaré que l’ensemble de données résultant « pourrait être utile pour un large éventail d’applications possibles, de la conception à la planification de la gestion de l’eau en passant par la recherche. De plus, ce nouvel ensemble de données pourrait permettre aux chercheurs de mieux comprendre le climat du siècle dernier en Italie et pourrait être utile pour estimer comment les inondations fluviales, les périodes de sécheresse et, plus généralement, le climat, pourraient changer à l’avenir.
