Séminaire Sésame juin 2025

Séminaire SESAME du 16 juin 2025 

10H00, salle 104 du bâtiment 11 dit le château, 2 Place Pierre Viala Campus La Gaillarde, 34000 Montpellier

News du W3C en 10 minutes Pierre-Antoine CHAMPIN, W3C / INRIA / Université de Lyon  

FAIRiser les données du réseau d’observatoires de la zone critique Français (OZCAR) : cas d’utilisation de l’ontologie I-ADOPT  par Charly COUSSOT, IRD Université Grenoble Auvergne Rhône Alpes

Le système d'information (SI) Theia/OZCAR est une initiative nationale conçue pour soutenir la découverte, l'accès et la réutilisation des données environnementales in-situ collectées par les observatoires français et leurs partenaires internationaux. Cela inclut les données des 22 observatoires de l'infrastructure française de recherche sur les zones critiques (OZCAR-RI), qui surveillent la zone critique de la Terre dans toute une série de compartiments environnementaux. Historiquement, ces données étaient gérées par des systèmes indépendants, chacun ayant ses propres formats, vocabulaires et protocoles d'accès, ce qui créait des obstacles importants à l'interopérabilité et à la recherche interdisciplinaire.
Pour remédier à cette fragmentation, le SI Theia/OZCAR a été co-développé avec la communauté scientifique depuis 2017, dans le but de fédérer des données de séries temporelles hétérogènes dans une infrastructure unifiée conforme aux principes FAIR (Trouvable, Accessible, Interopérable, Réutilisable) (Wilkinson et al., 2016). Ce travail soutient des initiatives nationales et européennes plus larges, notamment l'infrastructure de recherche française Data Terra et la plateforme de données OneWater, ainsi que des efforts internationaux tels que eLTER-RI, en permettant l'échange et l'intégration normalisés des données du système terrestre.
Pour atténuer l'hétérogénéité des informations, un élément central de ce système est un modèle de données partagé - appelé « modèle pivot » - qui permet une structuration cohérente des métadonnées depuis la description des jeux de données jusqu'aux observations individuelles. Ce modèle s'appuie sur des normes de métadonnées reconnues (ISO 19115, O&M, DataCite) (Braud et al., 2020) et est associé à un service de vocabulaire contrôlé, le Thésaurus Theia/OZCAR. Ce thésaurus, aligné sur les ontologies SKOS et I-ADOPT (Coussot et al., 2024), permet la décomposition sémantique des noms de variables hétérogènes et parfois complexe tout en améliorant les fonctionnalités de découverte des données, et l'alignement entre les thésaurus.

Références 

Braud, I, et al. "Building the information system of the French Critical Zone Observatories network: Theia/OZCAR-IS." Hydrological Sciences Journal (2020): 1-19. 10.1080/02626667.2020.1764568

Coussot, C. et al. Implementing a new Research Data Alliance recommendation, the I-ADOPT framework, for the naming of environmental variables of continental surfaces. Earth Sci Inform 17, 4261–4277 (2024). https://doi.org/10.1007/s12145-024-01373-9

Wilkinson, M. D. et al.: The FAIR Guiding Principles for scientific data management and stewardship, Scientific Data, 3, 160018, 10.1038/sdata.2016.18, (2016).