06.01.2026

4 minutes of reading

FacebookLinkedInImprimer

Les chimistes examinent de nombreux mélanges de matières grâce à des outils d’analyse de plus en plus sophistiqués qui leur permettent d’établir la carte d’identité des échantillons (gaz, liquide, solide) analysés. Malheureusement, pour stocker les résultats d’analyse, les instruments utilisent le plus souvent des formats propriétaires difficilement lisibles et exploitables en dehors des logiciels fournis avec ces instruments. Pour simplifier l’accès aux données, des initiatives émergent comme celle de la fondation Allotrope. Une équipe d’IFPEN participe à cette démarche et développe des utilitaires open source pour les données de chromatographie. Explications. 

Chimie analytique : une grande diversité d’approches

L'analyse des mélanges gazeux, liquides ou solides permet d'identifier, de caractériser et de quantifier leurs constituants élémentaires, même lorsque ces mélanges contiennent plusieurs centaines de molécules dans des proportions variées. Les chimistes utilisent des équipements spécifiques selon la nature des échantillons, qu'il s'agisse de fluides ou de matériaux solides tels que les catalyseurs ou les polymères. 
IFPEN dispose d'équipements analytiques de pointe, incluant spectroscopies diverses (IR, UV-Vis, Raman), chromatographies, spectrométries de masse et RMN, ainsi que microscopies électroniques. Ces instruments fournissent des données complexes, analysées par des algorithmes sophistiqués pour établir une carte d'identité précise des échantillons, avec des recherches toujours en cours pour optimiser leur exploitation.

De nombreux formats propriétaires

Plusieurs problématiques sont liées aux données d’analyse, notamment la diversité des formats propriétaires, leur évolution constante et leur manque d’interopérabilité. « Cela complique la comparaison et l’agrégation des données issues de différents appareils, ainsi que leur partage entre applications ou experts, explique Maxime Visconte, de la direction des systèmes d’information et du numérique. Le développement de convertisseurs pour ces formats est également très chronophage. Une solution idéale serait un format d’échange standardisé par domaine d’analyse. »
La chromatographie en phase gazeuse est un bon candidat pour la standardisation des formats de données en raison de son usage répandu et de la diversité des formats propriétaires associés aux différents appareils. Utilisée dans des domaines variés (parfumerie, œnologie, biologie, etc.), cette technique permet de séparer, identifier et quantifier les molécules volatiles présentes dans un échantillon. « À IFPEN, plus d’une quinzaine de formats différents ont été recensés pour les chromatographes à gaz », constate Maxime Visconte.

Vers un standard de données pour la chromatographie en phase gazeuse

Une équipe projet, LabVision, a été constituée à la direction des systèmes d’information et du numérique d’IFPEN pour simplifier la lecture et la visualisation des données, en commençant par la chromatographie en phase gazeuse. 
L’approche choisie a consisté à adopter le modèle d’échange standardisé proposé par la Fondation Allotrope pour ce type de données. Ce modèle (ADM - Allotrope Data Model) se traduit par deux formats, l'un ne contenant que du texte (ASM - Allotrope Simple Model) et l'autre combinant texte et données binaires (ADF - Allotrope Data Format). 

L’équipe projet LabVision, avec l’appui technique de Tech’ Advantage, a développé des convertisseurs au format ASM pour les formats les plus courants des analyseurs de chromatographie en phase gazeuse1, et des modèles de données pour faciliter l’utilisation des fichiers au format ASM. Ces modèles de données sont disponibles en Open Source dans trois langages de programmation : Java, Typescript et Python. Les développeurs peuvent alors utiliser à leur guise ces convertisseurs dans leurs propres applications de machine-learning, de visualisation, etc.
Ces convertisseurs ont par ailleurs permis à l’équipe projet LabVision d’alimenter une base de données constituée de nombreux résultats d’analyse ainsi mis à la disposition des chimistes d’IFPEN. 

Fondation Allotrope et IFPEN : une vision commune 
Fondée en 2012, la fondation Allotrope est un consortium international d'entreprises utilisatrices d’équipements d’analyse (industries pharmaceutiques, biopharmaceutiques, etc.), de fournisseurs d'instruments et d'éditeurs de logiciels qui vise à simplifier l'échange de données de laboratoire. L’objectif est de développer de nouvelles approches pour améliorer l'accès aux données, leur interopérabilité et leur intégrité grâce à la standardisation, source d'innovation. IFPEN partage cette vision et contribue à la définition et à la diffusion des standards de la fondation Allotrope en participant notamment au groupe de travail sur la chromatographie.

Un meilleur partage des résultats de la science

L’initiative de l’équipe projet LabVision participe à un effort plus général d’IFPEN pour encourager la science ouverte, notamment grâce à une plateforme en Open Access2 où les chercheurs sont incités à déposer leurs publications scientifiques. Des librairies Open Source développées à IFPEN sont également accessibles sur GitHub, comme la plateforme informatique Arcane, développée en étroite collaboration avec le CEA.
Dans cet esprit, les outils fournis par l’équipe projet LabVision vont faciliter la mise à disposition des données de laboratoire à une vaste communauté de chercheurs. Ces travaux marquent une première étape d’une histoire qui va se poursuivre pour englober davantage de techniques d’analyse et de formats. « Il est à espérer que de nouveaux partenaires adhèrent à cette initiative et rejoignent les équipes actuelles de manière à accélérer la mise en place de ces standards. », conclut Maxime Visconte.
 

1 La version Java du convertisseur du format GC au format ASM est disponible sur GitHub à cette adresse : GC2ASM : GC to Allotrope Simple Model converter. Ce convertisseur traite les données des logiciels Chemstation et OpenLab de l’entreprise Agilent.

2 Portail HAL IFPEN