Menu Fermer

Approche algorithmique

Une approche plus performante que les recommandations USP

Les recommandations de l’USP (United States Pharmacopeia) — notamment le chapitre “Beyond-Use Date” (BUD) — reposent sur des règles empiriques et conservatrices, établies pour garantir la sécurité des préparations lorsque les données de stabilité sont limitées. Ces durées standardisées (par exemple, 14 jours pour les préparations aqueuses orales réfrigérées) ne tiennent pas compte de la variabilité réelle liée à la formulation, au conditionnement ou aux conditions de stockage.

Smart Formulation se distingue par une approche scientifique fondée sur la prédiction de la durée de conservation des préparations pharmaceutiques à partir :

  • des propriétés moléculaires de la substance active (descripteurs issus de bases comme ChemBL),
  • des caractéristiques de formulation (type et proportion d’excipients),
  • des paramètres environnementaux (température, humidité, exposition à la lumière),
  • du conditionnement (verre, plastique, matériau barrière, système de fermeture),
  • et des données de stabilité publiées issues de la littérature et de bases validées (Stabilis).

En s’appuyant sur des modèles de régression multivariée et des techniques d’apprentissage supervisé explicables développées sous KNIME, Smart Formulation prédit la durée de conservation d’une préparation spécifique, avec un intervalle de confiance chiffré, plutôt que d’appliquer des valeurs arbitraires.

En pratique, cette approche permet d’obtenir des durées de conservation personnalisées, scientifiquement justifiées et souvent plus représentatives de la réalité que les BUD standardisés de l’USP, tout en respectant les exigences de sécurité pharmaceutique.

Les performances du modèle ont été évaluées sur plusieurs centaines de préparations et validées par comparaison avec les durées issues de la littérature et des bases de données validées (Stabilis, ChemBL), montrant une amélioration significative de la précision prédictive par rapport aux règles empiriques.

La science au cœur de Smart Formulation

L’approche algorithmique développée par Smart Formulation repose sur des modèles prédictifs conçus sous KNIME, intégrant les variables galéniques, environnementales et de conditionnement pour estimer la stabilité (BUD) des préparations pharmaceutiques. Ces algorithmes, fondés sur la régression multivariée et des techniques d’apprentissage supervisé explicables, sont validés expérimentalement et publiés dans la littérature scientifique.
Machine learning workflow KNIME
Machine learning workflow used in Smart Formulation to predict the beyond use date (BUD) of active pharmaceutical ingredients (APIs) in oral solid dosage forms. The approach relies on a Tree Ensemble Regression Algorithm, a powerful supervised learning method that captures complex non-linear relationships between molecular properties, formulation parameters, and environmental conditions. The model is trained on a dataset comprising three categories of input descriptors: 1. API Descriptors (18 features) — Molecular properties such as molecular weight (MW), logP (lipophilicity), rotatable bonds (RB), polar surface area (PS), hydrogen bond donors (HBD), and acceptors (HBA), among others. 2. Formulation Descriptors (4 features) — Encoded excipient compositions, including lactose, silica, cellulose, mannitol, sucrose, and hydroxypropyl methylcellulose (HPMC), as well as API content percentage. 3. Conditioning and Storage Descriptors (5 features) — Packaging type (glass, plastic, and paper), storage temperature, and classification of storage conditions. The tree ensemble regression algorithm processes these features to establish correlations between molecular properties, formulation parameters, and environmental conditions, ultimately predicting the BUD in days. Notably, the model identifies an inverse correlation between LogP and BUD, suggesting that higher lipophilicity is associated with reduced stability. This predictive approach enables formulators to estimate stability efficiently, reducing reliance on extensive real-time stability studies. Adapted from Smart Formulation: AI-Driven Web Platform for Optimization and Stability Prediction of Compounded Pharmaceuticals Using KNIME, Grigoryan A, Helfrich S, Lequeux V, Lapras B, Marchand C, Merienne C, Bruno F, Mazet R, Pirot F. Pharmaceuticals (Basel). 2025 Aug 21; 18(8):1240.

Fondements scientifiques

Smart Formulation s’appuie sur la modélisation prédictive de la stabilité des formes pharmaceutiques, en intégrant les interactions entre excipients, conditions environnementales (température, humidité) et paramètres de conditionnement. Cette approche permet de rationaliser le développement galénique et d’anticiper les risques de dégradation, tout en s’appuyant sur des données expérimentales validées.

Publication scientifique de référence

Smart Formulation: AI-Driven Web Platform for Optimization and Stability Prediction of Compounded Pharmaceuticals Using KNIME

Grigoryan A, Helfrich S, Lequeux V, Lapras B, Marchand C, Merienne C, Bruno F, Mazet R, Pirot F.
Pharmaceuticals (Basel). 2025 Aug 21; 18(8):1240.
DOI: 10.3390/ph18081240  |  PMID: 40872628  |  PMCID: PMC12389346

Cette publication décrit la plateforme Smart Formulation, un outil web basé sur l’intelligence artificielle et la modélisation prédictive, développé sous KNIME, pour optimiser la formulation et prédire la stabilité des préparations pharmaceutiques. L’étude démontre la capacité des modèles intégrés à corréler les propriétés des excipients, les conditions environnementales et les paramètres galéniques pour anticiper les cinétiques de dégradation.

Approches et validation

  • Utilisation de plans d’expériences et d’algorithmes de machine learning intégrés à KNIME
  • Validation croisée sur plusieurs types de formes pharmaceutiques (orales, liquides, parentérales, topiques)
  • Comparaison systématique des prédictions avec des données expérimentales de stabilité

Ces travaux constituent la base scientifique sur laquelle reposent les modules Smart Formulation , permettant une application pratique, reproductible et rapide dans le cadre du développement pharmaceutique.

Note : Les modules interactifs sont des prototypes de recherche et sont fournis uniquement à des fins de démonstration et de formation.