Article

Jumeaux numériques et modèles hybrides dans la production de produits biologiques : Une comparaison de modèles

  • Thomas de Marchin

La technologie des jumeaux numériques a le potentiel de jouer un rôle transformationnel dans le développement et la fabrication de médicaments. 

Dans notre premier article Comment les jumeaux numériques et la modélisation hybride optimisent le processus de culture cellulaire pour une meilleure production, nous avons présenté notre vision des jumeaux numériques pour les bioprocédés en tant que répliques virtuelles qui combinent des modèles basés sur les données et mécanistes pour optimiser la fabrication de produits biologiques. Nous avons montré comment les modèles hybrides peuvent prendre en charge l’optimisation, la mise à l’échelle et la conformité réglementaire en temps réel. Les jumeaux numériques sont particulièrement cruciaux pour la médecine personnalisée et les thérapies cellulaires et géniques, car ils permettent la production adaptable de petits lots adaptés à des traitements individualisés.1

Dans ce deuxième article, nous mettons la théorie en pratique en comparant un modèle classique basé sur les données à un modèle hybride pour prédire la densité cellulaire viable (VCD) et l’accumulation de produits – paramètres clés de la productivité – dans un bioréacteur de perfusion.

Nous démontrons comment les jumeaux numériques permettent aux innovateurs de répondre à des questions telles que :

  • Comment pouvons-nous identifier les conditions optimales pour maximiser la croissance et la productivité des cellules?
  • Quand devrions-nous amorcer la perfusion et ajuster les stratégies d’alimentation pour éviter l’épuisement du substrat et l’effondrement de la densité cellulaire?
  • Pouvons-nous détecter les signes précoces d’instabilité et prédire des paramètres difficiles à mesurer comme la concentration de substrat dans le bioréacteur?
Figure 1 : Illustration d’un bioréacteur de perfusion

Étude de cas : Modélisation de la culture cellulaire de bioréacteur de perfusion

Figure 1 : Illustration d’un bioréacteur de perfusion
Dans un bioréacteur à perfusion, les cellules reçoivent continuellement des nutriments frais pendant que les déchets et les produits sont éliminés, mais les cellules elles-mêmes sont conservées. Cela crée un environnement stable et riche en nutriments où les cellules peuvent prospérer pendant de longues périodes, ce qui entraîne une densité cellulaire plus élevée et une productivité accrue. Les bioréacteurs de perfusion sont largement utilisés pour la production de produits biologiques.2

La modélisation d’attributs tels que la densité cellulaire viable (VCD) ou l’accumulation de produits ainsi que des paramètres de procédé tels que la concentration du substrat, la température ou l’agitation à l’aide de modèles prédictifs est une étape cruciale dans la caractérisation des procédés médicamenteux.3
Figure 1 : Illustration d’un bioréacteur de perfusion
La modélisation classique des bioréacteurs repose généralement sur des approches purement axées sur les données, où des fonctions mathématiques simples (comme des lignes ou des courbes) sont ajustées aux données expérimentales pour faire des prédictions.3 Bien que cette méthode soit simple et efficace sur le plan informatique, elle ne parvient souvent pas à saisir les mécanismes biologiques ou physiques sous-jacents qui régissent le système. Par conséquent, il fournit une compréhension limitée des raisons pour lesquelles des résultats spécifiques se produisent et a du mal à généraliser au-delà de la plage de données d’entraînement.

De plus, les méthodes basées sur les données sont confrontées à des défis lorsqu’il s’agit de systèmes complexes impliquant de nombreux paramètres de processus et des données expérimentales limitées, ce qui est courant dans le développement de médicaments. Les modèles mécanistes ou hybrides résolvent certains de ces problèmes en intégrant les connaissances antérieures sur les processus sous forme de lois biologiques et physiques.4 Par conséquent, bien que les modèles classiques basés sur les données servent de point de départ utile, nous croyons que l’intégration des connaissances mécanistes par le biais d’approches hybrides améliore la puissance prédictive et facilite une meilleure optimisation des processus dans les bioréacteurs.
Nous avons développé un modèle hybride qui intègre des connaissances mécanistes – telles que les taux de consommation de nutriments et les voies métaboliques – avec des composants d’apprentissage automatique axés sur les données qui capturent des aspects complexes ou mal compris. La partie mécaniste fournit une base solide de connaissances préalables sur les processus, tandis que la composante d’apprentissage automatique modélise des comportements inconnus. Les modèles hybrides offrent une robustesse accrue dans l’extrapolation et peuvent capturer avec précision des comportements dynamiques tels que les changements dans les taux de croissance cellulaire et l’absorption des nutriments dans des conditions variables.  Bien que plus complexes à développer, ils peuvent réduire le besoin d’expérimentation approfondie et permettre la réutilisation des modèles existants dans tous les produits. Ils excellent également dans l’optimisation en temps réel, la mise à l’échelle prédictive et la conformité réglementaire en améliorant la compréhension des processus pendant la caractérisation (étape 1 de la FDA) et en soutenant le développement de limites de contrôle en temps réel pour des lots spécifiques (étape 3 de la FDA).

Notre modèle hybride prend les paramètres du processus comme intrants et prédit les variables biologiques telles que les taux, les rendements et les niveaux de plateau pour la biomasse et la formation de produits. Ces paramètres prédits sont ensuite introduits dans un système d’équations différentielles ordinaires (EDO), qui calculent les réponses dynamiques du bioréacteur au fil du temps. La figure 2 illustre les principales étapes de l’approche classique purement axée sur les données et de l’approche hybride.
Figure 2 : Comparaison des modèles basés sur les données et hybrides
Pour évaluer les deux approches, nous avons simulé 29 expériences variant la température (20 à 40 °C) et la vitesse d’agitation (150 à 350 tr/min), capturant différentes dynamiques de croissance de la biomasse, de formation de produits et de consommation de glucose au fil du temps (figure 3). Le modèle a été entraîné sur 21 expériences. Le rendement a ensuite été testé sur deux séries de quatre expériences inédites : une dans le domaine d’entraînement (test1) pour évaluer la capacité d’interpolation, et une autre à l’extérieur de ce domaine (test2) pour évaluer l’extrapolation et la généralisation.

Image de l’article de référence sur les jumeaux numériques

Figure 3 : Domaine expérimental des données utilisées pour entraîner et tester les modèles. L’ensemble de données du test 1 se trouve dans le domaine expérimental de l’ensemble de données d’entraînement, tandis que l’ensemble de données du test 2 se trouve à l’extérieur.
Les figures 4 et 5 montrent les prédictions des deux ensembles de données d’essai. Nous pouvons voir que le modèle hybride (vert) correspond mieux aux données (points rouges) que l’approche classique (bleu). C’est également ce que montre la figure 6 qui montre la racine de l’erreur quadratique moyenne (RMSE), une mesure courante de la précision de la prédiction qui quantifie la différence moyenne entre les valeurs prédites et observées. Plus le RMSE est petit, meilleure est la performance prédictive du modèle. Le modèle hybride permet d’obtenir un RMSE constamment inférieur à celui de l’approche classique dans les deux domaines. Cela indique que le modèle hybride généralise mieux et fait des prédictions plus précises, même en extrapolant au-delà des conditions d’entraînement.
Image de l’article de référence sur les jumeaux numériques

Figure 4 : Données (rouge) et prédictions par le modèle hybride (vert) et l’approche classique (bleu) pour l’ensemble de données dans le domaine expérimental.
Image de l’article de référence sur les jumeaux numériques

Figure 5 : Données (rouge) et prédictions par le modèle hybride (vert) et l’approche classique (bleu) pour l’ensemble de données du domaine expérimental externe.
Image de l’article de référence sur les jumeaux numériques

Figure 6 : Comparaison de la performance prédictive des approches de modélisation classique et hybride mesurée par RMSE (erreur quadratique moyenne). Des valeurs RMSE plus faibles indiquent une meilleure précision prédictive.

Comme le montre notre étude de cas, les modèles hybrides s’intègrent non seulement dans le domaine de l’entraînement, mais font également preuve d’une beaucoup plus grande robustesse lorsqu’ils extrapolent à de nouvelles conditions – une caractéristique essentielle pour la fabrication de médicaments dans le monde réel. Cela montre clairement la supériorité d’une telle modélisation sur les approches classiques couramment utilisées.

Historiquement, la création et l’ajustement de modèles hybrides nécessitaient des connaissances spécialisées en mathématiques et en science des données, ce qui limitait leur accessibilité dans de nombreuses entreprises. Cependant, ce paysage change avec l’avènement d’applications conviviales comme TwinLab, illustrée à la figure 7. Nous avons créé cette application pour permettre aux utilisateurs sans expertise technique approfondie d’explorer facilement différents scénarios de processus et de prédire les résultats. Ces outils rendent la modélisation hybride avancée pratique et exploitable, soutenant les scientifiques et les ingénieurs dans le développement de bioprocédés en intégrant des connaissances mécanistes à des informations basées sur les données grâce à des interfaces intuitives.
Figure 7 : Application de simulation permettant l’analyse de scénarios en variant les paramètres clés du procédé, notamment le taux d’agitation, la température, le taux de dilution, la concentration de substrat dans l’aliment et la concentration initiale des graines. Ces intrants sont traités par un modèle hybride qui prédit les évolutions temporelles de la densité cellulaire viable (VCD), de la formation du produit et de la consommation de substrat.
Même avec un modèle hybride, la précision de la prédiction n’est pas parfaite, et le besoin de 21 échantillons pour l’entraînement peut constituer un obstacle, en particulier pour les petites entreprises de biotechnologie qui ne peuvent pas générer facilement ce volume de données de haute qualité. Plusieurs approches peuvent aider à remédier à cette limite.

Une approche consiste à appliquer une conception intelligente des expériences. D’une part, il est très important de couvrir l’espace des paramètres du processus, tandis que des conceptions optimales pour de tels modèles mécanistes permettent de s’assurer que les données sont suffisamment soutenues là où l’information est la plus pertinente. D’autre part, l’optimisation bayésienne mécaniste pourrait être une première étape pour couvrir rapidement le domaine expérimental, tout en restant prudent quant à la couverture appropriée du domaine.

Une autre solution est l’utilisation de la conception intensifiée des expériences (iDoE), qui introduit des changements délibérés dans les paramètres du procédé au sein d’une même expérience (p. ex., le fonctionnement du bioréacteur). Cette stratégie condense efficacement plusieurs combinaisons de DoE conventionnelles en un plus petit nombre d’essais expérimentaux, maximisant ainsi l’information acquise par expérience.

Enfin, une stratégie plus ambitieuse, mais très prometteuse, consiste à tirer parti de jumeaux numériques pré-entraînés. Dans ce scénario, le modèle hybride serait d’abord pré-entraîné sur des milliers d’ensembles de données expérimentales agrégés à partir de diverses sources, de la même manière que les grands modèles de langage comme ChatGPT sont développés. Les utilisateurs pouvaient alors utiliser et améliorer le modèle en utilisant leurs propres données d’entraînement limitées, améliorant continuellement ses performances pour toutes les personnes concernées, ce qui profiterait à la fois aux utilisateurs et aux patients. Pour protéger les données propriétaires, la plateforme déploierait l’apprentissage fédéré, une approche de préservation de la vie privée qui permet aux utilisateurs d’améliorer le jumeau numérique de manière collaborative. Cette méthode garantit que les données expérimentales individuelles demeurent confidentielles et ne sont jamais partagées directement entre les utilisateurs, tout en contribuant à un modèle collectif en constante amélioration.

 Nous continuerons d’explorer le potentiel du jumeau numérique et des méthodologies statistiques pour soutenir de meilleures prédictions, y compris l’utilisation de l’iDoE et des conceptions optimales bayésiennes. 


Remarque : Les résultats ont été générés avec l’aide de BioWin ASBL et le soutien financier de la Région, conformément aux dispositions de la Convention 8881 ATMP Thérapie cellulaire.
*Les sources se poursuivent ci-dessous

À propos de l’auteur :

Thomas de Marchin est directeur associé des statistiques et de la science des données chez Cencora, où il applique des méthodologies statistiques avancées et des algorithmes d’apprentissage automatique pour optimiser la découverte de médicaments et l’efficacité de la fabrication. Grâce à sa grande expertise en matière de conformité réglementaire, en particulier les normes FDA et GMP, il comble le fossé entre les approches analytiques complexes et les applications pharmaceutiques pratiques.


Avis de non-responsabilité :
Les renseignements fournis dans cet article ne constituent pas des conseils juridiques. Cencora, Inc. encourage fortement les lecteurs à consulter les informations disponibles sur les sujets abordés et à se fier à leur propre expérience et expertise pour prendre des décisions à cet égard.

 


Entrez en contact avec notre équipe

Notre équipe d’experts de la valeur se consacre à la transformation des données probantes, des informations sur les politiques et des renseignements sur le marché en stratégies efficaces d’accès au marché mondial. Laissez-nous vous aider à naviguer dans le paysage complexe des soins de santé d’aujourd’hui en toute confiance. Contactez-nous pour découvrir comment nous pouvons vous aider à atteindre vos objectifs.

Références :


1. Jumeaux numériques : De la médecine personnalisée à la santé publique de précision, J Pers Med., juillet 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
2. Rapport de recherche sur l’industrie des bioréacteurs à perfusion 2025, Recherche et marchés. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
3. Modèles prédictifs pour le développement de cultures de cellules de mammifères en amont - Une revue, Digital Chemical Engineering, mars 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
4. Modélisation semi-paramétrique hybride en génie des systèmes de procédés : Passé, présent et futur, Computers & Chemical Engineering, janvier 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639

 

Ressources connexes

Article

Alors que l’adoption de l’eCTD 4.0 progresse, une nouvelle ligne directrice de l’ICH le met à l’épreuve

Article

Nouvelles voies vers la valeur du produit : Stratégies pour optimiser le portefeuille de produits matures

Article

Se préparer à l’encart électronique pour le patient en Europe