Article

Jumeaux numériques et modèles hybrides dans la production de produits biologiques : Comparaison des modèles

Thomas de Marchin

La technologie des jumeaux numériques a le potentiel de jouer un rôle transformationnel dans le développement et la fabrication de médicaments.

Dans notre premier article Comment les jumeaux numériques et la modélisation hybride optimisent le processus de culture cellulaire pour une meilleure production, nous avons présenté notre vision des jumeaux numériques pour les bioprocédés en tant que répliques virtuelles qui combinent des modèles mécanistes et basés sur les données pour optimiser la fabrication des produits biologiques. Nous avons montré comment les modèles hybrides peuvent prendre en charge l’optimisation en temps réel, la mise à l’échelle et la conformité réglementaire. Les jumeaux numériques sont particulièrement cruciaux pour la médecine personnalisée et les thérapies cellulaires et géniques, car ils permettent une production adaptable de petits lots adaptés aux traitements individualisés.¹

Dans ce deuxième article, nous mettons la théorie en pratique en comparant un modèle classique basé sur les données à un modèle hybride pour prédire la densité cellulaire viable (VCD) et l’accumulation de produits – paramètres clés de la productivité – dans un bioréacteur de perfusion.

Nous démontrons comment les jumeaux numériques permettent aux innovateurs de répondre à des questions telles que :

Comment identifier les conditions optimales pour maximiser la croissance et la productivité cellulaires ?
Quand devrions-nous initier la perfusion et ajuster les stratégies d’alimentation pour éviter l’épuisement du substrat et l’effondrement de la densité cellulaire ?
Pouvons-nous détecter les premiers signes d’instabilité et prédire des paramètres difficiles à mesurer tels que la concentration du substrat dans le bioréacteur ?

Graphique 1 : Illustration d’un bioréacteur à perfusion

Étude de cas: Modélisation de la culture cellulaire du bioréacteur de perfusion

Graphique 1 : Illustration d’un bioréacteur à perfusion

Dans un bioréacteur à perfusion, les cellules sont continuellement alimentées en nutriments frais tandis que les déchets et les produits sont éliminés, mais les cellules elles-mêmes sont conservées. Cela crée un environnement stable et riche en nutriments où les cellules peuvent prospérer pendant de longues périodes, ce qui entraîne des densités cellulaires plus élevées et une productivité accrue. Les bioréacteurs à perfusion sont largement utilisés pour la production de produits biologiques.²

La modélisation d’attributs tels que la densité cellulaire viable (VCD) ou l’accumulation de produits aux côtés de paramètres de processus tels que la concentration du substrat, la température ou l’agitation à l’aide de modèles prédictifs est une étape cruciale de la caractérisation des procédés médicamenteux.³

Graphique 1 : Illustration d’un bioréacteur à perfusion

La modélisation classique des bioréacteurs repose généralement sur des approches purement basées sur les données, où des fonctions mathématiques simples (comme des lignes ou des courbes) sont ajustées aux données expérimentales pour faire des prédictions. 3 Bien que cette méthode soit simple et efficace sur le plan informatique, elle ne parvient souvent pas à capturer les mécanismes biologiques ou physiques sous-jacents qui régissent le système. Par conséquent, il fournit un aperçu limité des raisons pour lesquelles des résultats spécifiques se produisent et a du mal à généraliser au-delà de la plage de données d’entraînement.

De plus, les méthodes basées sur les données sont confrontées à des défis lorsqu’elles traitent de systèmes complexes impliquant de nombreux paramètres de processus et des données expérimentales limitées, ce qui est courant dans le développement de médicaments. Les modèles mécanistes ou hybrides résolvent certains de ces problèmes en incorporant des connaissances antérieures sur les processus sous la forme de lois biologiques et physiques. 4 Par conséquent, bien que les modèles classiques basés sur les données servent de point de départ utile, nous pensons que l’intégration des connaissances mécanistes par des approches hybrides améliore le pouvoir prédictif et facilite une meilleure optimisation des processus dans les bioréacteurs.

Nous avons développé un modèle hybride qui intègre des connaissances mécanistes – telles que les taux de consommation de nutriments et les voies métaboliques – avec des composants d’apprentissage automatique basés sur les données qui capturent des aspects complexes ou mal compris. La partie mécaniste fournit une base solide de connaissances préalables sur les processus, tandis que la composante d’apprentissage automatique modélise des comportements inconnus. Les modèles hybrides offrent une robustesse accrue dans l’extrapolation et peuvent capturer avec précision des comportements dynamiques tels que les changements dans les taux de croissance cellulaire et l’absorption des nutriments dans des conditions variables. Bien que plus complexes à développer, ils peuvent réduire le besoin d’expérimentation approfondie et permettre la réutilisation de modèles existants dans tous les produits. Ils excellent également dans l’optimisation en temps réel, la mise à l’échelle prédictive et la conformité réglementaire en améliorant la compréhension des processus pendant la caractérisation (étape 1 de la FDA) et en soutenant le développement de limites de contrôle en temps réel pour des lots spécifiques (étape 3 de la FDA).

Notre modèle hybride prend les paramètres du processus comme intrants et prédit des variables biologiques telles que les taux, les rendements et les niveaux de plateau pour la biomasse et la formation de produits. Ces paramètres prédits sont ensuite introduits dans un système d’équations différentielles ordinaires (EDO), qui calculent les réponses dynamiques du bioréacteur au fil du temps. La figure 2 illustre les étapes clés de l’approche classique purement axée sur les données et de l’approche hybride.

Graphique 2 : Comparaison des modèles axés sur les données et hybrides

Pour évaluer les deux approches, nous avons simulé 29 expériences faisant varier la température (20-40 °C) et la vitesse d’agitation (150-350 tr/min), en capturant différentes dynamiques de croissance de la biomasse, de formation de produits et de consommation de glucose au fil du temps (Figure 3). Le modèle a été entraîné sur 21 expériences. Les performances ont ensuite été testées sur deux séries de quatre expériences inédites : une série dans le domaine d’entraînement (test1) pour évaluer la capacité d’interpolation, et une autre en dehors de ce domaine (test2) pour évaluer l’extrapolation et la généralisation.

Image de l’article de ressource sur les jumeaux numériques

Image de l’article de ressource sur les jumeaux numériques

Graphique 3 : Domaine expérimental des données utilisées pour entraîner et tester les modèles. L’ensemble de données du test 1 se trouve dans le domaine expérimental de l’ensemble de données d’entraînement, tandis que l’ensemble de données du test 2 se trouve à l’extérieur.

Les figures 4 et 5 montrent les prédictions sur les deux ensembles de données de test. Nous pouvons voir que le modèle hybride (vert) s’adapte mieux aux données (points rouges) que l’approche classique (bleu). C’est ce que montre également la figure 6 qui montre l’erreur quadratique moyenne (RMSE), une mesure courante de la précision des prédictions qui quantifie la différence moyenne entre les valeurs prévues et observées. Plus le RMSE est petit, meilleures sont les performances prédictives du modèle. Le modèle hybride permet d’obtenir des RMSE systématiquement inférieurs à ceux de l’approche classique dans les deux domaines. Cela indique que le modèle hybride généralise mieux et fait des prédictions plus précises, même en extrapolant au-delà des conditions d’entraînement.

Figure 4 : Données (rouge) et prédictions par l’approche du modèle hybride (vert) et classique (bleu) pour l’ensemble de données du domaine expérimental.

Graphique 5 : Données (rouge) et prédictions par le modèle hybride (vert) et l’approche classique (bleu) pour l’ensemble de données du domaine expérimental externe.

Figure 6 : Comparaison des performances prédictives des approches de modélisation classiques et hybrides mesurées par RMSE (erreur quadratique moyenne). Des valeurs RMSE plus faibles indiquent une meilleure précision prédictive.

Comme le montre notre étude de cas, les modèles hybrides s’inscrivent non seulement dans le domaine de la formation, mais font également preuve d’une robustesse beaucoup plus grande lors de l’extrapolation à de nouvelles conditions – une caractéristique essentielle pour la fabrication de médicaments dans le monde réel. Cela montre clairement la supériorité d’une telle modélisation par rapport aux approches classiques couramment utilisées.

Historiquement, la création et l’ajustement de modèles hybrides nécessitaient des connaissances spécialisées en mathématiques et en science des données, ce qui limitait leur accessibilité dans de nombreuses entreprises. Cependant, ce paysage est en train de changer avec l’avènement d’applications conviviales comme TwinLab, illustré à la figure 7. Nous avons créé cette application pour permettre aux utilisateurs sans expertise technique approfondie d’explorer facilement différents scénarios de processus et de prédire les résultats. Ces outils rendent la modélisation hybride avancée pratique et exploitable, aidant les scientifiques et les ingénieurs dans le développement de bioprocédés en intégrant les connaissances mécanistes aux informations basées sur les données grâce à des interfaces intuitives.

Figure 7 : Application de simulation permettant l’analyse de scénarios en faisant varier les paramètres clés du processus, notamment le taux d’agitation, la température, le taux de dilution, la concentration du substrat dans l’aliment et la concentration initiale des graines. Ces entrées sont traitées par un modèle hybride qui prédit les évolutions temporelles de la densité cellulaire viable (VCD), de la formation des produits et de la consommation de substrat.

Même avec un modèle hybride, la précision de la prédiction n’est pas parfaite, et le besoin de 21 échantillons pour l’entraînement peut constituer un obstacle, en particulier pour les petites entreprises de biotechnologie qui ne peuvent pas facilement générer ce volume de données de haute qualité. Plusieurs approches peuvent aider à remédier à cette limite.

Une approche consiste à appliquer des plans d’expériences intelligents. D’une part, la couverture de l’espace des paramètres du processus reste très importante, tandis que des conceptions optimales pour de tels modèles mécanistes permettent de garantir un support suffisant des données lorsque l’information est la plus pertinente. D’autre part, l’optimisation bayésienne mécaniste pourrait être une première étape pour couvrir rapidement le domaine expérimental, tout en restant prudent quant à la couverture correcte du domaine.

Une autre solution est l’utilisation de plans d’expériences intensifiés (iDoE), qui introduit des changements délibérés dans les paramètres du processus au sein d’une seule expérience (par exemple, fonctionnement d’un bioréacteur). Cette stratégie condense efficacement plusieurs combinaisons DoE conventionnelles en un plus petit nombre d’essais, maximisant ainsi les informations obtenues par expérience.

Enfin, une stratégie plus ambitieuse mais très prometteuse consiste à tirer parti de jumeaux numériques pré-entraînés. Dans ce scénario, le modèle hybride serait d’abord pré-entraîné sur des milliers d’ensembles de données expérimentales agrégés à partir de diverses sources, de la même manière que les grands modèles de langage comme ChatGPT sont développés. Les utilisateurs pouvaient ensuite utiliser et améliorer le modèle en utilisant leurs propres données d’entraînement limitées, améliorant continuellement ses performances pour toutes les personnes impliquées, ce qui profitait à la fois aux utilisateurs et aux patients. Pour protéger les données propriétaires, la plateforme déploierait l’apprentissage fédéré, une approche préservant la vie privée qui permet aux utilisateurs d’améliorer le jumeau numérique de manière collaborative. Cette méthode garantit que les données expérimentales individuelles restent confidentielles et ne sont jamais directement partagées entre les utilisateurs, tout en contribuant à un modèle collectif en constante amélioration.

Nous continuerons à explorer le potentiel du jumeau numérique et des méthodologies statistiques pour soutenir de meilleures prédictions, y compris l’utilisation d’iDoE et de plans optimaux bayésiens.

Note: Les résultats ont été générés avec l’aide de BioWin ASBL et le soutien financier de la Région, conformément aux dispositions de la convention de subvention (Convention 8881 ATMP Thérapie cellulaire).

*Sources suite ci-dessous

À propos de l’auteur :

Thomas de Marchin est directeur associé des statistiques et de la science des données chez Cencora, où il applique des méthodologies statistiques avancées et des algorithmes d’apprentissage automatique pour optimiser la découverte de médicaments et l’efficacité de la fabrication. Grâce à son expertise approfondie en matière de conformité réglementaire, en particulier les normes FDA et GMP, il comble le fossé entre les approches analytiques complexes et les applications pharmaceutiques pratiques.

Clause de non responsabilité :
Les informations fournies dans cet article ne constituent pas des conseils juridiques. Cencora, Inc. encourage vivement les lecteurs à consulter les informations disponibles relatives aux sujets abordés et à s’appuyer sur leur propre expérience et expertise pour prendre des décisions à ce sujet.

Entrez en contact avec notre équipe

Notre équipe d’experts en valeur de premier plan se consacre à la transformation des données probantes, des informations sur les politiques et des renseignements sur le marché en stratégies efficaces d’accès au marché mondial. Laissez-nous vous aider à naviguer en toute confiance dans les méandres complexes des soins de santé d’aujourd’hui. N’hésitez pas à nous contacter pour découvrir comment nous pouvons vous aider à atteindre vos objectifs.

Nous contacter

Sources :

^1. Jumeaux numériques : De la médecine personnalisée à la santé publique de précision, J Pers Med., juillet 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
^2. Rapport de recherche sur l’industrie des bioréacteurs à perfusion 2025, Recherche et marchés. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
^3.Modèles prédictifs pour le développement de cultures cellulaires de mammifères en amont - Une revue, Digital Chemical Engineering, mars 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
^4. Modélisation semi-paramétrique hybride en ingénierie des systèmes de procédés : Passé, présent et futur, Computers & Chemical Engineering, janvier 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639

Ressources connexes

Article

Alors que l’adoption de l’eCTD 4.0 progresse, une nouvelle ligne directrice de l’ICH la met à l’épreuve

Article

De nouvelles voies vers la valeur du produit : Stratégies d’optimisation du portefeuille de produits matures

Article

Préparation de la notice électronique du patient en Europe