Articolo

Gemelli digitali e modelli ibridi nella produzione di farmaci biologici: Un confronto tra modelli

  • Thomas de Marchin

La tecnologia dei gemelli digitali ha il potenziale per svolgere un ruolo trasformativo nello sviluppo e nella produzione di farmaci. 

Nel nostro primo articolo Come i gemelli digitali e la modellazione ibrida ottimizzano il processo di coltura cellulare per una migliore produzione, abbiamo presentato la nostra visione dei gemelli digitali per i bioprocessi come repliche virtuali che combinano modelli meccanicistici e basati sui dati per ottimizzare la produzione di farmaci biologici. Abbiamo mostrato come i modelli ibridi possono supportare l'ottimizzazione in tempo reale, lo scale-up e la conformità normativa. I gemelli digitali sono particolarmente cruciali per la medicina personalizzata e le terapie cellulari e geniche, in quanto consentono una produzione adattabile di piccoli lotti su misura per trattamenti personalizzati.1

In questo secondo articolo, abbiamo messo in pratica la teoria confrontando un modello classico basato sui dati con un modello ibrido per prevedere la densità cellulare vitale (VCD) e l'accumulo di prodotto – parametri chiave della produttività – in un bioreattore di perfusione.

Dimostriamo come i gemelli digitali consentano agli innovatori di rispondere a domande come:

  • Come possiamo identificare le condizioni ottimali per massimizzare la crescita e la produttività cellulare?
  • Quando dovremmo iniziare la perfusione e regolare le strategie di alimentazione per evitare l'esaurimento del substrato e il collasso della densità cellulare?
  • Possiamo rilevare i primi segni di instabilità e prevedere parametri difficili da misurare come la concentrazione del substrato nel bioreattore?
Figura 1: Illustrazione di un bioreattore di perfusione

Caso di studio: Modellazione di colture cellulari di bioreattori di perfusione

Figura 1: Illustrazione di un bioreattore di perfusione
In un bioreattore di perfusione, le cellule vengono continuamente rifornite di nutrienti freschi mentre i rifiuti e il prodotto vengono rimossi, ma le cellule stesse vengono trattenute. Questo crea un ambiente stabile e ricco di sostanze nutritive in cui le cellule possono prosperare per lunghi periodi, portando a una maggiore densità cellulare e a una maggiore produttività. I bioreattori di perfusione sono ampiamente utilizzati per la produzione di farmaci biologici.2

La modellazione di attributi come la densità cellulare vitale (VCD) o l'accumulo di prodotto insieme a parametri di processo come la concentrazione del substrato, la temperatura o l'agitazione utilizzando modelli predittivi è un passaggio cruciale nella caratterizzazione del processo farmacologico.3
Figura 1: Illustrazione di un bioreattore di perfusione
La modellazione classica dei bioreattori si basa in genere su approcci puramente basati sui dati, in cui semplici funzioni matematiche (come linee o curve) vengono adattate ai dati sperimentali per fare previsioni. 3 Sebbene questo metodo sia semplice ed efficiente dal punto di vista computazionale, spesso non riesce a catturare i meccanismi biologici o fisici sottostanti che guidano il sistema. Di conseguenza, fornisce informazioni limitate sul motivo per cui si verificano risultati specifici e fatica a generalizzare oltre l'intervallo di dati di addestramento.

Inoltre, i metodi basati sui dati affrontano sfide quando si tratta di sistemi complessi che coinvolgono numerosi parametri di processo e dati sperimentali limitati, che è comune nello sviluppo di farmaci. I modelli meccanicistici o ibridi risolvono alcuni di questi problemi incorporando conoscenze di processo precedenti sotto forma di leggi biologiche e fisiche. 4 Quindi, mentre i modelli classici basati sui dati fungono da utile punto di partenza, riteniamo che l'integrazione della conoscenza meccanicistica attraverso approcci ibridi migliori il potere predittivo e faciliti una migliore ottimizzazione del processo nei bioreattori.
Abbiamo sviluppato un modello ibrido che integra conoscenze meccanicistiche, come i tassi di consumo di nutrienti e le vie metaboliche, con componenti di apprendimento automatico basati sui dati che catturano aspetti complessi o poco compresi. La parte meccanicistica fornisce una solida base di conoscenze pregresse sui processi, mentre la componente di apprendimento automatico modella comportamenti sconosciuti. I modelli ibridi offrono una maggiore robustezza nell'estrapolazione e possono catturare con precisione comportamenti dinamici come i cambiamenti nei tassi di crescita cellulare e nell'assorbimento dei nutrienti in condizioni variabili.  Sebbene più complessi da sviluppare, possono ridurre la necessità di sperimentazioni approfondite e consentire il riutilizzo dei modelli esistenti tra i prodotti. Eccellono anche nell'ottimizzazione in tempo reale, nello scale-up predittivo e nella conformità normativa, migliorando la comprensione del processo durante la caratterizzazione (FDA Stage 1) e supportando lo sviluppo di limiti di controllo in tempo reale per lotti specifici (FDA Stage 3).

Il nostro modello ibrido prende i parametri di processo come input e prevede variabili biologiche come tassi, rese e livelli di plateau per la biomassa e la formazione del prodotto. Questi parametri previsti vengono quindi inseriti in un sistema di equazioni differenziali ordinarie (ODE), che calcolano le risposte dinamiche del bioreattore nel tempo. La Figura 2 illustra i passaggi chiave sia dell'approccio classico puramente basato sui dati che dell'approccio ibrido.
Figura 2: Confronto tra modelli basati sui dati e ibridi
Per valutare entrambi gli approcci, abbiamo simulato 29 esperimenti che variano la temperatura (20-40 °C) e la velocità di agitazione (150-350 giri/min), catturando diverse dinamiche di crescita della biomassa, formazione del prodotto e consumo di glucosio nel tempo (Figura 3). Il modello è stato addestrato su 21 esperimenti. Le prestazioni sono state quindi testate su due serie di quattro esperimenti non visti: un set all'interno del dominio di addestramento (test1) per valutare la capacità di interpolazione e un altro al di fuori di questo dominio (test2) per valutare l'estrapolazione e la generalizzazione.

Immagine dell'articolo della risorsa sui gemelli digitali

Figura 3: Dominio sperimentale dei dati utilizzati per addestrare e testare i modelli. Il set di dati del test 1 si trova all'interno del dominio sperimentale del set di dati di addestramento, mentre il set di dati del test 2 si trova all'esterno.
La Figura 4 e la Figura 5 mostrano le previsioni sui due set di dati di test. Possiamo vedere che il modello ibrido (verde) si adatta ai dati (punti rossi) meglio dell'approccio classico (blu). Questo è mostrato anche nella Figura 6 che mostra l'errore quadratico medio (RMSE), una misura comune dell'accuratezza della previsione che quantifica la differenza media tra i valori previsti e osservati. Più piccolo è l'RMSE, migliori sono le prestazioni predittive del modello. Il modello ibrido raggiunge un RMSE costantemente inferiore rispetto all'approccio classico in entrambi i domini. Ciò indica che il modello ibrido generalizza meglio e fa previsioni più accurate, anche quando estrapola oltre le condizioni di addestramento.
Immagine dell'articolo della risorsa sui gemelli digitali

Figura 4: Dati (rosso) e previsioni con il modello ibrido (verde) e l'approccio classico (blu) per il set di dati all'interno del dominio sperimentale.
Immagine dell'articolo della risorsa sui gemelli digitali

Figura 5: Dati (rosso) e previsioni con il modello ibrido (verde) e l'approccio classico (blu) per il set di dati del dominio sperimentale esterno.
Immagine dell'articolo della risorsa sui gemelli digitali

Figura 6: Confronto predittivo delle prestazioni degli approcci di modellazione classica e ibrida misurati mediante RMSE (errore quadratico medio). Valori RMSE più bassi indicano una migliore precisione predittiva.

Come mostra il nostro caso di studio, i modelli ibridi non solo rientrano nel dominio dell'addestramento, ma dimostrano anche una robustezza molto maggiore nell'estrapolazione di nuove condizioni, una caratteristica essenziale per la produzione di farmaci nel mondo reale. Ciò mostra chiaramente la superiorità di tale modellazione rispetto agli approcci classici comunemente usati.

Storicamente, la creazione e l'adattamento di modelli ibridi richiedevano conoscenze specialistiche in matematica e scienza dei dati, il che ne limitava l'accessibilità in molte aziende. Tuttavia, questo panorama sta cambiando con l'avvento di applicazioni user-friendly come TwinLab, mostrate nella Figura 7. Abbiamo creato questa applicazione per consentire agli utenti senza competenze tecniche approfondite di esplorare facilmente diversi scenari di processo e prevedere i risultati. Tali strumenti rendono la modellazione ibrida avanzata pratica e attuabile, supportando scienziati e ingegneri nello sviluppo di bioprocessi integrando le conoscenze meccanicistiche con intuizioni basate sui dati attraverso interfacce intuitive.
Figura 7: Applicazione di simulazione che consente l'analisi degli scenari variando i parametri chiave del processo, tra cui velocità di agitazione, temperatura, velocità di diluizione, concentrazione del substrato nel mangime e concentrazione iniziale del seme. Questi input vengono elaborati da un modello ibrido che prevede i corsi temporali della densità cellulare vitale (VCD), della formazione del prodotto e del consumo di substrato.
Anche con un modello ibrido, l'accuratezza della previsione non è perfetta e richiedere 21 campioni per l'addestramento può rappresentare un ostacolo, soprattutto per le piccole aziende biotecnologiche che non possono generare facilmente questo volume di dati di alta qualità. Diversi approcci possono aiutare ad affrontare questa limitazione.

Un approccio consiste nell'applicare una progettazione intelligente degli esperimenti. Da un lato, la copertura dello spazio dei parametri di processo rimane molto importante, mentre i progetti ottimali per tali modelli meccanicistici aiutano a garantire che venga fornito un supporto di dati sufficiente dove le informazioni sono più rilevanti. D'altra parte, l'ottimizzazione bayesiana meccanicamente informata potrebbe essere un primo passo per coprire rapidamente il dominio sperimentale, mentre rimane cautela rispetto alla corretta copertura del dominio.

Un'altra soluzione è l'uso dell'Intensified Design of Experiments (iDoE), che introduce cambiamenti deliberati nei parametri di processo all'interno di un singolo esperimento (ad esempio l'esecuzione del bioreattore). Questa strategia condensa efficacemente più combinazioni DoE convenzionali in un numero inferiore di esecuzioni sperimentali, massimizzando così le informazioni ottenute per esperimento.

Infine, una strategia più ambiziosa ma molto promettente prevede l'utilizzo di gemelli digitali pre-addestrati. In questo scenario, il modello ibrido verrebbe prima pre-addestrato su migliaia di set di dati sperimentali aggregati da varie fonti, in modo simile a come vengono sviluppati modelli linguistici di grandi dimensioni come ChatGPT. Gli utenti potrebbero quindi utilizzare e migliorare il modello utilizzando i propri dati di addestramento limitati, migliorandone continuamente le prestazioni per tutti i soggetti coinvolti, a vantaggio sia degli utenti che dei pazienti. Per proteggere i dati proprietari, la piattaforma implementerebbe l'apprendimento federato, un approccio di tutela della privacy che consente agli utenti di migliorare il gemello digitale in modo collaborativo. Questo metodo garantisce che i dati sperimentali individuali rimangano riservati e non vengano mai condivisi direttamente tra gli utenti, contribuendo comunque a un modello collettivo in continuo miglioramento.

 Continueremo a esplorare il potenziale del gemello digitale e delle metodologie statistiche per supportare previsioni migliori, compreso l'uso di iDoE e progetti ottimali bayesiani. 


Nota: I risultati sono stati generati con l'assistenza di BioWin ASBL e il sostegno finanziario della Regione, in conformità con le disposizioni della Convenzione di sovvenzione (Convenzione 8881 ATMP Thérapie cellulaire).
*Le fonti continuano di seguito

Informazioni sull'autore:

Thomas de Marchin è Direttore associato di statistica e scienza dei dati presso Cencora, dove applica metodologie statistiche avanzate e algoritmi di apprendimento automatico per ottimizzare la scoperta di farmaci e l'efficienza della produzione. Con una profonda esperienza nella conformità normativa, in particolare negli standard FDA e GMP, colma il divario tra approcci analitici complessi e applicazioni farmaceutiche pratiche.


Dichiarazione di non responsabilità:
Le informazioni fornite in questo articolo non costituiscono una consulenza legale. Cencora, Inc. incoraggia vivamente i lettori a rivedere le informazioni disponibili relative agli argomenti discussi e a fare affidamento sulla propria esperienza e competenza nel prendere decisioni correlate.

 


Mettiti in contatto con il nostro team

Il nostro team di esperti di valore leader si dedica a trasformare evidenze, approfondimenti sulle politiche e informazioni di mercato in efficaci strategie di accesso al mercato globale. Lascia che ti aiutiamo a navigare con sicurezza nel complesso panorama sanitario odierno. Contattaci per scoprire come possiamo supportare i tuoi obiettivi.

Fonti:


1. Gemelli digitali: Dalla medicina personalizzata alla salute pubblica di precisione, J Pers Med., luglio 2021. https://pubmed.ncbi.nlm.nih.gov/34442389/
2. Rapporto di ricerca sul settore dei bioreattori di perfusione 2025, ricerca e mercati. https://www.globenewswire.com/news-release/2025/10/09/3164326/28124/en/Perfusion-Bioreactors-Industry-Research-Report-2025-Biopharmaceutical-Growth-Drives-Demand-Amid-Cell-Culture-Advancements-Global-Forecast-to-2032.html
3. Modelli predittivi per lo sviluppo di colture cellulari di mammifero a monte - Una revisione, Digital Chemical Engineering, marzo 2024. https://www.sciencedirect.com/science/article/pii/S2772508123000558
4. Modellazione semiparametrica ibrida nell'ingegneria dei sistemi di processo: Passato, presente e futuro, Computers & Chemical Engineering, gennaio 2014. https://www.sciencedirect.com/science/article/pii/S0098135413002639

 

Risorse correlate

Articolo

Mentre l'adozione dell'eCTD 4.0 avanza, una nuova linea guida ICH la mette alla prova

Articolo

Nuovi percorsi verso il valore del prodotto: Strategie per ottimizzare il portafoglio di prodotti maturi

Articolo

Preparazione per il foglietto illustrativo elettronico del paziente in Europa